O engenheiro de IA Akshay Pachaar publicou no X, em 10 de maio, um diagrama completo da arquitetura do Claude Code, destacando que todo o sistema é decomposto em 6 camadas e que “o modelo é apenas um dos nós dentro de um loop”. A postagem de Pachaar cita seu ensaio longo de 6 de abril, “The Anatomy of an Agent Harness”, e o ponto principal é: o motivo de o Claude Code “parecer mágica” não é o próprio modelo, mas o design meticuloso do harness.
6 camadas de arquitetura: o modelo é apenas um nó
Pachaar organizou o Claude Code em 6 camadas:
Input Layer(camada de entrada):responsável por gerenciamento de session, controle de permissões e configurar níveis de confiança via YAML. Qualquer instrução que entra no modelo passa primeiro por esta camada.
Knowledge Layer(camada de conhecimento):inclui skill registry, context compressor (compactação em 3 camadas, gatilho por limiar de 92%), task graph e armazenamento de memórias entre sessões. Aqui é onde existe a “inteligência” do harness, fora dos pesos do modelo.
Execution Layer(camada de execução):dispara chamadas de ferramentas via typed registry; cada ferramenta tem um handler — bash, read, write, grep, glob, revert. O runtime de streaming oferece suporte a execução paralela; o prompt cache reaproveita prefixos estáveis, reduzindo os custos para 10%.
Integration Layer(camada de integração):o MCP runtime conecta servidores externos (filesystem, git e ferramentas personalizadas). As ferramentas se registram por dentro, e a memória é gravada por fora em agent_memory.md.
Multi-Agent Layer(camada de multiagentes):inclui subagent spawner, teammate mailboxes com comunicação via redis pub/sub, protocolo de máquina de estados finitos (IDLE→REQUEST→WAIT→RESPOND), autonomous board com travas atômicas, e isolamento por worktree (cada tarefa em um branch git independente).
Observability Layer(camada de observabilidade):envolve a barra de eventos que reúne acontecimentos de todas as camadas e lifecycle hooks; o executador em segundo plano roda de forma não bloqueante com daemon thread.
No centro está o “master agent loop” (loop do agente mestre): percepção → ação → observação. A própria Anthropic posiciona esse loop como um “dumb loop” (loop burro) — toda a inteligência está na inferência do modelo; o harness só cuida do escalonamento.
Design-chave: context compressor e isolamento por worktree
Alguns detalhes de design que valem atenção:
Context compressor em 3 camadas, limiar de 92%: quando o contexto se aproxima de 92% da capacidade, ele dispara resumo e compressão, preservando decisões de arquitetura e bugs não resolvidos, e descartando saídas repetidas de ferramentas. Isso ecoa as “diretrizes de context engineering” publicadas pela Anthropic: encontrar o menor conjunto de tokens com maior sinal, maximizando a probabilidade de atingir os objetivos.
Isolamento por worktree: cada subagent trabalha em um git worktree independente e em um branch independente; ao mesclar, realiza detecção de conflitos. Essa arquitetura torna possível que vários agentes modifiquem em paralelo a mesma base de código sem se atrapalharem. Entre os três modos de execução de subagentes do Claude Code — “Fork / Teammate / Worktree” — o Worktree é o nível de isolamento mais forte.
Prompt cache com custo de 10%: por meio de cache de prefixos estáveis (system prompt, definições de ferramentas, CLAUDE.md), chamadas repetidas com o mesmo prefixo pagam apenas 10% do custo padrão de tokens. Esse é o ponto-chave para manter os custos sob controle em tarefas de longas sessões.
Por que essa análise repercutiu na comunidade
A postagem de Pachaar recebeu 522 curtidas, 115 retweets, e na seção de comentários apareceram feedbacks como “eu achava que era só um CLI”, “achei que o Claude Code era igual a model + acesso ao terminal, não sabia que a multi-agent layer tinha tantas coisas rodando”, entre outros. Isso reflete que a maioria dos desenvolvedores ainda entende o Claude Code como “o Claude API embrulhado em uma camada de CLI”, subestimando a complexidade do harness.
Pachaar cita como argumento central uma frase de Vivek Trivedy, da LangChain: “se você não é o modelo, então você é harness”. O teste da LangChain no TerminalBench 2.0 — com os mesmos pesos do modelo, alterando apenas o harness externo — comprovou: o ranking saiu da posição 30 e subiu para o 5.
Para leitores da abmedia, esta análise oferece um ponto de referência concreto: quando você vê diferenças entre produtos de agentes como Claude Code, Codex, Gemini Code Assist, a maioria dessas diferenças não está no próprio modelo, e sim no design do harness — estratégias de gerenciamento de contexto, escopo de ferramentas, ciclos de validação e modos de colaboração entre múltiplos agentes. A versão do modelo quando sobe, e as escolhas do harness, determinam o nível da experiência do produto.
Este artigo com a análise de Akshay sobre a arquitetura do Claude Code em 6 camadas: o modelo é apenas um nó no loop. Foi publicado pela primeira vez em Cadeia de Notícias ABMedia.
Related Articles
Augustus, apoiado por Peter Thiel, recebe aprovação da OCC para banco de IA e stablecoin
B.AI anuncia parceria estratégica com CoinAnk para aprimorar as capacidades de negociação com agentes de IA
Alibaba lança agente de atendimento ao cliente com IA da Xiaomi, “IA+Humano”; taxa de conversão supera o atendimento puramente humano pela primeira vez
Agente de IA conclui tarefa de recompensa e ganha US$ 16,88 após queimar US$ 2.000 em custos de computação
Executivos da Google Cloud e da PayPal: os negócios de agentes de IA vão rodar em uma rota de pagamentos cripto
Google Cloud e PayPal lançam o protocolo AP2 com mais de 120 parceiros; executivos dizem que agentes de IA vão operar nas redes de pagamentos em cripto