Akshay analisa a arquitetura em 6 camadas do Claude Code: o modelo é apenas um nó dentro de um loop

ChainNewsAbmedia

O engenheiro de IA Akshay Pachaar publicou no X, em 10 de maio, um diagrama completo da arquitetura do Claude Code, destacando que todo o sistema é decomposto em 6 camadas e que “o modelo é apenas um dos nós dentro de um loop”. A postagem de Pachaar cita seu ensaio longo de 6 de abril, “The Anatomy of an Agent Harness”, e o ponto principal é: o motivo de o Claude Code “parecer mágica” não é o próprio modelo, mas o design meticuloso do harness.

6 camadas de arquitetura: o modelo é apenas um nó

Pachaar organizou o Claude Code em 6 camadas:

Input Layer(camada de entrada):responsável por gerenciamento de session, controle de permissões e configurar níveis de confiança via YAML. Qualquer instrução que entra no modelo passa primeiro por esta camada.

Knowledge Layer(camada de conhecimento):inclui skill registry, context compressor (compactação em 3 camadas, gatilho por limiar de 92%), task graph e armazenamento de memórias entre sessões. Aqui é onde existe a “inteligência” do harness, fora dos pesos do modelo.

Execution Layer(camada de execução):dispara chamadas de ferramentas via typed registry; cada ferramenta tem um handler — bash, read, write, grep, glob, revert. O runtime de streaming oferece suporte a execução paralela; o prompt cache reaproveita prefixos estáveis, reduzindo os custos para 10%.

Integration Layer(camada de integração):o MCP runtime conecta servidores externos (filesystem, git e ferramentas personalizadas). As ferramentas se registram por dentro, e a memória é gravada por fora em agent_memory.md.

Multi-Agent Layer(camada de multiagentes):inclui subagent spawner, teammate mailboxes com comunicação via redis pub/sub, protocolo de máquina de estados finitos (IDLE→REQUEST→WAIT→RESPOND), autonomous board com travas atômicas, e isolamento por worktree (cada tarefa em um branch git independente).

Observability Layer(camada de observabilidade):envolve a barra de eventos que reúne acontecimentos de todas as camadas e lifecycle hooks; o executador em segundo plano roda de forma não bloqueante com daemon thread.

No centro está o “master agent loop” (loop do agente mestre): percepção → ação → observação. A própria Anthropic posiciona esse loop como um “dumb loop” (loop burro) — toda a inteligência está na inferência do modelo; o harness só cuida do escalonamento.

Design-chave: context compressor e isolamento por worktree

Alguns detalhes de design que valem atenção:

Context compressor em 3 camadas, limiar de 92%: quando o contexto se aproxima de 92% da capacidade, ele dispara resumo e compressão, preservando decisões de arquitetura e bugs não resolvidos, e descartando saídas repetidas de ferramentas. Isso ecoa as “diretrizes de context engineering” publicadas pela Anthropic: encontrar o menor conjunto de tokens com maior sinal, maximizando a probabilidade de atingir os objetivos.

Isolamento por worktree: cada subagent trabalha em um git worktree independente e em um branch independente; ao mesclar, realiza detecção de conflitos. Essa arquitetura torna possível que vários agentes modifiquem em paralelo a mesma base de código sem se atrapalharem. Entre os três modos de execução de subagentes do Claude Code — “Fork / Teammate / Worktree” — o Worktree é o nível de isolamento mais forte.

Prompt cache com custo de 10%: por meio de cache de prefixos estáveis (system prompt, definições de ferramentas, CLAUDE.md), chamadas repetidas com o mesmo prefixo pagam apenas 10% do custo padrão de tokens. Esse é o ponto-chave para manter os custos sob controle em tarefas de longas sessões.

Por que essa análise repercutiu na comunidade

A postagem de Pachaar recebeu 522 curtidas, 115 retweets, e na seção de comentários apareceram feedbacks como “eu achava que era só um CLI”, “achei que o Claude Code era igual a model + acesso ao terminal, não sabia que a multi-agent layer tinha tantas coisas rodando”, entre outros. Isso reflete que a maioria dos desenvolvedores ainda entende o Claude Code como “o Claude API embrulhado em uma camada de CLI”, subestimando a complexidade do harness.

Pachaar cita como argumento central uma frase de Vivek Trivedy, da LangChain: “se você não é o modelo, então você é harness”. O teste da LangChain no TerminalBench 2.0 — com os mesmos pesos do modelo, alterando apenas o harness externo — comprovou: o ranking saiu da posição 30 e subiu para o 5.

Para leitores da abmedia, esta análise oferece um ponto de referência concreto: quando você vê diferenças entre produtos de agentes como Claude Code, Codex, Gemini Code Assist, a maioria dessas diferenças não está no próprio modelo, e sim no design do harness — estratégias de gerenciamento de contexto, escopo de ferramentas, ciclos de validação e modos de colaboração entre múltiplos agentes. A versão do modelo quando sobe, e as escolhas do harness, determinam o nível da experiência do produto.

Este artigo com a análise de Akshay sobre a arquitetura do Claude Code em 6 camadas: o modelo é apenas um nó no loop. Foi publicado pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Augustus, apoiado por Peter Thiel, recebe aprovação da OCC para banco de IA e stablecoin

A startup de pagamentos Augustus recebeu aprovação condicional do U.S. Office of the Comptroller of the Currency (OCC) para criar um banco nacional voltado para pagamentos baseados em IA e stablecoins. A aprovação permite que a Augustus expanda suas operações bancárias europeias existentes para o mercado dos EUA. O proposto Augustus National Bank foi projetado como um banco de compensação para a era da IA, preparado para interagir diretamente com agentes de máquina em vez de sistemas tradicionai

GateNews2h atrás

B.AI anuncia parceria estratégica com CoinAnk para aprimorar as capacidades de negociação com agentes de IA

De acordo com o ChainCatcher, a infraestrutura financeira de agentes de IA B.AI anunciou uma parceria estratégica com a CoinAnk para oferecer aos agentes de IA capacidades aprimoradas de tomada de decisão baseada em dados. A colaboração vai aproveitar a análise de derivativos e a inteligência de mercado da CoinAnk para fornecer sinais de negociação para estratégias mais adaptativas e bem informadas, ajudando agentes inteligentes a tomar melhores decisões em mercados complexos.

GateNews9h atrás

Alibaba lança agente de atendimento ao cliente com IA da Xiaomi, “IA+Humano”; taxa de conversão supera o atendimento puramente humano pela primeira vez

De acordo com o Taobao e o Tmall Group da Alibaba, a empresa lançou o AI Xiaomi em 11 de maio, o primeiro agente de atendimento ao cliente do setor de e-commerce com recursos tanto de pré-venda quanto de pós-venda. Dados do mundo real mostram que, após os comerciantes integrarem o AI Xiaomi, a taxa média de transferência para humanos cai 45%, enquanto as taxas de conversão colaborativa de 'AI+human' superam o atendimento humano puro em mais de 10%, marcando a primeira vez que um serviço assistid

GateNews10h atrás

Agente de IA conclui tarefa de recompensa e ganha US$ 16,88 após queimar US$ 2.000 em custos de computação

De acordo com Beating, o desenvolvedor Chris recentemente instruiu seu agente Codex de IA a ganhar US$ 5. Em 22 horas, o agente concluiu autonomamente todo o fluxo de trabalho — identificando vulnerabilidades no código, corrigindo bugs, comunicando-se com os mantenedores e verificando o pagamento — e, no fim, conseguiu US$ 16,88. No entanto, os desenvolvedores criticaram rapidamente a lógica econômica: manter um agente de IA de alto padrão continuamente por 22 horas consumiu aproximadamente US$

GateNews14h atrás

Executivos da Google Cloud e da PayPal: os negócios de agentes de IA vão rodar em uma rota de pagamentos cripto

Na Consensus Miami, Widmann, da Google Cloud, e Zabaneh, do PayPal, afirmaram que agentes de IA não conseguem usar contas bancárias tradicionais e precisam seguir pela rota de pagamentos cripto. A Google lançou o AP2, um protocolo aberto, como base de pagamentos para agentes de IA, e fez doação para a FIDO Foundation; os agentes devem acessar por meio de fragmentação de chaves e não podem transferir fundos de forma isolada. O PYUSD, do PayPal, é visto como uma camada de pagamentos programável, e os comerciantes precisam ter um diretório legível por máquina. Embora o tráfego de agentes de IA seja comum, a proporção de comerciantes que têm um diretório legível por máquina ainda é baixa; a responsabilidade e os problemas de custódia entre múltiplas partes ainda precisam ser definidos.

MarketWhisper14h atrás

Google Cloud e PayPal lançam o protocolo AP2 com mais de 120 parceiros; executivos dizem que agentes de IA vão operar nas redes de pagamentos em cripto

De acordo com a CoinDesk, executivos da Google Cloud e da PayPal disseram hoje na Consensus que agentes de IA vão operar em rails de pagamentos cripto devido a limitações estruturais que impedem o acesso a contas bancárias tradicionais. O líder de estratégia Web3 da Google Cloud, Richard Widmann, afirmou que os rails de pagamentos cripto oferecem uma “excelente interface de pagamento legível por máquina”. A Google lançou o Agentic Payments Protocol (AP2), que já atraiu mais de 120 parceiros, inc

GateNews18h atrás
Comentário
0/400
Sem comentários