Como Criar Agentes de IA de Longa Duração com Claude

Ashley Innocent

Ashley Innocent

9 abril 2026

Como Criar Agentes de IA de Longa Duração com Claude

Apidog para empresas

Implantação local

SSO & RBAC

Conforme SOC 2

Explorar Apidog Enterprise

TL;DR

Claude Managed Agents é o novo tempo de execução hospedado da Anthropic para agentes em produção. Ele oferece execução em sandbox, sessões de longa duração, permissões com escopo, rastreamento e coordenação multiagente opcional, sem forçar sua equipe a construir essa infraestrutura do zero. Se seu agente precisa chamar ferramentas internas, APIs de terceiros ou fluxos de trabalho longos, o Apidog ajuda você a validar esses contratos de ferramentas antes de permitir que um agente toque em sistemas reais.

Introdução

Claude Managed Agents aborda uma das maiores razões pelas quais os projetos de agentes estagnam: o tempo de execução é mais difícil de implementar do que o prompt. A Anthropic agora oferece uma maneira hospedada de executar agentes de longa duração com sandboxing, permissões, rastreamento e persistência de sessão integrados, para que as equipes possam gastar menos tempo construindo a infraestrutura e mais tempo entregando fluxos de trabalho úteis.

💡
Isso muda a conversa para as equipes de API. A parte difícil não é mais se Claude consegue raciocinar sobre uma tarefa. A parte difícil é se o agente pode chamar as ferramentas certas com segurança, se recuperar de respostas ruins e continuar trabalhando quando uma tarefa dura mais do que uma solicitação de bate-papo normal.
botão

Se você planeja expor APIs internas ou endpoints de ferramentas a um agente, deve testar essa superfície antes do lançamento. O Apidog oferece uma maneira direta de simular endpoints de ferramentas, validar o esquema JSON, encadear cenários de teste em várias etapas e executar verificações de regressão na CI com o Apidog CLI. Esse é um ponto de partida mais seguro do que dar a um novo agente hospedado acesso ao vivo e descobrir bugs de contrato em produção.

Por que agentes de produção ainda são difíceis de implementar

Um agente de demonstração de fim de semana é fácil. Um agente de produção não é.

Depois que você passa de uma única solicitação e resposta, as partes difíceis aparecem rapidamente:

É por isso que muitas equipes ficam presas entre o protótipo e o lançamento. A parte do modelo continua melhorando. A parte operacional ainda consome o cronograma.

Esse padrão é familiar em produtos de agentes. Equipes que constroem assistentes de codificação, agentes de pesquisa, ferramentas de preparação de reuniões e automação de fluxo de trabalho esbarram no mesmo gargalo: o tempo de execução se torna um produto próprio. A Anthropic está tentando colapsar essa camada em um serviço gerenciado.

O que o Claude Managed Agents inclui

De acordo com a publicação de lançamento da Anthropic, Claude Managed Agents combina um sistema de orquestração ajustado ao Claude com infraestrutura de produção hospedada. Na prática, o lançamento apresenta cinco recursos importantes para as equipes de API.

1. Tempo de execução de agente hospedado

Você define o trabalho, o acesso às ferramentas e as salvaguardas. A Anthropic executa o loop em sua própria infraestrutura. Isso remove uma grande quantidade de trabalho de backend personalizado para equipes que, de outra forma, construiriam uma fila, um worker em sandbox, uma camada de sessão e um controlador de execução.

Este é o maior valor do lançamento. A maioria das equipes já pode chamar um modelo. O que elas não têm é um tempo de execução limpo para o trabalho real.

2. Sessões de longa duração

A Anthropic afirma que as sessões podem durar horas e persistir saídas e progresso mesmo que o cliente se desconecte. Isso é importante para tarefas de pesquisa, geração de arquivos grandes, planejamento em várias etapas ou trabalho operacional em segundo plano que não se encaixa em uma breve solicitação interativa.

Se seu agente escreve relatórios, audita bases de código, processa documentos ou reúne entregáveis de vários sistemas, as sessões de longa duração removem uma grande restrição. Você para de projetar em torno de janelas de bate-papo curtas e começa a projetar em torno de trabalho concluído.3. Execução em sandbox e governança

O lançamento enfatiza o sandboxing seguro, autenticação, identidade e permissões com escopo. Isso não é um detalhe secundário. É a diferença entre uma demonstração interessante e um sistema pronto para empresas.

Um agente que pode abrir uma pull request, gerar uma planilha ou interagir com dados financeiros nunca deve ter acesso amplo por padrão. A governança hospedada permite restringir o que o tempo de execução pode fazer e oferece às equipes de segurança uma superfície de revisão mais clara.

4. Rastreamento e solução de problemas integrados

A Anthropic afirma que chamadas de ferramentas, decisões, análises e modos de falha são visíveis no Claude Console. Um bom rastreamento encurta a lacuna entre "algo falhou" e "aqui está a solicitação exata, a saída da ferramenta e o branch que a causou".

Isso é especialmente útil ao depurar ferramentas em vez de prompts. Em muitos sistemas de agentes, o elo mais fraco é o contrato da API em torno da ferramenta, não o próprio modelo.

5. Coordenação multiagente, em prévia de pesquisa

A Anthropic também anunciou a coordenação multiagente, onde os agentes podem direcionar outros agentes para paralelizar o trabalho. Isso ainda está em prévia de pesquisa, então não é a parte do lançamento em que eu centraria o artigo. Ainda assim, sinaliza para onde a plataforma está indo: de trabalhadores únicos para equipes orquestradas de agentes.

Como isso muda a arquitetura de um produto de agente

Antes dos Managed Agents, uma equipe típica tinha duas escolhas.

Opção A: Construa o tempo de execução você mesmo

Isso lhe dá controle máximo. Também significa que você é responsável por:

Esse caminho ainda faz sentido quando você precisa de infraestrutura incomum, requisitos rigorosos de hospedagem interna ou lógica de orquestração profundamente personalizada.

Opção B: Use um tempo de execução gerenciado

Isso troca algum controle por velocidade. O tempo de execução já existe, e sua equipe pode gastar tempo no design da tarefa, UX e qualidade da ferramenta em vez de construir a infraestrutura.

É por isso que a Anthropic enquadra os Managed Agents como uma maneira de chegar à produção 10 vezes mais rápido. A publicação de lançamento também afirma que testes internos na geração de arquivos estruturados mostraram ganhos de sucesso na tarefa de até 10 pontos em relação a um loop de prompt padrão, com os maiores ganhos em problemas mais difíceis.

A mudança importante é esta: a infraestrutura de agente hospedada está se tornando uma categoria de produto, não um projeto secundário em sua pilha.

Claude Managed Agents vs infraestrutura de agente DIY

Área de decisão Claude Managed Agents Tempo de execução DIY
Tempo para o primeiro lançamento em produção Rápido, porque o tempo de execução já está hospedado Mais lento, porque você constrói o tempo de execução primeiro
Sandboxing e governança Integrados Você é responsável pelo design completo
Sessões de longa duração Integradas Você constrói e mantém o estado da sessão
Rastreamento Disponível no Claude Console Você constrói sua própria camada de observabilidade
Flexibilidade Boa para o modelo e padrão de tempo de execução suportados Flexibilidade máxima
Carga operacional contínua Menor Maior
Melhor adequação Equipes que querem lançar produtos de agente rapidamente Equipes com infraestrutura incomum ou necessidades rigorosas de tempo de execução personalizado

Aqui está a regra prática.

Escolha Managed Agents se sua equipe deseja lançar um produto de agente neste trimestre e seu diferencial principal é o fluxo de trabalho, a UI ou as ferramentas proprietárias por trás dele.

Escolha DIY se o próprio tempo de execução faz parte do seu diferencial competitivo, você precisa de controle total sobre hospedagem e orquestração, ou seu modelo de segurança exige um tratamento personalizado mais aprofundado do que um serviço gerenciado pode oferecer.

Precificação e trade-offs que você deve entender

Os Managed Agents usam a precificação padrão de tokens da Plataforma Claude mais US$ 0,08 por hora de sessão ativa. Isso faz sentido para agentes que estão realizando trabalho real ao longo do tempo, mas muda a maneira como você deve pensar sobre o custo.

Com um fluxo de trabalho de API de chat normal, o custo vem principalmente dos tokens. Com um tempo de execução gerenciado, o custo vem dos tokens mais o tempo de execução ativo decorrido. Isso significa que você deve projetar agentes para concluir o trabalho de forma limpa, falhar rapidamente em entradas ruins e evitar loops sem sentido.

Três perguntas importam antes de você adotá-lo:

  1. Com que frequência uma sessão será executada por minutos versus horas?
  2. Quanto valor uma execução concluída cria para o usuário?
  3. Quais tarefas devem permanecer síncronas e quais devem ser movidas para execução em segundo plano?

Se a resposta for "nosso agente realiza principalmente chamadas curtas e determinísticas", uma integração de API normal ainda pode ser suficiente.

Se a resposta for "nosso agente pesquisa, escreve, aplica patches, coordena ferramentas e entrega um produto posteriormente", o tempo de execução gerenciado começa a parecer muito mais atraente.

Como testar APIs de ferramentas de agente com Apidog antes do lançamento

É aqui que o artigo precisa ser específico.

O ponto fraco em muitos lançamentos de agentes não é o modelo. É a camada de ferramentas. Se seu agente pode chamar search_customers, create_invoice, open_pr, ou send_slack_message, cada uma dessas ferramentas é um contrato de API. Você precisa saber o que acontece quando o payload está malformado, o esquema se desvia, um campo obrigatório desaparece ou o token de autenticação tem o escopo errado.

O Apidog se encaixa bem neste fluxo de trabalho porque você pode modelar os contratos das ferramentas antes que o agente chegue à produção.

Use Smart Mock para configurar endpoints de ferramentas precocemente

O Smart Mock gera respostas realistas diretamente da sua especificação de API e respeita as restrições do JSON Schema. Isso oferece à sua equipe uma maneira rápida de configurar endpoints de ferramentas falsos enquanto o backend real ainda está mudando.

Para o trabalho de agente, isso é importante porque você pode testar o planejamento e a seleção de ferramentas antes que todos os serviços downstream estejam prontos. Se seu agente gerenciado espera um enum ticket_priority, account_id ou status, o Smart Mock pode retornar dados que correspondem ao esquema em vez de placeholders escritos à mão que ocultam bugs.

Veja também Teste de API Sem Postman em 2026 se você estiver padronizando este fluxo de trabalho em toda a equipe.

Crie Cenários de Teste em várias etapas para fluxos de trabalho de agentes

Os Cenários de Teste do Apidog são úteis quando uma chamada de ferramenta alimenta a próxima. A documentação descreve suporte para execução sequencial, passagem de dados entre solicitações, controle de fluxo, dados de teste predefinidos e integração CI/CD.

Isso se alinha perfeitamente com os sistemas de agentes.

Um fluxo de validação realista pode ser assim:

  1. Simular ou chamar POST /tasks
  2. Extrair o task_id retornado
  3. Chamar GET /tasks/{task_id}
  4. Verificar transições de status
  5. Acionar um branch de erro com credenciais inválidas
  6. Verificar se o payload de erro para o agente permanece dentro do contrato

Esse tipo de cenário detecta bugs de ferramentas antes que o tempo de execução do agente precise se recuperar deles em produção.

Valide o desvio de contrato antes que ele quebre o agente

Agentes são sensíveis ao desvio de esquema. Um campo renomeado, um enum mais flexível ou uma propriedade aninhada ausente podem quebrar uma cadeia de ferramentas de maneiras que parecem falhas de raciocínio.

Use o Apidog para definir rigidamente as formas de solicitação e resposta com OpenAPI e JSON Schema, e então execute verificações baseadas em cenários quando o backend mudar. Se sua equipe usa definições de ferramentas geradas, isso é ainda mais importante porque o agente confiará na especificação que você lhe der.

Adicione verificações CLI à CI para cobertura de regressão

O Apidog CLI pode executar suítes de teste a partir da linha de comando e gerar relatórios, incluindo relatórios HTML no diretório apidog-reports/ gerado. Isso o torna uma boa opção para verificações pré-merge ou pré-deploy em ferramentas de agente.

Uma política simples é suficiente:

Ao fazer isso, seu agente gerenciado entra em produção com uma superfície de ferramenta mais limpa.

Um padrão de arquitetura simples para começar

Requisição do usuário
  -> Sessão do Claude Managed Agent
  -> seleção de ferramenta
  -> APIs internas e serviços de terceiros
  -> artefato ou ação resultante
  -> revisão de rastreamento no Claude Console

Antes do lançamento:
  Especificação Apidog -> Smart Mock -> Cenários de Teste -> Regressão CLI na CI

Essa divisão é saudável.

Deixe o Claude Managed Agents lidar com preocupações de tempo de execução, como gerenciamento de sessão, execução hospedada e orquestração. Deixe o Apidog lidar com o design de contratos de API, mocks, testes e verificações de regressão em torno das ferramentas das quais seu agente depende.

Isso mantém a camada do modelo e a camada de qualidade da API separadas, o que é exatamente o que a maioria das equipes precisa.

Quando este lançamento mais importa

Claude Managed Agents é mais interessante para cinco grupos:

Se sua equipe ainda está provando o caso de uso, comece com um fluxo de trabalho restrito e uma pequena superfície de ferramentas.

Se o caso de uso já funciona e a infraestrutura é o gargalo, este lançamento merece atenção séria.

Conclusão

Claude Managed Agents não é apenas mais um recurso de modelo. É a tentativa da Anthropic de produtoar a parte complicada da entrega de agentes: execução hospedada, persistência, governança e rastreamento.

É por isso que este lançamento importa. Ele muda a pergunta de construção de "como criamos um tempo de execução de agente" para "quais fluxos de trabalho merecem um agente e quão seguras são as ferramentas por trás dele?"

Essa segunda pergunta é onde o Apidog se encaixa. Antes de expor uma API interna a um agente hospedado de longa duração, modele o contrato, simule as respostas, teste os caminhos de falha e adicione cobertura de regressão na CI. Esse trabalho dá ao agente uma superfície mais limpa para operar e oferece à sua equipe menos surpresas após o lançamento.

botão

FAQ

O que é Claude Managed Agents?

Claude Managed Agents é o tempo de execução hospedado da Anthropic para agentes baseados em nuvem na Plataforma Claude. Ele inclui execução em sandbox, sessões de longa duração, rastreamento, permissões com escopo e orquestração hospedada.

Claude Managed Agents está disponível agora?

Sim. A Anthropic anunciou-o como um beta público em 8 de abril de 2026. Alguns recursos, como coordenação multiagente e loops de autoavaliação, ainda estão em prévia de pesquisa.

Como o Claude Managed Agents é precificado?

A Anthropic afirma que a precificação padrão de tokens da Plataforma Claude se aplica, mais US$ 0,08 por hora de sessão ativa.

Quando você deve usar Managed Agents em vez de construir seu próprio tempo de execução?

Use Managed Agents quando a velocidade para produção for mais importante do que uma profunda personalização do tempo de execução. Se sua equipe precisa de hospedagem incomum, controle interno rigoroso ou orquestração personalizada que uma plataforma gerenciada não pode suportar, o DIY ainda pode ser a melhor opção.

Por que as equipes de API devem testar as ferramentas do agente separadamente?

Porque muitas falhas de agentes vêm de contratos de ferramentas quebrados, problemas de autenticação ou desvio de esquema, em vez de raciocínio deficiente. Testar as ferramentas separadamente ajuda a identificar essas falhas antes que elas atinjam o tempo de execução.

Como o Apidog pode ajudar no teste de ferramentas de agente?

O Apidog ajuda você a definir o contrato da ferramenta, gerar respostas simuladas a partir do esquema com o Smart Mock, encadear validações em várias etapas com os Cenários de Teste e executar verificações de regressão na CI com o Apidog CLI.

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs

Como Criar Agentes de IA de Longa Duração com Claude