Claude Sonnet 5 e Fable 5 da Anthropic - o que muda no custo de agentes de IA - Meu Universo Nerd

Em menos de 48 horas a Anthropic fez dois movimentos grandes. No dia 30 de junho lançou o Claude Sonnet 5, um modelo médio focado em rodar agentes de forma autônoma e mais barata. No dia 1 de julho reativou globalmente o Claude Fable 5, o modelo mais capaz dela, depois que os Estados Unidos derrubaram um controle de exportação que tinha tirado o modelo do ar.

Se você usa Claude Code, Claude.ai ou a API no dia a dia, seu leque de modelos e o seu custo mudaram essa semana. Bora ver o que aconteceu e, principalmente, o que fazer com isso na prática, do jeito certo.

A semana em que a Anthropic mexeu no tabuleiro

Quem trabalha com IA no fluxo de desenvolvimento sabe que duas coisas travam projeto de agente antes dele virar produto: custo de inferência e capacidade do modelo na tarefa mais difícil. Nessa semana, a Anthropic mexeu justamente nesses dois pontos, cada um com um lançamento.

O Claude Sonnet 5 é o novo modelo médio da casa. A própria Anthropic descreve como o Sonnet mais agêntico até hoje: ele planeja, usa ferramentas como browser e terminal, e executa tarefas de vários passos sozinho, num nível que poucos meses atrás exigia modelos maiores e bem mais caros. Ele já entrou como modelo padrão dos planos Free e Pro e está disponível também para Max, Team e Enterprise, via Claude API, Claude Code e Claude Platform.

O ponto que interessa direto pro seu bolso é o preço. No período promocional, até 31 de agosto de 2026, o Sonnet 5 custa US$ 2 por milhão de tokens de entrada e US$ 10 por milhão de saída. Depois disso passa para US$ 3 e US$ 15. Para efeito de comparação, esse preço promocional coloca um agente autônomo de verdade na faixa em que dá pra um time pequeno rodar em produção sem quebrar.

Chamar o Sonnet 5 pela API não exige nada de novo no seu código. Se você já usa o SDK Java da Anthropic, é trocar o identificador do modelo:

import com.anthropic.client.AnthropicClient;
import com.anthropic.client.okhttp.AnthropicOkHttpClient;
import com.anthropic.models.messages.Message;
import com.anthropic.models.messages.MessageCreateParams;

public class ExemploSonnet5 {
    public static void main(String[] args) {
        // Le a chave de ANTHROPIC_API_KEY do ambiente. Nunca deixe a chave no codigo.
        AnthropicClient client = AnthropicOkHttpClient.fromEnv();

        MessageCreateParams params = MessageCreateParams.builder()
                .model("claude-sonnet-5")   // modelo lancado em 30/06/2026
                .maxTokens(1024)
                .addUserMessage("Resuma em uma frase o que sao virtual threads no Java 25.")
                .build();

        Message resposta = client.messages().create(params);
        System.out.println(resposta.content());
    }
}

O Fable 5 e a novela do controle de exportação

A história do Fable 5 é mais movimentada e vale entender, porque explica por que o modelo sumiu e voltou. O Fable 5 foi lançado em 9 de junho, junto do Mythos 5, como o modelo mais capaz que a Anthropic já disponibilizou de forma geral. Ele é estado da arte em quase todos os benchmarks testados, de engenharia de software a pesquisa científica, e aguenta trabalhar de forma autônoma por mais tempo que qualquer Claude anterior. Quanto mais longa e complexa a tarefa, maior a vantagem dele sobre os outros modelos da linha.

Poucos dias depois, em 12 de junho, o governo dos Estados Unidos aplicou um controle de exportação. O motivo: pesquisadores da Amazon acharam um jeito de burlar as salvaguardas do Fable 5, fazendo o modelo apontar vulnerabilidades de software. A Anthropic reagiu na hora e restringiu o acesso para verificar a nacionalidade do usuário em tempo real. O resultado prático foi que muita gente ficou sem o modelo mais forte da casa por algumas semanas.

Um detalhe importante e honesto no meio dessa história: nos testes da própria Anthropic, todos os modelos avaliados conseguiam produzir a mesma demonstração da vulnerabilidade. Ou seja, o Fable 5 não tinha uma capacidade perigosa única em relação aos concorrentes. Em 26 de junho os EUA liberaram o acesso ao Mythos 5 para organizações selecionadas, em 30 de junho retiraram o controle de exportação, e em 1 de julho começou o redeploy global.

Agora o Fable 5 volta para Claude Platform, Claude.ai, Claude Code e Claude Cowork, com AWS, Google Cloud e Microsoft Foundry voltando logo em seguida. Nos planos pagos, ele entra incluído em até 50% dos limites semanais de uso até 7 de julho, e depois passa a ser consumido via créditos de uso.

O erro comum: usar um modelo só pra tudo

Com Sonnet 5, Fable 5 e Opus 4.8 na mesa ao mesmo tempo, aparece o erro mais comum de quem trabalha com IA no dia a dia: escolher um modelo e cravar ele em toda tarefa. O resultado é sempre um dos dois: ou você paga caro num modelo grande para responder coisa simples, ou usa um modelo fraco naquilo que era difícil e o resultado não fecha.

Pensa como você monta um time. Você não coloca o arquiteto sênior para revisar vírgula de commit, nem manda o estagiário desenhar a arquitetura de um sistema crítico. Com modelo de IA é a mesma régua: cada tarefa pede um perfil.

Uma forma de organizar isso no código é isolar a escolha do modelo em um único ponto, em vez de espalhar strings pelo projeto:

// Regra pratica: escolha o modelo pela tarefa, nao um so pra tudo.
public String escolherModelo(Tarefa tarefa) {
    if (tarefa.ehCritica() && tarefa.ehLonga()) {
        return "claude-fable-5";   // o mais capaz, para o que e realmente dificil
    }
    if (tarefa.ehAgenteDoDiaADia()) {
        return "claude-sonnet-5";  // barato e agentico para o grosso do trabalho
    }
    return "claude-opus-4-8";      // meio-termo forte e fallback de seguranca
}

Um cuidado técnico com o Fable 5: nele o modo de raciocínio (thinking) fica sempre ligado. Você não passa mais um orçamento fixo de tokens de pensamento, apenas omite esse parâmetro. Além disso, requisições em áreas de alto risco (segurança ofensiva, biologia, química) são bloqueadas por um classificador e redirecionadas automaticamente para o Opus 4.8, que responde no lugar. Na prática, o Opus 4.8 virou a rede de segurança do Fable 5.

// Fable 5: o thinking e sempre ligado, entao voce NAO passa budget de tokens.
// Requisicoes bloqueadas pela seguranca caem sozinhas no Opus 4.8.
MessageCreateParams params = MessageCreateParams.builder()
        .model("claude-fable-5")     // desbloqueado globalmente em 01/07/2026
        .maxTokens(8192)
        .addUserMessage("Analise este servico e proponha um plano de refatoracao em etapas.")
        .build();

Message plano = client.messages().create(params);

A régua de modelos da Claude em julho de 2026

Para não decidir no escuro, vale ter a linha de produtos na cabeça. A tabela abaixo resume o que está em jogo agora:

ModeloContextoPreço (entrada / saída por milhão)Melhor uso
Fable 51MUS$ 10 / US$ 50As tarefas mais difíceis e mais longas
Opus 4.81MUS$ 5 / US$ 25Topo da linha Opus e rede de segurança do Fable 5
Sonnet 51M (reportado)US$ 2 / US$ 10 promo, depois US$ 3 / US$ 15Agente do dia a dia, custo baixo
Sonnet 4.61MUS$ 3 / US$ 15Geração anterior do Sonnet
Haiku 4.5200KUS$ 1 / US$ 5Tarefas simples, resposta rápida e barata

Sobre desempenho, a Anthropic posiciona o Sonnet 5 fechando a distância para o Opus 4.8 em coding agêntico e computer use, a um custo bem menor, e diz que ele supera o Opus 4.8 em knowledge work. Um número concreto que já apareceu de fora: no CursorBench, um benchmark de trabalho com código dentro do editor, o Sonnet 5 marcou 57% contra 49% do Sonnet 4.6. É um salto real na faixa média, não marketing.

O que muda na prática pro seu trabalho

O primeiro efeito é no custo de rodar agentes. Com o Sonnet 5 na faixa promocional de US$ 2 por milhão de tokens de entrada, aquele agente que lê log, abre pull request e roda teste sozinho sai da categoria de experimento caro e entra na categoria de coisa que dá pra manter ligada. Isso muda a conta de POC de agente para times pequenos, que antes esbarravam na fatura de tokens.

O segundo efeito é estratégico. Com o Fable 5 de volta e o Sonnet 5 barato, dá pra montar um fluxo em camadas: o Sonnet 5 pega o grosso do trabalho agêntico do dia a dia, o Fable 5 entra só nas tarefas mais longas e difíceis, e o Opus 4.8 fica de meio-termo e como fallback de segurança do próprio Fable 5. Você paga caro só onde precisa pagar caro.

Como Tech Leader, aprendi que decisão de custo em infraestrutura raramente é sobre o preço de uma chamada isolada, é sobre o padrão que se repete milhões de vezes. Escolher o modelo certo por tipo de tarefa é exatamente esse tipo de decisão: parece detalhe, mas no fim do mês é a diferença entre um agente que se paga e um que some do roadmap por ser caro demais.

Vale marcar as janelas: a promoção do Sonnet 5 vai até 31 de agosto, e o acesso incluído ao Fable 5 nos planos pagos, em até 50% dos limites semanais, vai até 7 de julho. Depois disso o Fable 5 passa a ser consumido por créditos de uso. Ou seja, se você quer testar o modelo mais forte sem gastar crédito, essa primeira semana é a janela.

Perguntas frequentes

O Sonnet 5 substitui o Opus 4.8?
Não. O Sonnet 5 chega perto do Opus 4.8 em coding agêntico e computer use, e supera em knowledge work, mas o Opus 4.8 e o Fable 5 seguem como as opções para as tarefas mais pesadas e para a rede de segurança do Fable.

Por que o Fable 5 ficou fora do ar?
Por causa de um controle de exportação dos EUA aplicado em 12 de junho, depois que pesquisadores da Amazon mostraram um jeito de burlar as salvaguardas do modelo. O controle foi retirado em 30 de junho e o modelo voltou global em 1 de julho.

Quanto custa usar o Sonnet 5?
Até 31 de agosto de 2026, US$ 2 por milhão de tokens de entrada e US$ 10 por milhão de saída. Depois, US$ 3 e US$ 15.

Preciso mudar meu código para usar os novos modelos?
Para o Sonnet 5, basta trocar o identificador do modelo. Para o Fable 5, lembre que o modo de raciocínio é sempre ligado, então você não passa orçamento de tokens de pensamento, e requisições bloqueadas caem no Opus 4.8 automaticamente.

O Fable 5 é perigoso de usar?
Segundo a Anthropic, todos os modelos testados produziam a mesma demonstração da vulnerabilidade que motivou o controle, então ele não tem uma capacidade perigosa única. Ainda assim, áreas de alto risco são bloqueadas e redirecionadas para o Opus 4.8.

Conclusão e próximo passo

A semana resumida em três pontos:

  • Sonnet 5 barateou o agente autônomo, com preço promocional de US$ 2 por milhão de tokens de entrada até 31 de agosto e entrada como default do Free e Pro.
  • Fable 5 voltou global em 1 de julho, depois de um controle de exportação, com acesso incluído nos planos pagos até 7 de julho.
  • A jogada certa é usar modelo por tarefa: Sonnet 5 no grosso, Fable 5 no que é difícil, Opus 4.8 no meio e como rede de segurança.

Você já está usando algum desses modelos na sua stack, ou ainda está preso num modelo só pra tudo? Conta nos comentários como está sendo o seu custo de agentes hoje.

Na próxima, vou mostrar na prática como integrar a API da Claude num serviço Spring Boot, com retry, timeout e fallback de modelo configurados do jeito que aguenta produção. Fica de olho aqui no Meu Universo Nerd.