[7min] Anthropic e OpenAI Lançam Novos Modelos Enquanto Ações de Software Perdem US$ 1 Tri
Mais: Claude Opus 4.6 lidera benchmarks de agentes de 1M tokens, GPT-5.3-Codex é o primeiro modelo classificado como risco 'Alto' de cibersegurança, e participação do ChatGPT despenca para 45%
Anthropic e OpenAI Lançam Novos Modelos Enquanto Ações de Software Perdem US$ 1 Tri
6 de fevereiro de 2026
Conteúdo curado por IA. LLMs podem cometer erros. Sempre verifique informações importantes.
Anthropic e OpenAI lançaram atualizações de peso hoje. A Anthropic apresentou o Claude Opus 4.6 com times de agentes que dividem tarefas e executam em paralelo, liderando a maioria dos benchmarks de agentes e com janela de contexto de 1M tokens. A OpenAI respondeu com o GPT-5.3-Codex, seu primeiro modelo classificado como risco "Alto" de cibersegurança, e o Frontier, plataforma corporativa para orquestrar colegas de trabalho de IA na infraestrutura de uma organização. Para provar o conceito, a Anthropic colocou 16 agentes para construir um compilador C funcional do zero em horas. Wall Street reagiu rapidamente: ações de software perderam mais de US$ 1 trilhão em valor de mercado esta semana conforme investidores absorviam as implicações. ServiceNow perdeu 25% no mês. Salesforce caiu 40% de sua máxima. A JPMorgan chamou de "ser sentenciado antes do julgamento", mas a queda reflete incerteza genuína sobre qual software corporativo sobrevive quando qualquer um pode criar ferramentas customizadas com vibe coding. Enquanto isso, novos dados mostram que a participação do ChatGPT no mercado de chatbots caiu de 69% para 45% conforme Gemini, Claude e Grok avançam. Separadamente, um acordo de US$ 100 bilhões entre Nvidia e OpenAI parece ter evaporado, e o Claude Opus 4.6 descobriu mais de 500 vulnerabilidades zero-day durante testes pré-lançamento — um lembrete de que modelos mais capazes são uma faca de dois gumes.
Anthropic lança Claude Opus 4.6 com times de agentes e janela de 1M tokens
A Anthropic lançou o Claude Opus 4.6, seu modelo mais poderoso, com janela de contexto de 1M tokens (maior que o limite anterior do nível Opus) e nova capacidade de "times de agentes" no Claude Code que permite múltiplos agentes de IA dividirem e executarem tarefas em paralelo. O modelo lidera a maioria dos benchmarks de agentes, com 76% no MRCR v2 (vs. 18,5% do Sonnet 4.5) e 65,4% no Terminal-Bench 2.0.
Novas integrações colocam o Claude diretamente no Excel e PowerPoint como ferramentas laterais, e a API ganha recursos de "Adaptive Thinking" e "Compaction" para gerenciar contextos longos. O system card da Anthropic nota que o Opus 4.6 é ligeiramente mais vulnerável a injeções indiretas de prompt que seu predecessor, uma preocupação para deployments de agentes. (fonte)
OpenAI lança GPT-5.3-Codex, primeiro modelo classificado como risco 'Alto' de cibersegurança
A OpenAI lançou o GPT-5.3-Codex, modelo de código que combina habilidades de programação do GPT-5.2-Codex com raciocínio do GPT-5.2, rodando 25% mais rápido. Lidera benchmarks de agentes incluindo Terminal-Bench 2.0 (superando Opus 4.6 por 12 pontos) e marca 64,7% no OSWorld, quase o dobro dos 38,2% de seu predecessor.
A OpenAI classificou este como seu primeiro modelo com risco "Alto" de cibersegurança e comprometeu US$ 10 milhões em créditos de API para pesquisa de segurança defensiva. Versões iniciais ajudaram a debugar treinamentos e gerenciar deployment, tornando o Codex o primeiro modelo a participar ativamente de seu próprio desenvolvimento. (fonte)
OpenAI lança plataforma Frontier para gerenciar 'colegas de trabalho de IA' corporativos
A OpenAI apresentou o Frontier, plataforma corporativa para construir, deployar e gerenciar agentes de IA através da stack de tecnologia de uma organização. Cada agente recebe identidade própria com permissões delimitadas, contexto de negócios compartilhado e loops de avaliação modelados em onboarding e avaliações de desempenho de funcionários.
O Frontier funciona com agentes da OpenAI, Google, Microsoft, Anthropic e customizados. HP, Oracle, State Farm e Uber são adotantes iniciais. Preço não divulgado. O lançamento posiciona a OpenAI diretamente contra o Agent 365 da Microsoft e o Agentforce da Salesforce na corrida para controlar a camada de orquestração de agentes corporativos. (fonte)
Ações de software perdem US$ 1 tri com ferramentas da Anthropic gerando temores de disrupção
Ações de software perderam mais de US$ 1 trilhão em valor de mercado nesta semana após o plugin jurídico Cowork da Anthropic e ferramentas mais amplas de agentes de IA assustarem investidores. Empresas de legal-tech Thomson Reuters e RLEX caíram ~15% cada; ServiceNow perdeu 25% no mês; Salesforce caiu ~40% de sua máxima. Larry Ellison da Oracle viu US$ 49 bi apagados de seu patrimônio líquido no ano.
Vendedores a descoberto lucraram US$ 24 bi com a queda. O analista do JPMorgan Toby Ogg escreveu que o setor está "sendo sentenciado antes do julgamento". O S&P 500 de peso igual atingiu máxima histórica, sugerindo que a dor está concentrada em tech enquanto mercados mais amplos rotacionam para cíclicos e industriais. (fonte)
Times de agentes da Anthropic constroem compilador C do zero: 16 agentes, 100 mil linhas
A Anthropic demonstrou seu novo recurso de "times de agentes" do Claude Code ao fazer 16 agentes de IA colaborarem para construir um compilador C funcional do zero. A base de código de 100 mil linhas compila e roda com sucesso o kernel do Linux, mostrando o potencial do desenvolvimento paralelo multi-agente.
Um agente líder decompõe tarefas e delega a sub-agentes especializados que trabalham simultaneamente. O projeto do compilador levou horas em vez das semanas ou meses que uma equipe humana precisaria, embora a Anthropic tenha notado que supervisão humana permaneceu crítica para decisões arquiteturais. (fonte)
Participação do ChatGPT cai de 69% para 45% enquanto Gemini e Claude avançam
Novos dados da Apptopia mostram que a participação do ChatGPT no mercado de chatbots de IA generativa caiu de 69% para 45%, impulsionada pelo crescimento do Gemini do Google, Grok da xAI e Claude da Anthropic. A mudança coincide com o pivô da OpenAI em direção à monetização através de anúncios e produtos corporativos.
O relatório surgiu junto à afirmação de Sam Altman de que o ChatGPT tem mais usuários apenas no Texas do que o Claude tem em todo os EUA, uma resposta defensiva à campanha publicitária do Super Bowl da Anthropic zombando dos anúncios do ChatGPT. Altman acusou a Anthropic de elitismo por servir principalmente assinantes pagantes. (fonte)
Claude Opus 4.6 descobre 500+ vulnerabilidades zero-day em auditoria de segurança
Avaliação interna de segurança da Anthropic revelou que o Claude Opus 4.6 identificou mais de 500 vulnerabilidades zero-day previamente desconhecidas em software de código aberto amplamente usado. A descoberta veio durante testes de segurança padrão pré-lançamento.
As descobertas destacam tensão de uso dual: as mesmas capacidades que tornam o Opus 4.6 efetivo em análise de código e pesquisa de segurança também podem ser exploradas. A Anthropic coordenou divulgação responsável com mantenedores afetados antes de publicar os resultados, e citou isto como justificativa para sua abordagem cautelosa de deployment. (fonte)
Goldman Sachs usa Claude da Anthropic para automatizar contabilidade de operações
O Goldman Sachs está usando o Claude da Anthropic para automatizar partes de seu fluxo de trabalho de contabilidade de operações, marcando um dos deployments corporativos de IA de mais alto perfil em finanças. O sistema lida com reconciliação e tarefas de processamento que antes exigiam revisão manual por equipes de contabilidade.
O acordo ressalta como modelos de IA de fronteira estão penetrando indústrias reguladas onde precisão e auditabilidade são primordiais. O Goldman se junta a uma lista crescente de instituições financeiras integrando IA diretamente em operações centrais em vez de apenas ferramentas voltadas ao cliente. (fonte)
Meta completa pré-treinamento do 'Avocado', seu modelo de IA mais capaz
A Meta finalizou o pré-treinamento de seu novo modelo de IA codinome "Avocado", que supera os melhores modelos base livremente disponíveis em conhecimento, percepção visual e desempenho multilíngue mesmo antes do pós-treinamento. Memo interno diz que é 10x mais eficiente que o Maverick e 100x mais eficiente que o Behemoth.
O marco sinaliza potencial virada após 2025 turbulento da Meta, que viu atrasos do Llama 4, benchmarks manipulados e saída de Yann LeCun. Reportagens sugerem que a Meta pode se afastar do código aberto para o Avocado, mudança significativa de sua estratégia Llama. Modelo visual codinome "Mango" também está em desenvolvimento. (fonte)
Acordo de US$ 100 bi entre Nvidia-OpenAI desmorona, levantando questões sobre economia circular da IA
Acordo amplamente reportado de US$ 100 bi entre Nvidia e OpenAI parece ter evaporado. Jensen Huang disse privadamente a associados que o acordo era "não-vinculante" e publicamente que qualquer investimento seria "nada como" US$ 100 bi. A Reuters reportou que a OpenAI está "insatisfeita" com chips avançados da Nvidia e busca alternativas.
As ações da Nvidia caíram 10% esta semana com a notícia. A Oracle, que conta com acordo separado de nuvem de US$ 300 bi com a OpenAI, correu para tranquilizar investidores. O desmoronamento destaca preocupações sobre investimento circular de IA onde fabricantes de chips financiam empresas de IA que compram seus próprios chips. (fonte)
GPT-5 reduz custos de síntese proteica livre de células em 40% em experimento autônomo
Lab autônomo combinando GPT-5 da OpenAI com automação em nuvem da Ginkgo Bioworks reduziu custos de síntese proteica livre de células em 40% através de experimentação em loop fechado. O sistema projetou, executou e iterou em experimentos sem intervenção humana.
O resultado demonstra crescente habilidade da IA de acelerar pesquisa científica, com o modelo otimizando parâmetros experimentais que pesquisadores humanos não haviam explorado. Marca marco significativo em pesquisa biológica dirigida por IA. (fonte)
Isso é o suficiente para 7 min! Leia mais 26 histórias no 7min.ai