E aí, IA? – Resumo do dia 25/fev/2026
E aí, IA?
Bom dia! A edição de hoje mistura geopolítica, modelos de próxima geração e a nova onda de “agents” que já está entrando nas rotinas de trabalho — com destaque para uma disputa delicada entre segurança de IA e exigências do setor de defesa.
Na edição de hoje:
- Pentágono pressiona a Anthropic a afrouxar limites do Claude em uso militar
- FDM-1 aprende tarefas no computador assistindo a vídeos longos
- Anthropic amplia Cowork com agents por departamento e novos conectores
- Pika Labs apresenta “AI Selves”, gêmeos digitais persistentes
- Airtable lança Hyperagent para workflows agentic em escala
- Mercury 2 aposta em diffusion para texto e promete velocidade extrema
🪖 Pentágono dá ultimato à Anthropic sobre “guardrails” do Claude
O Departamento de Defesa dos EUA elevou a tensão com a Anthropic ao exigir mudanças nas salvaguardas do Claude para uso militar. Segundo a reportagem, o pedido chega como um ultimato: ou a empresa ajusta restrições que impedem aplicações específicas (como autonomia letal e vigilância em massa), ou corre o risco de perder contratos e enfrentar sanções administrativas que podem limitar sua atuação como fornecedora do governo.
O caso é especialmente sensível porque coloca em choque dois vetores fortes: o avanço da adoção de modelos de linguagem em ambientes classificados e a tentativa das big labs de manter limites explícitos de uso. Também chama atenção o argumento de “necessidade em tempos de conflito”, que pode virar precedente para pressionar por menos barreiras de segurança justamente nos cenários de maior impacto.
Detalhes
- O CEO Dario Amodei teria resistido a liberar dois usos: armas autônomas sem humano no loop e vigilância em larga escala de cidadãos americanos.
- Entre as opções citadas, estariam: aceitar as exigências, encerrar um acordo de grande porte com risco de rotulagem negativa na cadeia de suprimentos, ou ser compelido por instrumentos legais como o Defense Production Act.
- O movimento ocorre enquanto outras empresas disputam espaço em redes classificadas, aumentando a pressão competitiva sobre quem tenta manter limites de segurança mais rígidos.
O ponto central é que, se ameaças legais em contexto de “segurança nacional” forem suficientes para desmontar barreiras, a linha sobre usos distópicos pode deixar de ser técnica e virar apenas política. Para entender o contexto e a cronologia completa, saiba mais.
💻 FDM-1 aprende qualquer tarefa no computador assistindo a vídeos
A Standard Intelligence apresentou o FDM-1, um modelo focado em “computer actions” que aprende a operar interfaces ao observar vídeos de tela, tentando inferir quais ações geraram cada mudança visual. A ideia é aproximar o treinamento de agents do modo como humanos aprendem software: vendo alguém usar, repetindo e generalizando para novas tarefas e ferramentas.
O diferencial do FDM-1 está no volume e no comprimento do contexto visual processado de uma vez, o que favorece tarefas com encadeamentos longos (como depurar software, modelar em CAD ou seguir processos multi-etapas). Se isso escalar, abre caminho para agents que não dependem apenas de APIs bem comportadas, mas que conseguem navegar em GUIs reais com menos “quebras” no meio do caminho.
Detalhes
- O treinamento descrito envolve um conjunto massivo de horas de gravações de tela, com o modelo tentando reconstruir as ações por trás de cada frame.
- O sistema consegue acompanhar sessões longas de atividade contínua no desktop, aumentando a janela efetiva de contexto visual para fluxos extensos.
- Demonstrações incluem desde tarefas criativas em softwares complexos até cenários que dependem de controle sequencial e leitura de sinais ao vivo.
Se modelos de linguagem “aprenderam escrita” via texto da internet, a aposta aqui é aprender “como trabalhamos” via vídeo — e isso pode elevar bastante o teto do que agents de uso de computador conseguem executar. Veja a apresentação e os detalhes técnicos em saiba mais.
💼 Cowork expande agents do Claude para departamentos e integrações corporativas
A Anthropic anunciou uma atualização robusta do Cowork, seu ecossistema de agents, com foco em tornar a adoção empresarial mais plug-and-play. Em vez de depender apenas de um agent genérico, a plataforma passa a oferecer agentes pré-configurados por área (ex.: RH, engenharia, finanças), além de conectores e um modelo de distribuição interna que lembra “lojas privadas” de automações por equipe.
O movimento reforça a disputa pelo “sistema operacional do trabalho”: quem consegue conectar o modelo às ferramentas onde a empresa já vive (e-mail, documentos, assinatura, dados de mercado) tende a capturar o valor do dia a dia. A promessa é reduzir o atrito para transformar o Claude em executor de processos, não só em gerador de texto.
Detalhes
- O pacote inicial inclui agents prontos para múltiplos departamentos, cobrindo rotinas típicas e variações por setor.
- Foram adicionados conectores para ferramentas comuns em corporações (produtividade, contratos, dados e fluxos), além de integrações com parceiros.
- Admins podem controlar acesso e publicar agents customizados por time, criando governança sobre o que roda e para quem.
Com cada nova integração, o Cowork fica menos “demo” e mais infraestrutura real de automação — e isso tende a acelerar a adoção de agents em empresas grandes. Confira o anúncio e o que foi liberado em saiba mais.
🧬 Pika Labs lança “AI Selves”, gêmeos digitais com memória e evolução
A Pika Labs revelou o AI Selves, um conceito de “gêmeo digital vivo” que o usuário cria, treina e depois deixa atuar como extensão autônoma em diferentes plataformas. A proposta vai além de um chatbot com instruções: o sistema promete memória persistente, adaptação ao estilo de comunicação e mudanças graduais conforme interage, como se “crescesse” com o tempo.
O anúncio é um sinal claro de para onde parte do mercado de consumer AI quer ir: identidades digitais que respondem por você, com continuidade, e não apenas sessões isoladas. Isso também abre debates sobre autenticação, consentimento e risco reputacional — principalmente quando uma “versão de você” passa a escrever, lembrar e decidir em ambientes públicos.
Detalhes
- O produto é posicionado como um “digital extension” com memória, capaz de aprender preferências e tom ao longo de muitas interações.
- A Pika sugere que o Self pode “viver” em múltiplos canais, reduzindo a fricção para manter presença e responder em escala.
- O framing de “nascer e criar” o agente indica uma experiência contínua de configuração, não apenas um prompt inicial.
A grande questão prática será controle: como limitar o que o Self pode fazer, onde pode atuar e como reverter comportamentos indesejados quando ele já acumulou histórico. Para ver o anúncio e o contexto completo, saiba mais.
🧩 Airtable apresenta Hyperagent para construir workflows agentic
A Airtable anunciou o Hyperagent como uma plataforma para criar e rodar agents que executam tarefas completas, entregam artefatos e memorizam rotinas multi-etapas. A proposta é reunir, em um único sistema, o que normalmente exige uma pilha inteira: modelo frontier, orquestração, integrações, execução e reaproveitamento de fluxos.
O apelo para empresas é direto: transformar processos recorrentes em “playbooks executáveis”, com o agent aprendendo o caminho e reproduzindo depois. Se funcionar como descrito, isso empurra o Airtable para além de base de dados e automação tradicional, posicionando-o como camada operacional de agentes sobre ferramentas internas e web.
Detalhes
- O Hyperagent é descrito como sempre rodando no modelo frontier “mais forte do momento”, com capacidade de agir na web e produzir entregáveis.
- Ele se conecta a um grande catálogo de integrações enterprise, facilitando ações em serviços já usados pelo time.
- O foco em “memorizar workflows” mira reduzir custo de repetição e padronizar execuções que hoje dependem de pessoas.
O teste real será confiabilidade e governança: agents úteis precisam de rastreabilidade, limites e recuperação quando algo sai do script. Veja vídeo, detalhes e lista de espera em saiba mais.
⚡ Mercury 2 leva diffusion para texto e promete respostas em alta velocidade
A Inception Labs lançou o Mercury 2, um modelo de raciocínio que usa uma abordagem inspirada em diffusion para gerar texto de forma paralela e refiná-lo, em vez de prever token por token de modo estritamente sequencial. A tese é que o padrão autoregressivo domina por tradição e ecossistema, mas é ineficiente para inferência, especialmente quando a latência importa (voz, suporte, IDEs, agentes em tempo real).
Além de velocidade, o Mercury 2 vem com foco em custo por token e recursos de produto típicos do mercado atual (janela de contexto ampla, tool use e saída estruturada). O lançamento chama atenção porque, se a arquitetura cumprir a promessa, pode mudar a economia de experiências “always-on”, onde esperar 10–20 segundos por uma resposta simplesmente não é aceitável.
Detalhes
- A geração paralela e o refinamento iterativo buscam contornar o gargalo sequencial de modelos autoregressivos em GPUs modernas.
- O posicionamento inclui throughput muito alto em hardware recente e preços agressivos por entrada/saída de tokens.
- O produto mira casos onde velocidade é o principal diferencial: coding assistants, voice agents e atendimento.
O recado do Mercury 2 é que “o futuro do texto” pode não ser só escalar LLMs, mas repensar o modo de geração para aproveitar melhor o hardware já disponível. Para conferir o anúncio oficial, saiba mais.
🧠 Dicas rápidas (links úteis) para testar hoje
Selecionei algumas recomendações práticas a partir das seções de ferramentas e “quick hits” das newsletters, priorizando itens com impacto imediato para produtividade, criação e acompanhamento do ecossistema.
Detalhes
- Notion Custom Agents — agents sempre ativos para automatizar rotinas e manter fluxos rodando sem depender de prompts toda hora.
- Seedream 5.0 Lite (ByteDance) — modelo de geração de imagem atualizado, útil para explorar alternativas aos pipelines mais comuns.
- Reve v1.5 — text-to-image com outputs em alta resolução, interessante para materiais de marketing e variações rápidas.
- OpenAI contrata novo Chief People Officer — sinal de continuidade de escala organizacional e amadurecimento de operações internas.
- Meta e AMD fecham acordo multi-ano de infraestrutura — movimento relevante para diversificar dependência de GPUs e ampliar capacidade.
Se você quer se manter em modo “hands-on”, estas são boas portas de entrada para testar agents e acompanhar como a infraestrutura e as equipes das big labs estão mudando. Para explorar a lista completa e novidades associadas, saiba mais.