E aí, IA? – Resumo do dia 16/jan/2026
Bom dia, entusiastas de inteligência artificial. A edição de hoje da nossa newsletter “E aí, IA?” está repleta de reviravoltas corporativas, avanços em interfaces mente-computador, e experimentos impressionantes com agentes autônomos. Acompanhe também os novos recursos da Gemini, a ferramenta Claude Cowork explorando o mundo não-técnico e um computador local que clona vozes com qualidade profissional — sem GPU.
Na edição de hoje:
- Cofundadores da Thinking Machines retornam à OpenAI após escândalo
- Agentes autônomos da Cursor criam navegador completo com GPT-5.2
- OpenAI investe em concorrente da Neuralink criado por Sam Altman
- Google lança recurso de Inteligência Pessoal para Gemini
- Claude Cowork executa tarefas com arquivos de mídia localmente
- Kyutai cria clonagem de voz local sem necessidade de GPU
A startup Thinking Machines, liderada pela ex-CTO da OpenAI Mira Murati, se viu abalada após demitir o cofundador e CTO Barret Zoph por suposto vazamento de informações confidenciais com empresas concorrentes. Em uma reviravolta inesperada, Zoph e outros colaboradores retornaram à OpenAI poucas horas depois. A notícia foi divulgada por Murati em uma reunião geral e confirmada em seu perfil no X. No mesmo anúncio, Murati nomeou Soumith Chintala — conhecido por sua atuação na Meta AI e por criar o PyTorch — como novo CTO da empresa.
Os acontecimentos marcam a terceira saída de cofundadores da empresa em menos de um ano, levantando dúvidas sobre a estabilidade interna da startup. A OpenAI reafirma, assim, sua tradição de ser "nada sem o seu time", e aproveita essa chance para recuperar talentos chave.
Detalhes:
- Barret Zoph foi acusado de compartilhar dados sigilosos com concorrentes
- O retorno dos ex-colaboradores à OpenAI acontece após semanas de negociações
- Thinking Machines elevou Soumith Chintala à posição de CTO
As repatriações reforçam a importância de talentos estratégicos para a OpenAI — mesmo quando envoltos em polêmicas. saiba mais
A Cursor, startup conhecida por desenvolver agentes de codificação, revelou um experimento robusto com centenas de agentes GPT-5.2 cooperando autonomamente por semanas. O resultado? Um navegador funcional com mais de 3 milhões de linhas de código criado do zero — e em menos de uma semana. O sistema se baseou em uma estrutura inspirada em divisão de tarefas: agentes planejadores, executores e julgadores.
Além do navegador, a equipe criou um emulador do Windows 7, um clone do Excel e migrou grandes porções do código interno da empresa, tudo utilizando agentes autônomos.
Detalhes:
- Agentes foram divididos entre planejadores, trabalhadores e avaliadores
- A ferramenta suporta sessões autônomas prolongadas com GPT-5.2
- Projetos paralelos superaram a marca de 1 milhão de linhas de código
Para além do feito técnico, o experimento reposiciona a economia do desenvolvimento digital ao demonstrar produtividade real de agentes em larga escala. saiba mais
A OpenAI anunciou investimento semente na Merge Labs, uma nova empresa de interface cérebro-computador cofundada pelo próprio Sam Altman. A companhia emergiu do sigilo com uma rodada de US$ 252 milhões e o apoio imediato da OpenAI como principal investidora. A Merge quer aumentar a largura de banda BCI utilizando ultrassom e proteínas projetadas — diferentemente dos implantes cerebrais invasivos da Neuralink.
O objetivo é permitir interações naturais e centradas no ser humano entre cérebros e inteligência artificial, com aplicações prometidas no campo biomédico e na computação de próxima geração.
Detalhes:
- A tecnologia utiliza ultrassom, evitando cirurgias invasivas
- OpenAI fornecerá modelos para interpretar sinais cerebrais
- A equipe inclui ex-membros da Tools for Humanity e pesquisadores da Caltech
O projeto atraiu atenção não só pelo potencial técnico, mas também por reacender a rivalidade entre Altman e Elon Musk. saiba mais
O Google iniciou o rollout de um dos recursos mais aguardados do Gemini: o modo de Inteligência Pessoal. A funcionalidade conecta o assistente aos seus dados do Gmail, Fotos, pesquisas e histórico do YouTube, permitindo gerar respostas ultra personalizadas. O recurso está sendo liberado inicialmente para assinantes dos planos Pro e Ultra, e permanece desativado por padrão.
Agora, ao pedir recomendações de viagem, o Gemini pode cruzar datas de voos e interesses pessoais para oferecer sugestões baseadas nos seus hábitos e agenda.
Detalhes:
- Gemini acessa e cruza dados de Gmail, YouTube, Fotos e Buscas
- Funcionalidade está em beta e desativada por padrão
- Objetivo é oferecer respostas contextualmente relevantes
Com essa funcionalidade, o Gemini se torna mais do que um chatbot: avança como assistente pessoal real. saiba mais
O novo recurso “Cowork” da Claude permite trabalhar com conteúdo armazenado localmente, processando vídeos e imagens de forma paralela. Com ele, é possível comprimir arquivos, extrair áudios, gerar MP3s e automatizar tarefas de mídia com simples comandos, diretamente na sua máquina.
Requer a versão desktop do Claude com assinatura Max (US$ 100/mês), mas oferece desempenho e praticidade avançados.
Detalhes:
- Funciona com pastas no seu computador e executa múltiplas tarefas em paralelo
- Permite extrair áudio e comprimir arquivos simultaneamente
- Com o plugin Context7, pode acessar documentação open source
O Cowork torna Claude um verdadeiro assistente operacional de mídia, com comandos simples e respostas eficazes. saiba mais
O laboratório Kyutai lançou o Pocket TTS, um modelo de texto-para-fala com apenas 100 milhões de parâmetros que roda localmente em CPUs — sem necessidade de GPU. Utilizando apenas 5 segundos de áudio, ele é capaz de clonar vozes com acurácia surpreendente, incluindo sotaque, emoção e até características do ambiente de gravação.
O recurso chega como alternativa poderosa e privada diante de ferramentas comerciais como ElevenLabs. Tudo é open-source e com código completo de treino disponível.
Detalhes:
- Modelo leve roda mais rápido que o tempo real em chips M3 e Intel Ultra
- Taxa de erro inferior a concorrentes 7x maiores
- Não é preciso enviar dados para servidores — ideal para privacidade
Simples, gratuito e poderoso, o Pocket TTS inaugura uma nova era para aplicações locais de voz artificial. saiba mais
Detalhes:
- ChatGPT Translate: Traduza texto, voz e imagens em mais de 50 idiomas
- SeedFold: Novo modelo open-source para previsão de estrutura de proteínas
- Replit Mobile Apps: Crie e publique apps nativos direto do celular
- Claude Cowork: Automatize tarefas rotineiras com assistentes especializados
- Prompt Station: Coleção com os 15 prompts mais impactantes segundo usuário do Reddit