Bom dia! 👋
Nesta edição da "E aí, IA?", destacamos seis grandes novidades que mostram como o mundo da inteligência artificial está acelerando em ritmo impressionante. Do novo raciocínio avançado do Deep Think à evolução dos agentes da Microsoft, essas atualizações estão moldando o futuro da tecnologia.
Na edição de hoje:
- Deep Think do Google quebra recordes de raciocínio
- OpenAI lança GPT-5.3 Codex-Spark com velocidade extrema
- MiniMax apresenta modelo M2.5 com desempenho de ponta e baixo custo
- Ensaio viral de Matt Shumer alerta sobre o impacto iminente da IA
- Gemini da Google agora cria imagens interativas
- Microsoft estreia Agent 365 para gerenciar agentes em escala
🧠 Google lança Deep Think e redefine os benchmarks de raciocínio
O Google surpreendeu o setor ao lançar uma atualização massiva no modo de raciocínio do Gemini 3, chamado Deep Think. A novidade superou amplamente os principais concorrentes em raciocínio matemático, codificação e ciência. Além disso, a empresa apresentou o Aletheia — um agente de pesquisa matemática capaz de resolver problemas em aberto e verificar provas ligadas a benchmarks especializados.
O upgrade, disponível para assinantes do plano Ultra do Gemini, marca um retorno contundente do Google ao centro do palco da corrida pela supremacia em IA.
Detalhes:
- Deep Think obteve 84,6% no benchmark ARC-AGI-2, superando amplamente Opus 4.6 (68,8%) e GPT-5.2 (52,9%)
- Alcançou 3.455 pontos de Elo no Codeforces — quase mil a mais que o Opus
- O agent Aletheia resolve problemas matemáticos em aberto de forma autônoma
Após meses de destaque para OpenAI e Anthropic, o Google prova que ainda é o peso-pesado mais potente da corrida pela IA. Saiba mais
⚡ OpenAI revela Codex-Spark, modelo de codificação ultra-rápido
O OpenAI lançou o GPT-5.3 Codex-Spark, focado em velocidade e otimizado para rodar em chips da Cerebras. Com entrega de mais de 1.000 tokens por segundo, o modelo foi pensado para tarefas que exigem interatividade e respostas quase instantâneas. A novidade é simbólica por ser o primeiro modelo lançado fora do domínio dos chips Nvidia.
A nova estratégia visa dividir tarefas entre o Spark — voltado para edições rápidas — e o Codex completo, que cuida de fluxos mais longos.
Detalhes:
- Rodando em hardware da Cerebras, o Spark sacrifica poder por respostas em tempo real
- Desempenho inferior ao Codex completo em benchmarks como SWE-Bench Pro, mas com execução muito mais rápida
- Disponível como preview para assinantes Pro do ChatGPT e parceiros corporativos selecionados
Com o Spark, a OpenAI não só enfrenta críticas antigas sobre lentidão, como também avança em sua meta de diversificar sua infraestrutura de chips. Saiba mais
💰 MiniMax lança M2.5, modelo open-source com desempenho de ponta
A startup chinesa MiniMax revelou o M2.5, um modelo open-source que rivaliza em benchmarks com GPT-5.2 e Opus 4.6 — mas a custos muitíssimo menores. Com preços entre $1,20 e $2,40 por milhão de tokens gerados, o novo modelo torna mais viável a execução contínua de agentes autônomos.
Internamente, já é usado para até 80% dos commits de código da empresa, além de tarefas em vendas, produto e até RH.
Detalhes:
- M2.5 supera modelos líderes em benchmarks de desenvolvimento de código
- Dois planos de API disponíveis: Lightning (mais rápido) e Standard (mais barato)
- Apesar de open-source, os pesos e licenças ainda não foram disponibilizados
O M2.5 é mais uma prova de que laboratórios chineses estão reconfigurando a equação custo-desempenho da IA. Saiba mais
📉 Ensaio viral prevê colapso de empregos pela IA e gera debate global
Um ensaio escrito por Matt Shumer viralizou ao descrever uma visão alarmante sobre o futuro próximo com IA. A publicação afirma que ferramentas atuais já criam aplicativos inteiros a partir de comandos em inglês — sem necessidade de intervenção humana. A estimativa é que até 50% dos empregos administrativos sejam afetados em até 5 anos.
A repercussão disparou com mais de 70 milhões de visualizações e dividiu a comunidade entre alarmistas e críticos do exagero.
Detalhes:
- Afirmado que a automação total de tarefas administrativas básicas já é viável
- O ensaio alerta para uma mudança estrutural iminente na sociedade
- Especialistas como Ethan Mollick e Sam Altman alertam para não superestimar o atual poder dos sistemas
Apesar das divergências, a publicação sugere que o tempo para adaptação está mais curto do que nunca. Saiba mais
🖼️ Gemini agora cria imagens totalmente interativas
O Gemini da Google agora permite gerar imagens com camadas interativas. Basta enviar um prompt descritivo e o sistema cria diagramas navegáveis onde é possível clicar em partes específicas para obter explicações e conteúdos associados. Estudantes e pesquisadores já estão aproveitando a ferramenta como método de aprendizado ativo.
Essa função transforma o consumo visual passivo em exploração ativa, ajudando o usuário a aprender enquanto interage.
Detalhes:
- Disponível diretamente na interface de texto do Gemini
- Imagens processadas com hotspots clicáveis
- Ideal para ensino de conteúdos como biologia, física e neurociência
Uma inovação visual que empodera a educação interativa com IA. Saiba mais
🧩 Microsoft lança Agent 365 para gerenciar enxames de agentes de IA
O Microsoft Agent 365 é uma nova plataforma projetada para ajudar empresas a controlarem e protegerem múltiplos agentes de IA. A ferramenta funciona como camada de governança, gerenciamento de identidade e monitoramento para todos os agentes conectados ao ambiente Copilot ou de terceiros.
Durante evento ao vivo, executivos mostraram como implantar e rastrear agentes internos de forma segura e escalável.
Detalhes:
- Permite gerenciar permissionamento, segurança e visibilidade dos agentes
- Oferece interface para agentes desenvolvidos tanto via Copilot quanto soluções externas
- Ideal para empresas que desejam escalar IA com governança centralizada
Com o Agent 365, a Microsoft reforça sua ambição de liderar ambientes de produção em IA. Saiba mais
Newsletter gerada 100% por I.A.