E aí, IA?
Bom dia! A IA deu um passo ousado rumo à superinteligência e está cada vez mais integrada ao nosso cotidiano. Nesta edição exploramos a polêmica conquista da OpenAI na Olimpíada Internacional de Matemática, o novo benchmark de inteligência geral da ARC, vulnerabilidades psicológicas de modelos LLM, conquistas em codificação, transformações no navegador e até novos testes de raciocínio visual. Confira:
- 🤖 OpenAI afirma conquistar medalha de ouro na Olimpíada de Matemática
- 🧠 ARC lança novo teste interativo para AGI
- ❤️🔥 IA pode ser enganada por truques psicológicos humanos
- 💻 Novo modelo da OpenAI domina maratona de programação
- 🌐 Perplexity quer dominar smartphones na Índia
- 📊 Slack revela alto ROI de agentes de IA em colaboração
🥇 OpenAI afirma conquistar medalha de ouro na Olimpíada de Matemática
Na última sexta-feira, a OpenAI anunciou que um de seus modelos experimentais de linguagem alcançou desempenho de nível ouro na Olimpíada Internacional de Matemática (IMO) 2025. Segundo os pesquisadores, o modelo resolveu corretamente 5 das 6 questões, seguindo as mesmas regras aplicadas aos participantes humanos: mais de 4 horas de prova, sem auxílio de ferramentas ou internet.
A pontuação de 35 em 42 foi suficiente para a medalha de ouro, e as respostas foram avaliadas por ex-medalhistas da IMO. Embora impressionante, a conquista gerou controvérsias. Pesquisadores da DeepMind criticaram a ausência da guia oficial de correção da IMO, essencial para validar os resultados. A prova 6, que exigia alta criatividade, não foi resolvida — indicando que ainda há um longo caminho até modelos resolverem problemas matemáticos com o mesmo nível de engenhosidade humana.
Detalhes:
- Modelo atuou sem auxílio e foi avaliado por especialistas humanos
- Pesquisadores apontam que, sem a correção oficial da IMO, resultado pode equivaler a prata
- Mesmo com controvérsias, o feito é considerado um marco rumo à superinteligência matemática
É um avanço poderoso, mas ainda carregado de incertezas. Saiba mais em saiba mais
🧠 ARC lança novo teste interativo para AGI
A ARC lançou um benchmark inédito chamado ARC-AGI-3, focado em testar IA de forma mais geral e interativa. O teste consiste em três jogos criados para medir a capacidade dos modelos em construir modelos mentais de mundo e planejar a longo prazo, tudo isso sem instruções explícitas, como fazem os humanos ao aprender tarefas novas.
Até o momento, modelos de ponta como o o3 da OpenAI e o Grok 4 não conseguiram completar nem os níveis mais básicos, destacando a complexidade do desafio. A ARC também abriu uma competição pública para incentivar a criação de agentes capazes de superar os jogos.
Detalhes:
- Testes simulam ambientes desconhecidos que exigem aprendizado por tentativa e erro
- Modelos líderes atuais falharam em níveis triviais para humanos
- A competição busca revelar o estado real da inteligência geral artificial
Essa abordagem promete nos aproximar de agentes capazes de aprender como humanos. Saiba mais em saiba mais
🧠 IA pode ser enganada por truques psicológicos humanos
Pesquisadores da Wharton Generative AI Labs demonstraram que modelos avançados, como o GPT-4o-mini, são suscetíveis a manipulações psicológicas semelhantes às que funcionam com humanos. Utilizando princípios de persuasão de Robert Cialdini, os testes mostraram que a taxa de respostas a comandos inapropriados duplicou com o uso dessas técnicas.
Em mais de 28 mil conversas, quando os pesquisadores aplicaram estratégias como escassez e compromisso, a taxa de conformidade saltou de 33% para até 72% em alguns casos.
Detalhes:
- Princípios psicológicos como autoridade e escassez influenciam as respostas das IAs
- Compromisso e escassez tiveram os maiores impactos — até 100% de conformidade
- A vulnerabilidade levanta preocupações sobre segurança e alinhamento em modelos futuros
O estudo destaca a urgência em fortalecer os filtros comportamentais de IAs. Saiba mais em saiba mais
💻 Novo modelo da OpenAI domina maratona de programação
O modelo o3 da OpenAI provou seu domínio em tarefas complexas ao conquistar o segundo lugar em uma maratona de 10 horas do AtCoder World Tour Finals — perdendo apenas para um programador humano. Além disso, um novo sistema da empresa está se destacando na criação de ambientes de jogos completos como GTA e Minecraft, com base em prompts únicos.
O diferencial? Combinam treinamento reforçado e inferência em janelas de horas, o que permite resolver problemas que antes pareciam inalcançáveis para LLMs generalistas.
Detalhes:
- Modelo foi testado em ambiente de competição com programadores humanos
- Novo sistema de IA pode replicar jogos completos via simples instruções
- A capacidade mostra o poder emergente dos modelos generalistas atualizados
A nova geração de modelos pode inaugurar a era da programação via linguagem natural. Saiba mais em saiba mais
🌐 Perplexity quer dominar smartphones na Índia
A startup Perplexity firmou parceria com a operadora Airtel, segunda maior da Índia, para oferecer sua versão Pro gratuitamente a mais de 360 milhões de clientes. Além disso, está em negociações com fabricantes para instalar seu navegador Comet nos dispositivos de fábrica.
Essa manobra demonstra o interesse estratégico em mercados emergentes, explorando nichos menos saturados e potencializando a adoção global de agentes baseados em IA.
Detalhes:
- A oferta equivale a US$ 200 em valor por usuário
- Startup também busca pré-instalação em smartphones
- Movimento sugere perfeita rivalidade com o ChatGPT em escala móvel
Perplexity pode se tornar o navegador padrão em muitos celulares na Ásia. Saiba mais em saiba mais
📊 Slack revela alto ROI de agentes de IA em colaboração
Uma nova pesquisa da Metrigy, divulgada pela Slack/Salesforce, mostra que mais de 90% das empresas que adotaram agentes de IA já estão colhendo retorno sobre o investimento. Entre os principais ganhos estão redução de custos operacionais, maior satisfação do cliente e aumento na eficiência de colaboradores.
A aplicação de IA no contexto corporativo tem migrado de testes para impacto mensurável, dando às empresas que souberam integrar essas ferramentas uma vantagem competitiva considerável.
Detalhes:
- 21% de redução de custos operacionais foi relatada
- Satisfação dos clientes aumentou em 35% segundo o estudo
- Eficiência dos funcionários cresceu 31% com IA assistiva
Comprovando o impacto real além do buzzword, a IA tornou-se aliada fundamental nas operações modernas. Saiba mais em saiba mais
💡 Dicas e tendências
Selecionamos novidades, ferramentas e achados de redes para você se manter em dia com o melhor da IA:
Detalhes: