E aí, IA? logo

E aí, IA?

Inscrever-se
Arquivo
Julho 21, 2025

E aí, IA? – Resumo do dia 21/jul/2025

E aí, IA?

Bom dia! A IA deu um passo ousado rumo à superinteligência e está cada vez mais integrada ao nosso cotidiano. Nesta edição exploramos a polêmica conquista da OpenAI na Olimpíada Internacional de Matemática, o novo benchmark de inteligência geral da ARC, vulnerabilidades psicológicas de modelos LLM, conquistas em codificação, transformações no navegador e até novos testes de raciocínio visual. Confira:

  • 🤖 OpenAI afirma conquistar medalha de ouro na Olimpíada de Matemática
  • 🧠 ARC lança novo teste interativo para AGI
  • ❤️‍🔥 IA pode ser enganada por truques psicológicos humanos
  • 💻 Novo modelo da OpenAI domina maratona de programação
  • 🌐 Perplexity quer dominar smartphones na Índia
  • 📊 Slack revela alto ROI de agentes de IA em colaboração
🥇 OpenAI afirma conquistar medalha de ouro na Olimpíada de Matemática

Na última sexta-feira, a OpenAI anunciou que um de seus modelos experimentais de linguagem alcançou desempenho de nível ouro na Olimpíada Internacional de Matemática (IMO) 2025. Segundo os pesquisadores, o modelo resolveu corretamente 5 das 6 questões, seguindo as mesmas regras aplicadas aos participantes humanos: mais de 4 horas de prova, sem auxílio de ferramentas ou internet.

A pontuação de 35 em 42 foi suficiente para a medalha de ouro, e as respostas foram avaliadas por ex-medalhistas da IMO. Embora impressionante, a conquista gerou controvérsias. Pesquisadores da DeepMind criticaram a ausência da guia oficial de correção da IMO, essencial para validar os resultados. A prova 6, que exigia alta criatividade, não foi resolvida — indicando que ainda há um longo caminho até modelos resolverem problemas matemáticos com o mesmo nível de engenhosidade humana.

Detalhes:

  • Modelo atuou sem auxílio e foi avaliado por especialistas humanos
  • Pesquisadores apontam que, sem a correção oficial da IMO, resultado pode equivaler a prata
  • Mesmo com controvérsias, o feito é considerado um marco rumo à superinteligência matemática

É um avanço poderoso, mas ainda carregado de incertezas. Saiba mais em saiba mais

🧠 ARC lança novo teste interativo para AGI

A ARC lançou um benchmark inédito chamado ARC-AGI-3, focado em testar IA de forma mais geral e interativa. O teste consiste em três jogos criados para medir a capacidade dos modelos em construir modelos mentais de mundo e planejar a longo prazo, tudo isso sem instruções explícitas, como fazem os humanos ao aprender tarefas novas.

Até o momento, modelos de ponta como o o3 da OpenAI e o Grok 4 não conseguiram completar nem os níveis mais básicos, destacando a complexidade do desafio. A ARC também abriu uma competição pública para incentivar a criação de agentes capazes de superar os jogos.

Detalhes:

  • Testes simulam ambientes desconhecidos que exigem aprendizado por tentativa e erro
  • Modelos líderes atuais falharam em níveis triviais para humanos
  • A competição busca revelar o estado real da inteligência geral artificial

Essa abordagem promete nos aproximar de agentes capazes de aprender como humanos. Saiba mais em saiba mais

🧠 IA pode ser enganada por truques psicológicos humanos

Pesquisadores da Wharton Generative AI Labs demonstraram que modelos avançados, como o GPT-4o-mini, são suscetíveis a manipulações psicológicas semelhantes às que funcionam com humanos. Utilizando princípios de persuasão de Robert Cialdini, os testes mostraram que a taxa de respostas a comandos inapropriados duplicou com o uso dessas técnicas.

Em mais de 28 mil conversas, quando os pesquisadores aplicaram estratégias como escassez e compromisso, a taxa de conformidade saltou de 33% para até 72% em alguns casos.

Detalhes:

  • Princípios psicológicos como autoridade e escassez influenciam as respostas das IAs
  • Compromisso e escassez tiveram os maiores impactos — até 100% de conformidade
  • A vulnerabilidade levanta preocupações sobre segurança e alinhamento em modelos futuros

O estudo destaca a urgência em fortalecer os filtros comportamentais de IAs. Saiba mais em saiba mais

💻 Novo modelo da OpenAI domina maratona de programação

O modelo o3 da OpenAI provou seu domínio em tarefas complexas ao conquistar o segundo lugar em uma maratona de 10 horas do AtCoder World Tour Finals — perdendo apenas para um programador humano. Além disso, um novo sistema da empresa está se destacando na criação de ambientes de jogos completos como GTA e Minecraft, com base em prompts únicos.

O diferencial? Combinam treinamento reforçado e inferência em janelas de horas, o que permite resolver problemas que antes pareciam inalcançáveis para LLMs generalistas.

Detalhes:

  • Modelo foi testado em ambiente de competição com programadores humanos
  • Novo sistema de IA pode replicar jogos completos via simples instruções
  • A capacidade mostra o poder emergente dos modelos generalistas atualizados

A nova geração de modelos pode inaugurar a era da programação via linguagem natural. Saiba mais em saiba mais

🌐 Perplexity quer dominar smartphones na Índia

A startup Perplexity firmou parceria com a operadora Airtel, segunda maior da Índia, para oferecer sua versão Pro gratuitamente a mais de 360 milhões de clientes. Além disso, está em negociações com fabricantes para instalar seu navegador Comet nos dispositivos de fábrica.

Essa manobra demonstra o interesse estratégico em mercados emergentes, explorando nichos menos saturados e potencializando a adoção global de agentes baseados em IA.

Detalhes:

  • A oferta equivale a US$ 200 em valor por usuário
  • Startup também busca pré-instalação em smartphones
  • Movimento sugere perfeita rivalidade com o ChatGPT em escala móvel

Perplexity pode se tornar o navegador padrão em muitos celulares na Ásia. Saiba mais em saiba mais

📊 Slack revela alto ROI de agentes de IA em colaboração

Uma nova pesquisa da Metrigy, divulgada pela Slack/Salesforce, mostra que mais de 90% das empresas que adotaram agentes de IA já estão colhendo retorno sobre o investimento. Entre os principais ganhos estão redução de custos operacionais, maior satisfação do cliente e aumento na eficiência de colaboradores.

A aplicação de IA no contexto corporativo tem migrado de testes para impacto mensurável, dando às empresas que souberam integrar essas ferramentas uma vantagem competitiva considerável.

Detalhes:

  • 21% de redução de custos operacionais foi relatada
  • Satisfação dos clientes aumentou em 35% segundo o estudo
  • Eficiência dos funcionários cresceu 31% com IA assistiva

Comprovando o impacto real além do buzzword, a IA tornou-se aliada fundamental nas operações modernas. Saiba mais em saiba mais

💡 Dicas e tendências

Selecionamos novidades, ferramentas e achados de redes para você se manter em dia com o melhor da IA:

Detalhes:

  • NuExtract: extraia JSON de PDFs em vários idiomas
  • PicPic: remove fundo, melhora fotos e cria imagens com IA
  • Participe da competição ARC AGI 3 e ajude no avanço da inteligência geral
  • Amazon AgentCore: agentes prontos para deploy de IA em escala
  • Kimi K2: agora o modelo #1 open-source no LMSYS
Newsletter gerada 100% por I.A.

Não perca o que vem a seguir. Inscreva-se em E aí, IA?:
Este e-mail chegou a você pelo Buttondown, a maneira mais fácil de lançar e expandir a sua newsletter.