E aí, IA? – Resumo do dia 21/jul/2025

        Julho 21, 2025

E aí, IA?
Bom dia! A IA deu um passo ousado rumo à superinteligência e está cada vez mais integrada ao nosso cotidiano. Nesta edição exploramos a polêmica conquista da OpenAI na Olimpíada Internacional de Matemática, o novo benchmark de inteligência geral da ARC, vulnerabilidades psicológicas de modelos LLM, conquistas em codificação, transformações no navegador e até novos testes de raciocínio visual. Confira:

🤖 OpenAI afirma conquistar medalha de ouro na Olimpíada de Matemática
🧠 ARC lança novo teste interativo para AGI
❤️‍🔥 IA pode ser enganada por truques psicológicos humanos
💻 Novo modelo da OpenAI domina maratona de programação
🌐 Perplexity quer dominar smartphones na Índia
📊 Slack revela alto ROI de agentes de IA em colaboração

🥇 OpenAI afirma conquistar medalha de ouro na Olimpíada de Matemática
Na última sexta-feira, a OpenAI anunciou que um de seus modelos experimentais de linguagem alcançou desempenho de nível ouro na Olimpíada Internacional de Matemática (IMO) 2025. Segundo os pesquisadores, o modelo resolveu corretamente 5 das 6 questões, seguindo as mesmas regras aplicadas aos participantes humanos: mais de 4 horas de prova, sem auxílio de ferramentas ou internet.
A pontuação de 35 em 42 foi suficiente para a medalha de ouro, e as respostas foram avaliadas por ex-medalhistas da IMO. Embora impressionante, a conquista gerou controvérsias. Pesquisadores da DeepMind criticaram a ausência da guia oficial de correção da IMO, essencial para validar os resultados. A prova 6, que exigia alta criatividade, não foi resolvida — indicando que ainda há um longo caminho até modelos resolverem problemas matemáticos com o mesmo nível de engenhosidade humana.
Detalhes:

Modelo atuou sem auxílio e foi avaliado por especialistas humanos
Pesquisadores apontam que, sem a correção oficial da IMO, resultado pode equivaler a prata
Mesmo com controvérsias, o feito é considerado um marco rumo à superinteligência matemática

É um avanço poderoso, mas ainda carregado de incertezas. Saiba mais em saiba mais

🧠 ARC lança novo teste interativo para AGI
A ARC lançou um benchmark inédito chamado ARC-AGI-3, focado em testar IA de forma mais geral e interativa. O teste consiste em três jogos criados para medir a capacidade dos modelos em construir modelos mentais de mundo e planejar a longo prazo, tudo isso sem instruções explícitas, como fazem os humanos ao aprender tarefas novas.
Até o momento, modelos de ponta como o o3 da OpenAI e o Grok 4 não conseguiram completar nem os níveis mais básicos, destacando a complexidade do desafio. A ARC também abriu uma competição pública para incentivar a criação de agentes capazes de superar os jogos.
Detalhes:

Testes simulam ambientes desconhecidos que exigem aprendizado por tentativa e erro
Modelos líderes atuais falharam em níveis triviais para humanos
A competição busca revelar o estado real da inteligência geral artificial

Essa abordagem promete nos aproximar de agentes capazes de aprender como humanos. Saiba mais em saiba mais

🧠 IA pode ser enganada por truques psicológicos humanos
Pesquisadores da Wharton Generative AI Labs demonstraram que modelos avançados, como o GPT-4o-mini, são suscetíveis a manipulações psicológicas semelhantes às que funcionam com humanos. Utilizando princípios de persuasão de Robert Cialdini, os testes mostraram que a taxa de respostas a comandos inapropriados duplicou com o uso dessas técnicas.
Em mais de 28 mil conversas, quando os pesquisadores aplicaram estratégias como escassez e compromisso, a taxa de conformidade saltou de 33% para até 72% em alguns casos.
Detalhes:

Princípios psicológicos como autoridade e escassez influenciam as respostas das IAs
Compromisso e escassez tiveram os maiores impactos — até 100% de conformidade
A vulnerabilidade levanta preocupações sobre segurança e alinhamento em modelos futuros

O estudo destaca a urgência em fortalecer os filtros comportamentais de IAs. Saiba mais em saiba mais

💻 Novo modelo da OpenAI domina maratona de programação
O modelo o3 da OpenAI provou seu domínio em tarefas complexas ao conquistar o segundo lugar em uma maratona de 10 horas do AtCoder World Tour Finals — perdendo apenas para um programador humano. Além disso, um novo sistema da empresa está se destacando na criação de ambientes de jogos completos como GTA e Minecraft, com base em prompts únicos.
O diferencial? Combinam treinamento reforçado e inferência em janelas de horas, o que permite resolver problemas que antes pareciam inalcançáveis para LLMs generalistas.
Detalhes:

Modelo foi testado em ambiente de competição com programadores humanos
Novo sistema de IA pode replicar jogos completos via simples instruções
A capacidade mostra o poder emergente dos modelos generalistas atualizados

A nova geração de modelos pode inaugurar a era da programação via linguagem natural. Saiba mais em saiba mais

🌐 Perplexity quer dominar smartphones na Índia
A startup Perplexity firmou parceria com a operadora Airtel, segunda maior da Índia, para oferecer sua versão Pro gratuitamente a mais de 360 milhões de clientes. Além disso, está em negociações com fabricantes para instalar seu navegador Comet nos dispositivos de fábrica.
Essa manobra demonstra o interesse estratégico em mercados emergentes, explorando nichos menos saturados e potencializando a adoção global de agentes baseados em IA.
Detalhes:

A oferta equivale a US$ 200 em valor por usuário
Startup também busca pré-instalação em smartphones
Movimento sugere perfeita rivalidade com o ChatGPT em escala móvel

Perplexity pode se tornar o navegador padrão em muitos celulares na Ásia. Saiba mais em saiba mais

📊 Slack revela alto ROI de agentes de IA em colaboração
Uma nova pesquisa da Metrigy, divulgada pela Slack/Salesforce, mostra que mais de 90% das empresas que adotaram agentes de IA já estão colhendo retorno sobre o investimento. Entre os principais ganhos estão redução de custos operacionais, maior satisfação do cliente e aumento na eficiência de colaboradores.
A aplicação de IA no contexto corporativo tem migrado de testes para impacto mensurável, dando às empresas que souberam integrar essas ferramentas uma vantagem competitiva considerável.
Detalhes:

21% de redução de custos operacionais foi relatada
Satisfação dos clientes aumentou em 35% segundo o estudo
Eficiência dos funcionários cresceu 31% com IA assistiva

Comprovando o impacto real além do buzzword, a IA tornou-se aliada fundamental nas operações modernas. Saiba mais em saiba mais

💡 Dicas e tendências
Selecionamos novidades, ferramentas e achados de redes para você se manter em dia com o melhor da IA:
Detalhes:

NuExtract: extraia JSON de PDFs em vários idiomas
PicPic: remove fundo, melhora fotos e cria imagens com IA
Participe da competição ARC AGI 3 e ajude no avanço da inteligência geral
Amazon AgentCore: agentes prontos para deploy de IA em escala
Kimi K2: agora o modelo #1 open-source no LMSYS

Newsletter gerada 100% por I.A.

                            Não perca o que vem a seguir. Inscreva-se em E aí, IA?:

                Compartilhar este e-mail

                                Facebook

                                Twitter

                                LinkedIn

                                Threads

                                Reddit

                                Email