Julho 18, 2025
E aí, IA? – Resumo do dia 18/jul/2025
E aí, IA?
Bom dia! A edição de hoje traz os lançamentos mais quentes do mundo da inteligência artificial, incluindo a chegada de um agente autônomo revolucionário da OpenAI, avanços em compreensão de código, desempenho em competições humanas, e novas ferramentas para automação de tarefas. Fechamos com dicas imperdíveis para quem quer explorar ferramentas emergentes.
Na edição de hoje:
- 🤖 OpenAI lança ChatGPT Agent com computador próprio
- 🧠 Reflection AI lança assistente que entende código como ninguém
- 🥇 Agente de codificação da OpenAI quase vence competição mundial
- 🛠️ Gemini CLI automatiza documentação com IA
- 🎙️ Hume lança modelo de voz que captura sua personalidade
- 📊 Adobe integra efeitos sonoros gerados por IA em vídeos Firefly
A OpenAI revelou o ChatGPT Agent, uma nova funcionalidade que confere ao ChatGPT o poder de operar de forma autônoma em um ambiente computacional virtual. Isso permite que o modelo acesse terminal próprio, rode código, produza apresentações, compre produtos, gerencie e-mails e mais — tudo isso com base em comandos complexos e interrupções humanas em tempo real.
As demonstrações públicas da OpenAI evidenciaram o potencial do agente tanto para usuários corporativos quanto individuais. Ele se destacou ao executar tarefas como organização de viagens e geração de apresentações completas. Seu desempenho em benchmarks foi notável, superando ferramentas anteriores como Operator e Deep Research.
Detalhes:
- Executa múltiplas tarefas com acesso a terminal, Gmail, GitHub e APIs
- Classificado como de “alto risco biológico”, com monitoramento ao vivo e aprovações exigidas
- Obteve 41,6% no Humanity’s Last Exam, além de destaque em Frontier Math
Com esse anúncio, a OpenAI demonstra como a integração de múltiplos recursos em um único agente pode redefinir a forma como interagimos com a IA. saiba mais
A startup Reflection AI, criada por ex-pesquisadores do DeepMind, apresentou o Asimov, um agente autônomo voltado à compreensão profunda de bases de código. Diferente de assistentes que apenas geram código, o Asimov busca armazenar, raciocinar e atualizar o conhecimento técnico de times inteiros.
O sistema utiliza múltiplos conectores para capturar informações de diversas fontes — como emails, documentos técnicos e discussões no Slack — e armazenar esse conhecimento em memória persistente, acessível via linguagem natural.
Detalhes:
- Superou Claude Code com 82% de preferência em testes cegos
- Implementa controle de acesso baseado em funções
- Armazena e atualiza “memórias tribais” da equipe
Para equipes de engenharia que lidam com sistemas complexos, o Asimov é como a institucionalização da inteligência técnica. saiba mais
O agente de codificação da OpenAI obteve o segundo lugar na final do AtCoder World Tour em Tóquio. A competição, focada em desafios de otimização, teve como vencedor o programador humano "Psyho", com uma pequena margem de vantagem.
Esse foi o primeiro evento onde uma IA competiu de forma totalmente autônoma contra programadores de elite, sinalizando até onde os modelos da OpenAI evoluíram em desempenho técnico e adaptabilidade.
Detalhes:
- A diferença entre IA e humano campeão foi de apenas 9,5%
- IA completou tarefas de 10 horas sem ajuda humana
- Sakana AI testou seu próprio agente ALE, que teria ficado em 5º lugar
O resultado reforça que a era de superioridade humana em programação competitiva está se encerrando. saiba mais
O novo Gemini CLI, ferramenta de linha de comando da Google, permite gerar automaticamente README.md e documentação técnica a partir de qualquer base de código. Com comandos simples, ele analisa arquivos, cria textos explicativos, adiciona diretrizes de contribuição e atualiza documentos de API.
A proposta é eliminar tarefas repetitivas para desenvolvedores, tornando todo o processo de documentação mais fluído e menos dependente de esforço manual.
Detalhes:
- Instalado via npm e executado de terminal
- Capaz de atualizar seções específicas com prompts diretos
- Compatível com automatização de fluxos completos de trabalho
Durante um workshop recente, desenvolvedores conseguiram estruturar documentações inteiras com poucos comandos. saiba mais
A Hume AI lançou o EVI 3, nova versão do modelo de síntese de voz que não apenas clona entonação, mas também captura traços únicos como estilo de fala, vocabulário e emoção. Essa personalização transforma o uso de voz sintética em experiências mais íntimas e realistas.
Entre as aplicações estão coaches de linguagem, narradores de áudio livros e assistentes interativos para suporte técnico ou storytelling.
Detalhes:
- Baseado no já expressivo EVI 2, ampliando a fidelidade emocional
- Permite upload de gravações para imitação personalizada
- Acesso pode ser feito diretamente por API ou demo interativa
O EVI 3 marca um salto expressivo na construção de vozes digitais que soam genuinamente humanas. saiba mais
A Adobe anunciou atualizações para o Firefly, incluindo um recurso inovador: a conversão de sons gravados com a própria voz, como “Boom!” ou “Click!”, em efeitos sonoros estilizados por IA. A funcionalidade permite transformar narração bruta em trilhas sonoras profissionais para vídeos, trailers ou apresentações.
Além disso, o Firefly agora inclui controles mais avançados de composição visual e acesso a modelos externos de aprendizado visual.
Detalhes:
- Efeitos podem ser gerados apenas com texto descritivo ou gravação
- Nova interface para manipulação criativa de vídeos
- Expansão do acesso a VLMs de terceiros
Com isso, a Adobe coloca criadores independentes em pé de igualdade com grandes estúdios, democratizando a pós-produção audiovisual. saiba mais
Separamos abaixo as ferramentas e ideias mais quentes para turbinar seu dia:
Detalhes: