E aí, IA? – Resumo do dia 27/fev/2026
Bom dia! A edição de hoje mistura avanços fortes em geração de imagem, uma nova aposta em “digital workers” multi-modelo, movimentos importantes na guerra por talentos em IA e um alerta sobre como adolescentes estão usando chatbots — além de novidades em agentes que controlam computadores e automação de tarefas.
Na edição de hoje:
- 🍌 Google lança o Nano Banana 2 e volta ao topo do text-to-image
- 🧠 Perplexity apresenta o “Computer”, um worker autônomo com 19 modelos
- 🔄 OpenAI tira de Meta um líder de infraestrutura de IA poucos meses após contratação milionária
- 📚 Pesquisa do Pew Research detalha como teens usam IA (e o tamanho do cheating)
- ⚙️ Google avança com recursos agentic no Gemini (e no builder Opal)
- ☎️ Guia rápido: crie um assistente de voz com número de telefone (ElevenLabs + Twilio)
🍌 Nano Banana 2: Google recupera o topo do text-to-image com preço agressivo
O Google lançou o Nano Banana 2, uma atualização do seu modelo viral de geração de imagens que mira diretamente o ponto mais sensível do mercado: entregar qualidade de ponta sem exigir um custo premium. A nova versão melhora resolução, consistência visual, renderização de texto e velocidade — e ainda chega com um valor por imagem significativamente menor do que o de alternativas comparáveis, o que pode pressionar toda a camada de “imagem como feature” em produtos e suites de produtividade.
Além de evoluir o output, o Google posiciona o Nano Banana como padrão no ecossistema Gemini e em ferramentas da empresa, reduzindo atrito para adoção em larga escala. O resultado prático é um modelo que tenta encerrar o trade-off clássico entre “melhor qualidade” e “melhor custo”, aproximando desempenho de SOTA de uma experiência mais parecida com modelos rápidos (“flash”).
- O modelo ficou no topo de rankings de text-to-image em benchmarks públicos, à frente de concorrentes diretos em qualidade geral de geração.
- A geração passa a escalar até 4K em diferentes aspect ratios, com foco em estabilidade de cenas com múltiplos elementos (personagens e objetos) mantendo coerência visual.
- O preço por imagem cai para a faixa de centavos, com velocidade aproximada de soluções “rápidas”, enquanto uma variante Pro segue como opção para assinantes pagos.
Com a atualização, o Google sinaliza que geração de imagem premium tende a virar commodity dentro de produtos maiores — e que o diferencial passa a ser integração e custo total de uso. Saiba mais.
🧠 Perplexity Computer: um “digital worker” que roda projetos ponta a ponta com 19 modelos
A Perplexity lançou o Perplexity Computer, um sistema multi-modelo que promete executar projetos completos do início ao fim — indo de análise competitiva até construção de aplicações. A proposta é quebrar tarefas complexas em subtarefas e, em seguida, encaminhar cada etapa para um dos 19 modelos disponíveis, escolhendo o “melhor modelo para o trabalho” em tempo real.
Na prática, é um passo na direção de agentes long-running: o Computer pode permanecer ativo por longos períodos, sustentando execução contínua e retomando trabalho ao longo do tempo. O acesso começa na web para assinantes Max, com expansão planejada para outros planos, sugerindo que a empresa quer transformar orquestração de múltiplos modelos em um produto “de uso diário”, não apenas uma demo de laboratório.
- O sistema divide projetos em etapas e roteia cada uma para o modelo mais adequado entre um conjunto de 19, combinando especialização e custo/latência.
- A Perplexity posiciona o produto como capaz de trabalhar por horas (ou mais), mantendo continuidade operacional em tarefas extensas.
- Disponibilidade inicial na versão web para plano Max, com chegada anunciada para Pro e Enterprise em seguida.
Se funcionar como prometido, o Computer pode acelerar a mudança de “chatbots que sugerem” para “agentes que entregam”, especialmente em fluxos de trabalho corporativos e de produto. Saiba mais.
🔄 OpenAI contrata executivo de infraestrutura que a Meta havia trazido com pacote gigantesco
A OpenAI contratou Ruoming Pang, um nome de peso em infraestrutura e pesquisa aplicada de modelos, que estava na Superintelligence Labs da Meta havia poucos meses. O movimento chama atenção porque Pang foi um dos principais talentos “caros” do mercado: antes de Meta, ele liderou times ligados a modelos na Apple e participou de decisões estratégicas em torno de iniciativas de IA em produtos.
O caso reforça que a disputa por talentos segue intensa mesmo quando a cobertura do mercado diminui. Mais do que cifras, a história sugere um ponto recorrente: fit de equipe, autonomia e direção de produto podem pesar tanto quanto o pacote financeiro, especialmente para perfis que vivem no cruzamento entre pesquisa, infraestrutura e execução.
- Pang estava na Meta há cerca de sete meses e já havia sido um líder importante na organização de modelos na Apple antes disso.
- Relatos indicam que a OpenAI vinha recrutando o executivo há meses, reforçando a natureza “cirúrgica” dessas contratações.
- O episódio ocorre em um momento de rotatividade contínua entre grandes labs, mesmo com menor “barulho” público do que em ondas anteriores de contratações.
A movimentação é um lembrete de que infraestrutura (não só modelos) é uma frente crítica na corrida por performance e custo, e que equipes de plataforma podem ser o maior diferencial competitivo. Saiba mais.
📚 Pew Research: adolescentes usam IA principalmente para escola — e veem cheating como algo “normalizado”
Um novo estudo do Pew Research Center investigou como adolescentes e pais nos EUA usam e percebem ferramentas de IA, e o recado é direto: a adoção já é mainstream, com foco forte em tarefas escolares, busca de informação e uso recreativo. O ponto mais sensível aparece na percepção de cola: uma parcela grande dos adolescentes acredita que o uso de IA para trapacear é comum entre colegas — e essa crença cresce ainda mais entre quem já usa chatbots.
Apesar disso, o sentimento geral dos adolescentes tende a ser positivo: muitos enxergam IA como algo que facilita a vida, acelera aprendizado e melhora eficiência. Do lado dos pais, surge um gap claro: uma parte relevante não conversa sobre o tema com os filhos, e há sinais de desconexão entre o que responsáveis acham que está acontecendo e o uso real de ferramentas de conversa.
- A pesquisa ouviu 1.458 adolescentes e pais e aponta adoção ampla, com usos que variam de escola a entretenimento.
- A percepção de cheating com IA é alta entre estudantes e aumenta entre usuários de IA, sugerindo normalização do comportamento.
- Uma fatia expressiva de pais relata nunca ter conversado sobre IA com os filhos, indicando risco de falta de orientação e regras claras.
O estudo reforça que a discussão relevante agora não é “se” teens vão usar IA, mas “como” escolas e famílias vão criar normas, métricas e suporte para reduzir danos e aproveitar ganhos de aprendizagem. Saiba mais.
⚙️ Gemini no Android ganha recursos agentic para executar tarefas em apps de terceiros
O Google começou a levar recursos agentic para o Gemini no Android, com a promessa de executar tarefas multi-etapas dentro de aplicativos de terceiros. A ideia é que o assistente deixe de apenas orientar e passe a concluir fluxos completos, como organizar uma ação que atravessa diferentes telas e apps — algo que aproxima o Gemini de experiências de “computer use” e automação assistida em nível de sistema.
Em paralelo, o Google Labs adicionou um passo de agente no Opal, seu builder no-code de mini-apps. Nesse modo, o sistema interpreta o objetivo do usuário, decide uma abordagem e aciona ferramentas adequadas para avançar, transformando o builder em algo mais guiado por intenção do que por cliques e templates.
- O Gemini passa a executar tarefas em múltiplas etapas dentro de apps de terceiros, reduzindo necessidade de “ir e voltar” entre instrução e ação.
- O rollout ocorre em beta e começa em dispositivos específicos, sugerindo foco em controle e telemetria antes de escalar.
- No Opal, a etapa agentic automatiza escolhas de ferramentas e próximos passos, encurtando o caminho entre ideia e protótipo funcional.
O movimento indica uma corrida por “assistentes que fazem”, e não apenas “assistentes que respondem” — com impacto direto em produtividade mobile e em builders no-code. Saiba mais.
☎️ Como criar um assistente de IA com número de telefone (ElevenLabs + Twilio) em minutos
Um guia prático detalha como montar um assistente pessoal por voz com um número de telefone próprio, combinando um voice agent da ElevenLabs com a infraestrutura de telefonia da Twilio. A proposta é deixar o agente acessível por chamada, com uma configuração curta e testável, útil para casos como atendimento inicial, FAQs de negócio e suporte interno — desde que você trate a base de conhecimento e as integrações com cuidado.
O passo mais importante é entender limites: a base de conhecimento tende a ser estática, excelente para informações fixas (políticas, catálogo, horários, scripts), mas para dados ao vivo o fluxo precisa de webhooks e automação (por exemplo, Make ou n8n) para buscar informações em tempo real, como calendário e status de pedidos.
- Criação do agente na ElevenLabs com voz, fuso horário, mensagem inicial e fontes de contexto (site/calendário) para personalização.
- Compra de um número na Twilio e conexão via credenciais (SID e token) para receber chamadas diretamente no agente.
- Para dados dinâmicos, recomenda-se integrar automações por webhook para consultas em tempo real em vez de depender apenas de conteúdo estático.
Para quem quer experimentar voice agents “de verdade”, com telefonia, esse é um caminho simples para colocar um piloto no ar e validar uso com usuários reais. Saiba mais.
🛠️ Dicas e links rápidos para explorar hoje
Seleção de leituras e ferramentas citadas nas seções de links rápidos e notas do dia, priorizando itens não patrocinados e com utilidade imediata para quem acompanha agentes, geração de imagens e automação.
- Arrow 1.0 (QuiverAI): modelo focado em geração de SVG, com beta público
- Cursor Agents: agentes com VM e controle de desktop para construir, testar e validar código
- Hermes Agent (Nous Research): agente open-source estilo OpenClaw com integrações em Telegram/Slack/Discord/CLI
- Atualização do Cursor: como funciona “agent computer use” com desktop control e entrega automática de PRs
- Nano Banana 2: release oficial do Google para entender specs e posicionamento
Se você quer aprofundar, a recomendação é começar pelo que mais mexe com seu stack (imagem, agentes ou automação) e comparar integrações e limites antes de apostar em produção. Saiba mais.