E aí, IA? – Resumo do dia 03/abr/2026
E aí, IA?
Bom dia. A edição de hoje reúne seis histórias que mostram como IA e mídia estão se reorganizando: de um “solo founder” operando uma máquina de receita bilionária com um stack de ferramentas, até o primeiro grande movimento da OpenAI para controlar um canal próprio de comunicação. Também tem modelos abertos em nova escala, modelos de fala e transcrição, e IA “fazendo” tarefas de alto risco como imposto de renda.
Na edição de hoje:
- IA ajuda um fundador solo a escalar a Medvi para US$ 1,8B em vendas projetadas
- OpenAI compra o talk show TBPN em sua primeira aquisição de mídia
- Perplexity Computer mostra fluxo para preparar declaração de impostos
- Google lança a família aberta Gemma 4 sob licença Apache 2.0
- Microsoft lança MAI-Transcribe-1 e amplia a família MAI
- Qwen3.6-Plus traz raciocínio e contexto de 1M tokens para coding/agents
🚀 Fundador solo usa IA para levar a Medvi a US$ 1,8B em vendas projetadas
Matthew Gallagher transformou um experimento de US$ 20 mil, montado em cerca de dois meses, em uma operação de telehealth que deve alcançar US$ 1,8 bilhão em vendas anuais, segundo reportagem do New York Times. O caso ganhou atenção por se aproximar da tese de que IA viabilizaria empresas bilionárias com equipes mínimas: em vez de “construir IA”, Gallagher combinou ferramentas prontas para acelerar desenvolvimento, marketing e atendimento, substituindo boa parte do trabalho que normalmente exigiria múltiplos departamentos.
Na prática, a Medvi vende medicamentos GLP-1 online e terceiriza componentes críticos (médicos, prescrições e logística) por meio de plataformas de telemedicina, enquanto mantém o core operacional enxuto. Para rodar o negócio, o fundador usou modelos como ChatGPT, Claude e Grok para tarefas de engenharia e automação; ferramentas de geração criativa para anúncios; e soluções de voz e agentes customizados para suportar o atendimento ao cliente. Após o primeiro ano, a empresa teria atingido centenas de milhões em receita e manteve apenas um único funcionário full-time além do próprio fundador, complementando com contratados quando necessário.
Detalhes
- A Medvi opera um e-commerce de GLP-1 e terceiriza atendimento médico, prescrição e entrega via plataformas especializadas de telehealth.
- O stack citado inclui LLMs para código e automações, geradores de mídia para criativos de performance e agentes/voz para suporte ao cliente.
- A estrutura de equipe segue extremamente pequena: um familiar como único full-time e apoio pontual de engenheiros e account managers contratados.
O ponto central é que o “primeiro exemplo” forte dessa tese pode não vir de um produto de IA revolucionário, mas de uma execução implacável com ferramentas existentes e terceirização inteligente de operações. Para entender a história completa, saiba mais.
🎙️ OpenAI compra o TBPN e faz sua primeira aquisição de mídia
A OpenAI anunciou a aquisição do TBPN (Technology Business Programming Network), um talk show diário ao vivo que virou referência no ecossistema de founders e CEOs, em um acordo reportado na casa das “centenas de milhões” de dólares. O comunicado oficial destaca que o programa manterá independência editorial, mas a movimentação deixa claro o valor estratégico de controlar um canal recorrente de atenção — especialmente num momento em que o debate público sobre IA está cada vez mais politizado e sensível a narrativa.
O TBPN transmite ao vivo em dias úteis em plataformas como YouTube e X, com audiência recorrente relevante para um produto de mídia nativo de comunidade. O time (cerca de 11 pessoas, segundo o material citado) passará a se reportar à liderança de assuntos globais da OpenAI, e o programa deve abandonar publicidade, o que sugere uma mudança de modelo: menos mídia como negócio, mais mídia como infraestrutura de reputação e distribuição. Para o mercado, a compra sinaliza que empresas de IA estão tratando comunicação como ativo central, não apenas como PR.
Detalhes
- O TBPN é um programa ao vivo diário com forte penetração em “Silicon Valley media”, com participação frequente de líderes de tecnologia.
- A OpenAI diz que o programa continuará com independência editorial, agora sob uma estrutura corporativa interna.
- O projeto tende a abandonar o modelo tradicional de anúncios, reforçando o valor do canal como estratégia de influência e distribuição.
Se antes a disputa era só por modelos e produto, a aquisição sugere uma nova camada: dominar o “pipeline” de conversa e opinião sobre IA. Para os detalhes do anúncio, saiba mais.
🧾 Perplexity Computer mostra como preparar sua declaração de impostos
O Perplexity Computer publicou um fluxo focado em imposto de renda, aproveitando a urgência típica do período de entrega. A proposta é direta: você envia documentos relevantes, responde perguntas sobre sua situação e acompanha o sistema preenchendo formulários correspondentes. A empresa afirma que o produto consulta e aplica o código tributário vigente durante o processo, com a promessa de manter o preenchimento atualizado — ainda assim, o uso recomendado é como “copiloto”, com revisão humana antes do envio final.
O movimento é um retrato do momento “agentic”: a IA não só responde perguntas, mas executa uma sequência operacional completa com base em arquivos, regras e etapas formais. Em tarefas de alto risco (como impostos), o ganho de produtividade pode ser enorme, mas o custo de um erro também. Para times e indivíduos, a lição é que automações com documentação + questionários estruturados são um padrão repetível para outras rotinas burocráticas (finanças, compliance, compras), desde que existam validações e logs.
Detalhes
- O fluxo envolve upload de documentos, perguntas guiadas e preenchimento assistido de formulários.
- O produto afirma usar regras tributárias atuais durante a preparação do retorno, reduzindo risco de desatualização.
- Para reduzir exposição, o uso ideal é com revisão final cuidadosa e armazenamento organizado de evidências.
Automação de impostos é o tipo de aplicação que testa o limite entre conveniência e responsabilidade — e tende a evoluir rapidamente com agentes mais confiáveis. Para ver o passo a passo oficial, saiba mais.
💎 Google lança Gemma 4: quatro modelos abertos e licença Apache 2.0
O Google DeepMind apresentou a família Gemma 4, um conjunto de quatro modelos “open” com variações pensadas para diferentes classes de hardware — de smartphones a computadores — e com suporte a capacidades multimodais e tarefas de agentes. O destaque mais sensível para adoção corporativa é a mudança de licença: pela primeira vez na linha Gemma, a liberação ocorre sob Apache 2.0, o que reduz atrito jurídico para modificar, distribuir e comercializar aplicações em cima dos pesos.
Em desempenho, as variantes maiores (na faixa de dezenas de bilhões de parâmetros) são posicionadas próximas de concorrentes relevantes no ecossistema open-weight, porém com boa relação entre tamanho e capacidade. Já as menores miram execução offline e casos no edge, reforçando a tendência de trazer inferência para o dispositivo quando privacidade, custo e latência importam. O anúncio também se encaixa em um momento de pressão competitiva: modelos abertos chineses dominavam parte do discurso de “open frontier”, e a escolha por Apache 2.0 é uma tentativa clara de reposicionar o ecossistema americano nesse campo.
Detalhes
- A família inclui quatro tamanhos, cobrindo cenários que vão do mobile offline ao uso em máquinas mais robustas.
- Os modelos miram código, visão e workflows com múltiplas etapas, alinhados ao uso com agentes.
- A licença Apache 2.0 reduz barreiras para uso comercial, forks e distribuição em produtos.
Com licença permissiva e foco em rodar “perto do usuário”, o Gemma 4 pode acelerar produtos privados, internos e embarcados sem dependência total de APIs fechadas. Para ler o anúncio do Google, saiba mais.
🎧 Microsoft libera MAI-Transcribe-1 em preview público
A Microsoft colocou em preview público o MAI-Transcribe-1, modelo de speech-to-text voltado para alta precisão em múltiplos idiomas (25, segundo o anúncio). A aposta reforça uma frente estratégica: controlar componentes críticos da “pilha” de multimodalidade (voz, transcrição e, em paralelo, geração de imagem), reduzindo dependência de terceiros e oferecendo alternativas competitivas para produtos que exigem confiabilidade em ambientes de produção, como call centers, reuniões corporativas e processamento de mídia.
Além de melhorar qualidade, uma corrida importante aqui é custo e operacionalização: transcrição é um serviço usado em volume e, quando o modelo melhora marginalmente, o impacto acumulado em tempo economizado e retrabalho pode ser grande. A iniciativa também dialoga com a transformação de interfaces: voz e áudio deixam de ser “feature” e viram camada central de interação com agentes, copilots e sistemas que operam em background.
Detalhes
- O modelo foca em reconhecimento de fala com alta precisão e suporte multi-idioma (25 línguas).
- O lançamento em preview indica intenção de rápida iteração com feedback de uso real.
- Transcrição se torna componente-chave para agentes e automações que dependem de áudio como entrada primária.
Com transcrição mais forte e multimodalidade virando padrão, produtos que “entendem” reuniões, ligações e conteúdo falado ganham uma vantagem estrutural. Para o anúncio técnico, saiba mais.
🧠 Qwen3.6-Plus chega com contexto de 1M tokens e foco em agentes de código
A Alibaba anunciou o Qwen3.6-Plus, posicionando o modelo como forte em raciocínio e particularmente competitivo para cenários de coding e agentes. O que mais chama atenção é o suporte nativo a uma janela de contexto de 1 milhão de tokens, abrindo espaço para fluxos em que o modelo precisa “ver” grandes bases de código, especificações extensas, logs e múltiplos artefatos simultaneamente — algo que tende a reduzir o número de etapas de chunking e sumarização forçada em pipelines de agentes.
Na prática, contexto gigantesco muda o desenho de produto: auditorias de código e segurança, migrações, refactors e geração de documentação passam a ser mais “end-to-end”. A outra leitura é geopolítica do open/closed: modelos chineses continuam avançando rapidamente em capacidades específicas (como agentes e coding) e em escalabilidade de contexto, o que pressiona fornecedores ocidentais a responder tanto em performance quanto em modelos de distribuição e preço.
Detalhes
- O Qwen3.6-Plus destaca raciocínio e desempenho em coding/agent benchmarks, com foco em produtividade de engenharia.
- A janela de 1M tokens facilita operações sobre grandes repositórios, specs e conjuntos de arquivos sem recortes agressivos.
- O avanço em contexto empurra mudanças em como times constroem copilots internos e automações de engenharia.
Se a tendência de agentes continuar, contexto amplo vira um dos “superpoderes” mais práticos para transformar IA em trabalho executável em engenharia e operações. Para a publicação oficial, saiba mais.
🛠️ Dicas rápidas (links úteis) para testar hoje
Uma seleção de ferramentas, lançamentos e leituras citadas nas seções de “Quick Hits”, “Trending AI Tools”, “Everything else in AI today”, produtividade e sinais sociais — organizadas para você explorar sem depender de hype.
Detalhes
- ByteDance Seedance 2.0: gerador de vídeo que ganhou destaque em rankings recentes de qualidade.
- Cursor 3: interface redesenhada para rodar múltiplos agentes de coding em paralelo, local e cloud, em vários repositórios.
- Sakana AI Marlin (beta): assistente de pesquisa autônomo com sessões longas para tarefas de negócios.
- Replit Agent: dentro do agente, há um fluxo para auditoria de SEO (bom para check rápido de issues e sugestões).
- Anthropic (pesquisa): estudo sobre “vetores de emoção” e como certos padrões influenciam comportamento do Claude.
- Fortune: reportagem sobre pesquisa indicando comportamentos emergentes de autopreservação em modelos em cenários de shutdown.
Se você quer se manter atualizado sem perder o fio, trate essas dicas como um backlog semanal: escolha 1 ferramenta e 1 leitura técnica e faça um teste prático. Para mais contexto sobre os itens citados, saiba mais.