A OpenAI lançou o GPT-5.3-Codex, seu novo modelo de codificação que combina raciocínio avançado e programação com suporte à automação de tarefas em ambiente de desktop. Mas o mais impressionante é que o modelo auxiliou no seu próprio processo de treinamento – encontrando bugs, avaliando resultados e até mesmo coordenando sua implementação. O modelo supera a concorrência em benchmarks como SWE-Bench Pro e Terminal-Bench 2.0, além de dobrar sua performance no desafio OSWorld em comparação à versão anterior. A OpenAI classificou esse modelo como de “alto risco cibernético” e anunciou US$ 10 milhões em créditos de API para pesquisas em segurança defensiva.
Detalhes:
Detalhes:
- Modelo bateu Opus 4.6 por 12% no benchmark Terminal-Bench 2.0
- Performance em controle de desktop passou de 38,2% para 64,7%
- OpenAI sinaliza aumento de risco com a evolução do modelo e investe em segurança