A Nous Research apresentou ao mundo o Nomos-1, um sistema de raciocínio com 30 bilhões de parâmetros que alcançou uma pontuação impressionante de 87/120 no Putnam Contest, uma das competições de matemática mais difíceis do mundo. O modelo foi capaz de superar gigantes como o Qwen-3, demonstrando um salto significativo no raciocínio matemático por IA.
A pontuação obtida pelo Nomos-1 teria garantido o segundo lugar entre mais de 4.000 participantes humanos no ano anterior, incluindo notas máximas em oito problemas. Além disso, a Nous também disponibilizou o código de orquestração responsável por controlar como o modelo resolve os problemas.
O resultado evidencia que o diferencial do desempenho veio da qualidade do modelo em si, e não apenas da infraestrutura ao redor.
Agora, até problemas matemáticos avançados estão ao alcance de modelos acessíveis e abertos. saiba mais
Detalhes:
- Nomos-1 usa uma abordagem em duas fases: resolução e autoavaliação, seguida por uma seleção estilo torneio.
- A pontuação de 87/120 colocaria o modelo em segundo lugar entre humanos em 2024.
- O código de raciocínio também foi open-sourced para uso da comunidade.