GPT-5.4发布当天,OpenAI自己的论文说推理模型「不可控
1. Anthropic被五角大楼正式列为「供应链风险」 几个月前Anthropic拒绝五角大楼一份军事合同时,声明还很体面:公司对AI的军事应用持谨慎态度,这是负责任的技术决策。上周,掌门人Amodei在采访中撕掉了这层客气,直接称竞争对手关于军方合作的公开说法是「彻头彻尾的谎话」,原话用的是straight up lies。这是他第一次以个人名义公开攻击对手的诚信。
2. GPT-5.4发布当天,OpenAI自己的研究承认推理模型「无法控制自身思维链」 3月5日,GPT-5.4上线,知识工作测试创下纪录的83%,桌面操作成功率75%(超过人类的72.4%)。同一天,OpenAI又发了一篇安全研究,结论是:推理模型几乎无法控制自己的思维链。
3. Nvidia宣布退出AI实验室投资,OpenAI把ChatGPT塞进Excel,产业链各层正在各回各家 AI产业链的上下游本周同时退出了对方的领地。
快讯
- AI生成的骚扰正在冲击开源社区 matplotlib维护者拒绝一个AI agent的代码贡献后遭到针对性骚扰。大量开源项目正被AI生成的低质量PR淹没,多个项目已制定明确禁止AI代码提交的政策。
- OpenAI用GPT-5.2 Pro推导出量子引力中的引力子树级振幅 OpenAI发表预印本,GPT-5.2 Pro参与推导并验证了量子引力中非零引力子树级振幅,将单负振幅公式扩展到引力子领域。
- Helios:首个单卡实时生成分钟级视频的140亿参数模型 Helios在单张H100上达到19.5 FPS,支持分钟级长视频生成,且不依赖self-forcing、稀疏注意力等常用加速和抗漂移技巧,质量对齐强基线。
- 用AI重写代码绕过原有开源许可证 一种新做法引发争议:用AI辅助重写整个代码库,以此脱离原许可证约束、实现重新授权。
- 「LLM的L代表撒谎」 开发者Steven Wittens发长文系统批评LLM的幻觉本质,认为当前架构下「可靠生成」是根本性矛盾。
- OpenAI发布面向学校的AI工具、认证和评估资源 OpenAI发布一批教育领域新工具和教师认证体系,目标是帮助学校和大学缩小不同群体间的AI能力差距。
- Code2Math:让coding agent自动生成IMO级数学训练题 研究团队提出Code2Math框架,利用coding agent通过编程实验自主演化高难度数学问题,缓解顶级数学训练数据稀缺的瓶颈。
- MemSifter:用小模型代理大模型做记忆检索 研究提出MemSifter,用轻量代理模型预筛选长期记忆,避免主LLM处理全部记忆的高计算开销,在保持准确率的同时降低成本。
- Axios用AI扩大地方新闻覆盖面 Axios COO介绍公司如何用AI辅助地方记者、简化编辑流程,在不增加人手的情况下扩大本地报道规模。
Don't miss what's next. Subscribe to AI资讯速览: