OpenAI转向专用小模型,Google拿你的数据换AI优势
1. AI实验室不再比「最强」,OpenAI和Mistral同时押注专用工具型模型 GPT-5.4旗舰版发布不到一周,又出了mini和nano两个小版本。但这两个模型不是廉价替代品,从一开始就不是给人用的。
2. 五角大楼要用机密数据训练AI,但同一技术可能已在流向伊朗 一批永远不能公开审计、不能独立做安全测试的AI模型,正在美国国防部的计划中成形。据MIT Technology Review报道,五角大楼正与AI公司讨论在安全设施内用机密数据训练军方专属模型。这不是采购商用AI来部署,而是把训练管道本身军事化。
3. Google免费开放「个人智能」,拿用户数据换AI竞争力 Google在大模型竞赛中一直扮演追赶者,但本周二换了个打法。它把「个人智能」功能免费开放给全美用户,让Gemini直接读取搜索记录、邮件和浏览历史来回答问题。此前这项功能只有付费订阅者才能用。
快讯
- Microsoft任命新Copilot负责人,统一消费端与企业端团队 Microsoft再次调整AI高管架构,将此前分别负责消费者和企业版Copilot的团队合并,由新负责人统一管理。调整旨在解决两条产品线长期各自为战的问题。
- OpenAI:美国用户每天向ChatGPT发送近300万条薪资相关提问 OpenAI发布研究称,大量用户使用ChatGPT查询薪酬和收入信息,正在帮助缩小劳动力市场的薪资信息差。
- Google发布AI驱动的开源安全工具 Google宣布对开源安全领域追加投资,推出新的AI安全工具和代码安全功能,覆盖漏洞检测和代码审计环节。
- OpenSeeker完整开源搜索agent训练数据,降低深度搜索开发门槛 团队发布OpenSeeker,首个完整开源搜索agent训练数据集。此前高性能搜索agent的开发因缺乏公开高质量训练数据,基本被大厂垄断。
- 首尔世界模型:基于真实街景的城市级视频生成 研究团队发布Seoul World Model(SWM),通过检索增强调节机制,将自回归视频生成锚定在首尔的真实街景图像上,实现城市规模的世界模拟。
- VET-Bench测试显示当前视觉语言模型无法完成基础物体追踪 新基准VET-Bench使用外观完全相同的物体,要求模型仅凭时空连续性进行追踪。测试结果:当前最强视觉语言模型表现接近随机猜测水平。
- MoDA机制让attention head跨层回溯,缓解深层LLM信号衰减 研究提出Mixture-of-Depths Attention,允许每个attention head同时关注当前层的序列KV对和前序层的深度KV对,配合硬件感知设计,改善深层大模型中浅层有效特征被逐层稀释的问题。
- RLCF:用社区反馈训练AI的科研品味 研究提出Reinforcement Learning from Community Feedback范式,利用大规模学术社区反馈信号训练模型判断和提出高潜力研究方向,聚焦此前被忽视的科研品味能力而非执行能力。
- EnterpriseOps-Gym:面向企业场景的agent规划评测基准 新基准模拟企业环境中的长期规划任务,包含持续状态变更和严格权限控制,填补现有评测未覆盖真实企业复杂性的空白。
- 向混合xLSTM架构蒸馏Transformer实现无损知识迁移 研究定义了基于容差修正胜率的「无损蒸馏」标准,将Transformer LLM蒸馏到次二次复杂度的混合xLSTM架构中,在多项下游任务上达到与教师模型持平的表现。
Don't miss what's next. Subscribe to AI资讯速览: