AI论文简报

Archives
Log in
March 18, 2026

70万对论文蒸馏品味,零空间暴露盲区

  • 社区引用信号可以训练出"品味",RLCF用70万对论文配对做偏好建模,训练出的Judge判断力超过GPT-5.2,范式可迁移到任何需要品味决策的场景。
  • 分类器的结构性盲区藏在零空间里——SING将线性映射几何决定的不变量转化为自然语言描述,部署前审计模型"对什么无感"比刷准确率更管用。
  • 模型行为对上下文措辞的敏感度远超预期。改变任务描述就能系统性调节模型表现,无论是否构成"动机",可操纵性本身是对齐问题。
  • VLA多任务瓶颈在推理系统,不在模型架构:OxyGen统一管理跨任务KV cache,共享视觉观测只算一次,多任务场景最快提速3.7倍。

也值得关注

  • 多Agent科研框架做到300+技能模块和artifact血统追溯 — 零中心协调架构,工程完整度值得关注。原文
  • 视频推理的时空定位靠RL+视觉感知提示就能改善 — 不需要额外标注数据或推理时外部工具。原文
  • FOMC声明鹰鸽解读建模为相对变化而非绝对分类 — 更贴近市场对措辞增量变化的实际反应机制。原文
  • EPFL给AdamW加谱裁剪 — 缓解大模型训练中梯度谱过度集中和范数膨胀两个顽疾。原文
  • 黑盒Trust-Region搜索在推理时对齐扩散模型 — 不要求奖励模型可微,适用范围更广(ICLR)。原文
  • 贝叶斯网络分类器编译成逻辑公式 — xAI团队让分类决策从统计黑盒变成可验证的逻辑推导。原文
  • 计算论证框架给LLM高风险决策加上推理外骨骼 — 每个结论可质疑、可追溯(Imperial College)。原文
  • 多厂商乳腺X光数据集LUMINA发布 — 能量校准协议解决跨设备泛化这个医疗AI落地的老问题(CVPR)。原文

阅读完整版 →

Don't miss what's next. Subscribe to AI论文简报:
Powered by Buttondown, the easiest way to start and grow your newsletter.