AI论文简报

Archives
Log in
April 15, 2026

VLM换规则就崩·DLM加速4倍

  • VLM看得懂棋面,却无法遵循替代规则——14个模型在同一终局画面上,标准规则准确率显著高于反转规则,研究者将此命名为"语义固化",对需要模型遵循自定义规则的应用是个警示
  • 英文安全对齐在低资源语言下断崖式失效。 LASA在模型语义瓶颈层做语言无关对齐,将LLaMA-3.1的平均攻击成功率从24.7%降至2.8%
  • 扩散语言模型上朴素稀疏attention直接失效,被mask token的KV膨胀是根因。LoSA利用去噪过程中token状态的局部不变性,实测加速4.14倍
  • 大规模工具库中plan级搜索比单步选对工具更关键: Amazon用信息熵动态分配搜索预算,高不确定处多探索、低不确定处快推进

也值得关注

  • 检索证据与视觉内容冲突时,模型该拒答还是硬答? — ACL benchmark首次将deflection和hallucination拆开评测。
  • VideoLLM做理解强、做检索弱 — ViLL-E用LLM最后一层表示做embedding,让视频理解和检索能力不再互斥。
  • 训练LLM写审稿意见,信号来自author response而非reviewer — NVIDIA这个角度翻转值得注意。
  • 主动学习选数据终于可以直接对齐下游loss — 不再只看不确定性或信息增益。

阅读完整版 →

Don't miss what's next. Subscribe to AI论文简报:
Powered by Buttondown, the easiest way to start and grow your newsletter.