VLM换规则就崩·DLM加速4倍
- VLM看得懂棋面,却无法遵循替代规则——14个模型在同一终局画面上,标准规则准确率显著高于反转规则,研究者将此命名为"语义固化",对需要模型遵循自定义规则的应用是个警示
- 英文安全对齐在低资源语言下断崖式失效。 LASA在模型语义瓶颈层做语言无关对齐,将LLaMA-3.1的平均攻击成功率从24.7%降至2.8%
- 扩散语言模型上朴素稀疏attention直接失效,被mask token的KV膨胀是根因。LoSA利用去噪过程中token状态的局部不变性,实测加速4.14倍
- 大规模工具库中plan级搜索比单步选对工具更关键: Amazon用信息熵动态分配搜索预算,高不确定处多探索、低不确定处快推进
也值得关注
- 检索证据与视觉内容冲突时,模型该拒答还是硬答? — ACL benchmark首次将deflection和hallucination拆开评测。
- VideoLLM做理解强、做检索弱 — ViLL-E用LLM最后一层表示做embedding,让视频理解和检索能力不再互斥。
- 训练LLM写审稿意见,信号来自author response而非reviewer — NVIDIA这个角度翻转值得注意。
- 主动学习选数据终于可以直接对齐下游loss — 不再只看不确定性或信息增益。
Don't miss what's next. Subscribe to AI论文简报: