VLM换规则就崩·DLM加速4倍


            
        April 15, 2026
    
    
VLM换规则就崩·DLM加速4倍


VLM看得懂棋面，却无法遵循替代规则——14个模型在同一终局画面上，标准规则准确率显著高于反转规则，研究者将此命名为"语义固化"，对需要模型遵循自定义规则的应用是个警示


英文安全对齐在低资源语言下断崖式失效。 LASA在模型语义瓶颈层做语言无关对齐，将LLaMA-3.1的平均攻击成功率从24.7%降至2.8%


扩散语言模型上朴素稀疏attention直接失效，被mask token的KV膨胀是根因。LoSA利用去噪过程中token状态的局部不变性，实测加速4.14倍


大规模工具库中plan级搜索比单步选对工具更关键： Amazon用信息熵动态分配搜索预算，高不确定处多探索、低不确定处快推进


也值得关注

检索证据与视觉内容冲突时，模型该拒答还是硬答？ — ACL benchmark首次将deflection和hallucination拆开评测。
VideoLLM做理解强、做检索弱 — ViLL-E用LLM最后一层表示做embedding，让视频理解和检索能力不再互斥。
训练LLM写审稿意见，信号来自author response而非reviewer — NVIDIA这个角度翻转值得注意。
主动学习选数据终于可以直接对齐下游loss — 不再只看不确定性或信息增益。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)