70万对论文蒸馏品味，零空间暴露盲区


            
        March 18, 2026
    
    
70万对论文蒸馏品味，零空间暴露盲区


社区引用信号可以训练出"品味"，RLCF用70万对论文配对做偏好建模，训练出的Judge判断力超过GPT-5.2，范式可迁移到任何需要品味决策的场景。


分类器的结构性盲区藏在零空间里——SING将线性映射几何决定的不变量转化为自然语言描述，部署前审计模型"对什么无感"比刷准确率更管用。


模型行为对上下文措辞的敏感度远超预期。改变任务描述就能系统性调节模型表现，无论是否构成"动机"，可操纵性本身是对齐问题。


VLA多任务瓶颈在推理系统，不在模型架构：OxyGen统一管理跨任务KV cache，共享视觉观测只算一次，多任务场景最快提速3.7倍。


也值得关注

多Agent科研框架做到300+技能模块和artifact血统追溯 — 零中心协调架构，工程完整度值得关注。原文
视频推理的时空定位靠RL+视觉感知提示就能改善 — 不需要额外标注数据或推理时外部工具。原文
FOMC声明鹰鸽解读建模为相对变化而非绝对分类 — 更贴近市场对措辞增量变化的实际反应机制。原文
EPFL给AdamW加谱裁剪 — 缓解大模型训练中梯度谱过度集中和范数膨胀两个顽疾。原文
黑盒Trust-Region搜索在推理时对齐扩散模型 — 不要求奖励模型可微，适用范围更广（ICLR）。原文
贝叶斯网络分类器编译成逻辑公式 — xAI团队让分类决策从统计黑盒变成可验证的逻辑推导。原文
计算论证框架给LLM高风险决策加上推理外骨骼 — 每个结论可质疑、可追溯（Imperial College）。原文
多厂商乳腺X光数据集LUMINA发布 — 能量校准协议解决跨设备泛化这个医疗AI落地的老问题（CVPR）。原文

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)