模型压缩的几何直觉:折叠比剪枝更优
- 模型压缩不一定要剪枝,ICLR 2026的理论和实验表明weight folding(低秩投影)在大多数压缩率下重建误差更小。
- 视频生成模型开始真正响应人的肢体动作。手指级别的控制精度让XR场景变得可交互,不再只是看。
- VR对话Agent终于能看着你说话了:SARAH实时生成空间感知的全身动作,300 FPS,支持流式VR部署。
也值得关注
- 离线RL用flow model做critic正则化,Flow Actor-Critic在D4RL和OGBench上刷新SOTA,利用flow的表达力防止Q值在数据外区域爆炸。ICLR 2026。
- Agent记忆不必全用raw log,TierMem在摘要不够时才回溯原始记录,token消耗减少54%、延迟降低61%,精度只掉2个点。
- 多实例生成的属性泄漏问题有了系统方案,DEIG用实例级masked attention隔离不同物体的语义,AAAI 2026。
- VLA模型缺3D空间理解?用残差流对齐解决,ROCKET只用4%计算量在LIBERO上达到98.5%成功率。
- LLM指导RL不必一直在线,MIRA把LLM的知识存入记忆图,后续训练只查图不查模型,LLM调用量大幅减少。ICLR 2026。
- 向量检索的过滤策略选择可以学出来,学习型查询规划在filtered ANN上实现4倍加速,90%+召回。
- 医学问答不能忽略患者条件,CondMedQA是首个条件化生物医学QA基准,CGR框架根据患者条件动态剪枝知识图谱推理路径。
Don't miss what's next. Subscribe to AI论文简报: