模型压缩的几何直觉：折叠比剪枝更优


            
        February 23, 2026
    
    
模型压缩的几何直觉：折叠比剪枝更优


模型压缩不一定要剪枝，ICLR 2026的理论和实验表明weight folding（低秩投影）在大多数压缩率下重建误差更小。


视频生成模型开始真正响应人的肢体动作。手指级别的控制精度让XR场景变得可交互，不再只是看。


VR对话Agent终于能看着你说话了：SARAH实时生成空间感知的全身动作，300 FPS，支持流式VR部署。


也值得关注

离线RL用flow model做critic正则化，Flow Actor-Critic在D4RL和OGBench上刷新SOTA，利用flow的表达力防止Q值在数据外区域爆炸。ICLR 2026。
Agent记忆不必全用raw log，TierMem在摘要不够时才回溯原始记录，token消耗减少54%、延迟降低61%，精度只掉2个点。
多实例生成的属性泄漏问题有了系统方案，DEIG用实例级masked attention隔离不同物体的语义，AAAI 2026。
VLA模型缺3D空间理解？用残差流对齐解决，ROCKET只用4%计算量在LIBERO上达到98.5%成功率。
LLM指导RL不必一直在线，MIRA把LLM的知识存入记忆图，后续训练只查图不查模型，LLM调用量大幅减少。ICLR 2026。
向量检索的过滤策略选择可以学出来，学习型查询规划在filtered ANN上实现4倍加速，90%+召回。
医学问答不能忽略患者条件，CondMedQA是首个条件化生物医学QA基准，CGR框架根据患者条件动态剪枝知识图谱推理路径。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)