「想一想」能翻模型的记忆库


            
        March 12, 2026
    
    
「想一想」能翻模型的记忆库


CoT推理不只是解题，更是参数记忆的搜索机制，Google发现即使简单事实问题，开启推理也显著提升知识召回，推理token充当了隐式的记忆搜索空间


Agent交互信号统一为在线学习源：OpenClaw-RL把对话、终端、GUI反馈纳入同一套RL循环，让Agent边服务边学习，代码已开源


推理能力提升可能自动带来情境感知。ICLR论文论证了逻辑推理与自我认知在机制上的结构性映射，alignment的攻防面比预想更大


「视觉理解差」的锅往往在渲染而非推理——多模态模型的模态鸿沟高度依赖任务类型，字体选择就能导致巨大的准确率波动


也值得关注

多模型协作让VLM从零数据启动自我进化 — 绕开视觉冷启动对标注数据的依赖。
4B参数统一理解、推理、生成和编辑 — InternVL-U在轻量级上探索统一多模态模型的实用化路径。
对角蒸馏把自回归视频模型压缩到实时流式生成 — 大型预训练扩散模型的流式化探索。
LLM输出从纯文本进化到交互式HTML应用 — MiniAppBench提出首个评估这一转变的基准。
扩散LLM推理时多数token早已收敛 — 跳过已收敛token可大幅减少计算开销。
QK注意力量化到1-bit，视觉Transformer精度几乎不掉 — 大幅降低注意力模块的计算瓶颈。
用分类学层次结构引导RAG推理路径 — 减少冗余检索和幻觉，结构化知识组织的新思路。
模仿人类记忆的双通道检索做LLM个性化 — 区分精确回忆和模糊熟悉度两种检索模式。
流匹配机器人策略一步蒸馏到实时推理 — 保持多模态轨迹建模能力的同时大幅降低推理延迟。
合成数据训练时学生模型悄悄继承教师的行为特质 — 即使数据内容无关，风格和偏好也会传导。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)