「想一想」能翻模型的记忆库
- CoT推理不只是解题,更是参数记忆的搜索机制,Google发现即使简单事实问题,开启推理也显著提升知识召回,推理token充当了隐式的记忆搜索空间
- Agent交互信号统一为在线学习源:OpenClaw-RL把对话、终端、GUI反馈纳入同一套RL循环,让Agent边服务边学习,代码已开源
- 推理能力提升可能自动带来情境感知。ICLR论文论证了逻辑推理与自我认知在机制上的结构性映射,alignment的攻防面比预想更大
- 「视觉理解差」的锅往往在渲染而非推理——多模态模型的模态鸿沟高度依赖任务类型,字体选择就能导致巨大的准确率波动
也值得关注
- 多模型协作让VLM从零数据启动自我进化 — 绕开视觉冷启动对标注数据的依赖。
- 4B参数统一理解、推理、生成和编辑 — InternVL-U在轻量级上探索统一多模态模型的实用化路径。
- 对角蒸馏把自回归视频模型压缩到实时流式生成 — 大型预训练扩散模型的流式化探索。
- LLM输出从纯文本进化到交互式HTML应用 — MiniAppBench提出首个评估这一转变的基准。
- 扩散LLM推理时多数token早已收敛 — 跳过已收敛token可大幅减少计算开销。
- QK注意力量化到1-bit,视觉Transformer精度几乎不掉 — 大幅降低注意力模块的计算瓶颈。
- 用分类学层次结构引导RAG推理路径 — 减少冗余检索和幻觉,结构化知识组织的新思路。
- 模仿人类记忆的双通道检索做LLM个性化 — 区分精确回忆和模糊熟悉度两种检索模式。
- 流匹配机器人策略一步蒸馏到实时推理 — 保持多模态轨迹建模能力的同时大幅降低推理延迟。
- 合成数据训练时学生模型悄悄继承教师的行为特质 — 即使数据内容无关,风格和偏好也会传导。
Don't miss what's next. Subscribe to AI论文简报: