视频问答跑到2FPS,RLVR自带噪声过滤
- VideoLLM实现2FPS流式视频问答,AURA用端到端架构统一持续感知和主动响应,集成ASR+TTS已跑通可交互原型。
- Agent信息过时怎么办,ClawArena给出系统评测——64个场景覆盖动态更新下的信念维护,发现框架设计的影响接近模型能力差异的60%。
- RLVR的rollout条件天然过滤噪声标签。错误标签要生效需模型自行复现出错误答案,噪声比0.9时仍保持鲁棒。
- 测试筛代码的循环依赖用排序一致性打破,ACES只需pass/fail矩阵做leave-one-out AUC,零额外模型调用。
也值得关注
- 离散token让科学模型交了多少"几何对齐税" — 量化了tokenization对连续物理系统几何保真度的代价,换成连续输出头即可大幅改善。
- Combee让agent的知识积累从线性变成可组合 — 组合式提示学习解决现有prompt learning在agent任务上扩展性差的问题。
- LLM审稿开始检索文献、执行代码验证实验声明 — 审稿质量提升方向从"读得更仔细"变成"看得更广"。
- Snapchat用语义ID替代传统item ID的生产经验 — 覆盖推荐系统retrieval到ranking全链路的工程选型。
- 地理定位成了agentic tool use的压力测试 — 组合微弱视觉线索+多跳验证,比纯文本任务更能暴露agent推理链路弱点。
- 知识图谱triple验证用schema约束+混合知识工具集 — 多来源交叉验证减少自动构建KG的单一偏差。
- 4个便携摄像头恢复4D动态场景 — 之前需要密集多视角阵列,CVPR接收的轻量化方案。
Don't miss what's next. Subscribe to AI论文简报: