视频问答跑到2FPS，RLVR自带噪声过滤


            
        April 8, 2026
    
    
视频问答跑到2FPS，RLVR自带噪声过滤


VideoLLM实现2FPS流式视频问答，AURA用端到端架构统一持续感知和主动响应，集成ASR+TTS已跑通可交互原型。


Agent信息过时怎么办，ClawArena给出系统评测——64个场景覆盖动态更新下的信念维护，发现框架设计的影响接近模型能力差异的60%。


RLVR的rollout条件天然过滤噪声标签。错误标签要生效需模型自行复现出错误答案，噪声比0.9时仍保持鲁棒。


测试筛代码的循环依赖用排序一致性打破，ACES只需pass/fail矩阵做leave-one-out AUC，零额外模型调用。


也值得关注

离散token让科学模型交了多少"几何对齐税" — 量化了tokenization对连续物理系统几何保真度的代价，换成连续输出头即可大幅改善。
Combee让agent的知识积累从线性变成可组合 — 组合式提示学习解决现有prompt learning在agent任务上扩展性差的问题。
LLM审稿开始检索文献、执行代码验证实验声明 — 审稿质量提升方向从"读得更仔细"变成"看得更广"。
Snapchat用语义ID替代传统item ID的生产经验 — 覆盖推荐系统retrieval到ranking全链路的工程选型。
地理定位成了agentic tool use的压力测试 — 组合微弱视觉线索+多跳验证，比纯文本任务更能暴露agent推理链路弱点。
知识图谱triple验证用schema约束+混合知识工具集 — 多来源交叉验证减少自动构建KG的单一偏差。
4个便携摄像头恢复4D动态场景 — 之前需要密集多视角阵列，CVPR接收的轻量化方案。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)