专家推理结构做CoT,新类发现+13%
- 用领域专家的真实推理流程设计CoT监督,在医疗VQA中同时提升准确率和可追溯性,思路可迁移到任何需要结构化专业判断的垂直场景。CVPR接收
- 最少几个特征就能复现模型的拒绝决策:将溯因解释最小化问题转化为0-1整数规划,实际求解效率优于不保证最优的方法。方法限于线性模型,但问题框架对高风险人机协作有启发
- 训练时生成伪新类别样本来练习发现未知。 抛弃hash编码,用纯特征空间方法消除训练-推理目标错位,七个benchmark全类别准确率最高提升13.1%。CVPR接收
也值得关注
- NVIDIA发布长视频多模态理解benchmark MMOU — 联合测试视觉+音频+文本推理,暴露当前模型在跨模态联合推理上的短板。
- 用图谱分解动态路由时序预测中通道间依赖 — 兼顾Channel-Independent的泛化和Channel-Dependent的表达力,ICLR接收。
- 病理切片多分类中区分错误严重程度 — 良性误判为恶性和漏检恶性的代价完全不同,CVPR接收。
- 偏振光线索约束3D高斯重建的物理属性 — 改善反射物体的albedo和法线估计。
- 视觉重复环境下的高效RGB 3D重建pipeline — 用于基础设施自动化巡检,ICCV接收。
Don't miss what's next. Subscribe to AI论文简报: