AI论文简报

Archives
Log in
March 23, 2026

12B超GPT-4,蒸馏后学生反超教师

  • 生成式推荐的"泛化优势"在token级别退化为记忆重组,按实例融合两种范式比选边站更务实。
  • 安全合规评估因标准明确、专家稀缺成为Agent理想场景:领域微调能识别通用模型遗漏的行业风险,但上下文窗口是实际瓶颈。
  • 长序列web任务的瓶颈是缺少中间检查点,子目标分解让12B开源模型成功率从6.4%跳到43%,超过GPT-4级系统。
  • 离散扩散首次有了有效蒸馏方案——D-MMD在文本和图像两域验证,学生模型反超教师。

也值得关注

  • 2D基础模型到底懂不懂3D? — 系统测试多个模型的隐含3D能力,用Agent框架引导生成完整3D场景。
  • 用逻辑流引导长视频主动定位 — 避免逐帧暴力解析,大幅降低计算开销。
  • 多人视频中身份和属性的精准绑定 — 解决多人场景下属性错配的老问题。
  • 单细胞基础模型迁移到空间转录组 — 从组织切片图像直接预测基因表达,降低空间组学成本。
  • 连续环境中的听视觉导航 — 脱离预计算房间脉冲响应的限制,让声音引导的导航更接近真实部署。
  • 多模态图网络生成风格一致的室内场景 — 用rectified flow做几何和外观的联合生成。
  • 自动驾驶建图的失效模式拆解 — 诊断框架区分模型是在记忆输入特征还是真正泛化。
  • VLM属性解耦做跨域行人重识别 — 利用视觉语言模型的属性分离能力,提升终身学习场景下的检索鲁棒性。
  • LED闪烁+事件相机实现毫秒级动捕 — 绕过传统帧率限制,运动时序精度达到毫秒级。

阅读完整版 →

Don't miss what's next. Subscribe to AI论文简报:
Powered by Buttondown, the easiest way to start and grow your newsletter.