AI论文简报

Archives
Log in
April 20, 2026

Qwen3.5-Omni扩到几百亿参数

  • 开源omni首次摸到闭源旗舰量级:Qwen3.5-Omni扩到几百亿参数+256k上下文+MoE,工程上对准了上一代的延迟、模态切换和长上下文成本痛点,语音/视觉团队到了重新评估自建方案的时点。
  • LLM当裁判比当选手强,这事对评测基础设施是个红旗——基于self-judge的benchmark和reward signal可能在测一个模型自己都做不到的"能力"。
  • 推理模型让unlearning重新定义:就算最终答案被擦掉,中间推理链会把原知识一步步推回来,CiPO把"不输出"扩展到"不走这条推理路径"。
  • 公开信息的时间演化本身就是监督信号,Milkyway冻结基础模型只更新外挂harness就能把forecasting分数大幅拉高。

也值得关注

  • CBM用CLIP做概念瓶颈遇到的两个老问题 —— 预训练偏差和概念粒度,这篇用concept-wise attention给出方案,CVPR路线。
  • test-time把文本侧学起来检测OOD —— 对部署后无法重训的VLM应用是实用补丁。
  • concept erasure不再只在文本侧做 —— 加入图像协同后能更精准地擦掉不安全概念,T2I安全工具链的演进。
  • 3DGS的高频表面重建一直是短板 —— 神经Gabor基函数给Gaussian加了频率结构,CVPR级别的质量提升。
  • 医学CT报告生成从单体VLM改成多agent分层协作 —— 模拟临床多医生复核流程,垂直应用的agent化。
  • 通用视频编辑+视觉特效的大规模人工标注benchmark —— HF Daily入选,视频编辑评测的基础设施。
  • 无人机VLN长程任务的零样本方案 —— 把细粒度认知模块拆出来,比"大模型+通用prompt"扎实。
  • agent的RL训练数据应该跟agent行为一起进化 —— CoEvolve给出mutual evolution框架。
  • 用层间隐状态的离散度做不确定性估计 —— 比假设隐状态如何演化更稳健,幻觉检测的新信号。
  • 扩散模型的SNR-时间步偏差是被忽视的训练问题 —— CVPR这篇给出系统性的诊断和缓解。

阅读完整版 →

Don't miss what's next. Subscribe to AI论文简报:
Powered by Buttondown, the easiest way to start and grow your newsletter.