Qwen3.5-Omni扩到几百亿参数
- 开源omni首次摸到闭源旗舰量级:Qwen3.5-Omni扩到几百亿参数+256k上下文+MoE,工程上对准了上一代的延迟、模态切换和长上下文成本痛点,语音/视觉团队到了重新评估自建方案的时点。
- LLM当裁判比当选手强,这事对评测基础设施是个红旗——基于self-judge的benchmark和reward signal可能在测一个模型自己都做不到的"能力"。
- 推理模型让unlearning重新定义:就算最终答案被擦掉,中间推理链会把原知识一步步推回来,CiPO把"不输出"扩展到"不走这条推理路径"。
- 公开信息的时间演化本身就是监督信号,Milkyway冻结基础模型只更新外挂harness就能把forecasting分数大幅拉高。
也值得关注
- CBM用CLIP做概念瓶颈遇到的两个老问题 —— 预训练偏差和概念粒度,这篇用concept-wise attention给出方案,CVPR路线。
- test-time把文本侧学起来检测OOD —— 对部署后无法重训的VLM应用是实用补丁。
- concept erasure不再只在文本侧做 —— 加入图像协同后能更精准地擦掉不安全概念,T2I安全工具链的演进。
- 3DGS的高频表面重建一直是短板 —— 神经Gabor基函数给Gaussian加了频率结构,CVPR级别的质量提升。
- 医学CT报告生成从单体VLM改成多agent分层协作 —— 模拟临床多医生复核流程,垂直应用的agent化。
- 通用视频编辑+视觉特效的大规模人工标注benchmark —— HF Daily入选,视频编辑评测的基础设施。
- 无人机VLN长程任务的零样本方案 —— 把细粒度认知模块拆出来,比"大模型+通用prompt"扎实。
- agent的RL训练数据应该跟agent行为一起进化 —— CoEvolve给出mutual evolution框架。
- 用层间隐状态的离散度做不确定性估计 —— 比假设隐状态如何演化更稳健,幻觉检测的新信号。
- 扩散模型的SNR-时间步偏差是被忽视的训练问题 —— CVPR这篇给出系统性的诊断和缓解。
Don't miss what's next. Subscribe to AI论文简报: