Qwen3.5-Omni扩到几百亿参数


            
        April 20, 2026
    
    
Qwen3.5-Omni扩到几百亿参数


开源omni首次摸到闭源旗舰量级：Qwen3.5-Omni扩到几百亿参数+256k上下文+MoE，工程上对准了上一代的延迟、模态切换和长上下文成本痛点，语音/视觉团队到了重新评估自建方案的时点。


LLM当裁判比当选手强，这事对评测基础设施是个红旗——基于self-judge的benchmark和reward signal可能在测一个模型自己都做不到的"能力"。


推理模型让unlearning重新定义：就算最终答案被擦掉，中间推理链会把原知识一步步推回来，CiPO把"不输出"扩展到"不走这条推理路径"。


公开信息的时间演化本身就是监督信号，Milkyway冻结基础模型只更新外挂harness就能把forecasting分数大幅拉高。


也值得关注

CBM用CLIP做概念瓶颈遇到的两个老问题 —— 预训练偏差和概念粒度，这篇用concept-wise attention给出方案，CVPR路线。
test-time把文本侧学起来检测OOD —— 对部署后无法重训的VLM应用是实用补丁。
concept erasure不再只在文本侧做 —— 加入图像协同后能更精准地擦掉不安全概念，T2I安全工具链的演进。
3DGS的高频表面重建一直是短板 —— 神经Gabor基函数给Gaussian加了频率结构，CVPR级别的质量提升。
医学CT报告生成从单体VLM改成多agent分层协作 —— 模拟临床多医生复核流程，垂直应用的agent化。
通用视频编辑+视觉特效的大规模人工标注benchmark —— HF Daily入选，视频编辑评测的基础设施。
无人机VLN长程任务的零样本方案 —— 把细粒度认知模块拆出来，比"大模型+通用prompt"扎实。
agent的RL训练数据应该跟agent行为一起进化 —— CoEvolve给出mutual evolution框架。
用层间隐状态的离散度做不确定性估计 —— 比假设隐状态如何演化更稳健，幻觉检测的新信号。
扩散模型的SNR-时间步偏差是被忽视的训练问题 —— CVPR这篇给出系统性的诊断和缓解。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)