配比成本降35倍,显眼词劫持推理38倍
- 数据配比从训前超参变为训后优化,OptiMer为每个数据集单独训模型后在参数空间搜索最优合并权重,搜索成本降低15-35倍。
- 表面线索对LLM推理方向的劫持力是目标约束的8-38倍:跨六个模型呈现稳定sigmoid曲线,但一句最小提示就能恢复15个百分点。
- 双流DiT从架构内部统一文本语义和空间结构——MMFace-DiT在人脸生成上比六个SOTA提升40%,单模型适配多种空间条件。
也值得关注
- 自动化科学发现的评估器一旦固定,搜索过程会学会应试而非学会机制 — 让评估器和发现过程对抗演化,避免reward hacking。
- 用噪声预训练隐式神经表示,收敛性和近似质量显著提升 — CVPR工作,挑战了初始化必须数据驱动的假设。
- 从全景图逐步扩展生成沉浸式3D场景 — CVPR工作,解决现有方法在空间一致性和可控性上的两难。
- CMU的多语言音素识别实验方案 — 系统性验证怎么让英语预训练表示泛化到低资源语言。
Don't miss what's next. Subscribe to AI论文简报: