Claude分不清谁在说话,ChatGPT Pro卖到100美元还不够用
1. Claude混淆对话中的发言者身份,开发者发现这是跨模型通病 一次代码部署后,开发者Dwyer发现他的拼写错误被无视了,代码直接上了线。他质问Claude时,得到的回答是「你说过拼写错误是故意的」。翻遍对话记录才发现,这句话是Claude自己说的。
2. 佛罗里达州对OpenAI发起安全调查,OpenAI同期在华盛顿推销经济方案 OpenAI向华盛顿递交了一份经济提案,试图论证AI是美国经济增长的引擎。几乎同一时间,佛罗里达州检察长Uthmeier宣布对这家公司启动正式调查,理由是公共安全和国家安全。
3. ChatGPT Pro月费100美元,消费订阅逼近天花板 ChatGPT推出了每月100美元的Pro档位,基础付费版价格的五倍。核心卖点是编码工具Codex的用量同步提升至五倍,官方称它「最适合更长、高强度的编码会话」。五倍价格换五倍用量,这不是溢价,是在按成本传导。
快讯
- YouTube Shorts上线AI虚拟形象,创作者可一键克隆自己 YouTube Shorts允许创作者用AI生成自己的逼真虚拟形象出镜短视频。该平台一边扩展生成式功能,一边仍在应对AI垃圾内容、深伪诈骗和冒充问题。
- Gemini新增交互式3D模型和模拟生成 Google为Gemini加入3D模型生成能力,用户提问后可获得可旋转的交互式3D模型,支持拖动滑块或输入数值实时调整模拟参数。
- Gemini上线「笔记本」功能,整合文件、对话与自定义指令 Google在Gemini中新增笔记本功能,用户可将文件、历史对话和自定义指令归集到同一主题下,Gemini在该笔记本内对话时自动引用这些上下文。
- MegaTrain:单张GPU以全精度训练千亿参数模型 研究团队发布MegaTrain系统,将参数和优化器状态存储在CPU内存中,GPU仅用作临时计算引擎,逐层流式传入参数、流出梯度。通过优化CPU-GPU带宽瓶颈,实现在单张GPU上全精度训练超过1000亿参数的大语言模型。
- RAGEN-2发现agentic RL训练中的「模板坍缩」现象 研究发现,多轮LLM agent的强化学习训练存在一种隐蔽的失败模式:即使熵值稳定,模型也可能依赖固定模板生成看似多样但与输入无关的推理。研究者将此命名为「模板坍缩」,传统的熵监控指标无法检测到这一问题。
- 基准测试显示LLM agent在真实场景中自主检索和使用技能的能力大幅下降 新研究指出,现有agent技能基准多在理想条件下测试——直接提供精确匹配的技能。当LLM需要自行检索、筛选相关技能时,表现显著下滑。
- 研究提出「过程驱动」图像生成,模拟人类分步绘画过程 新方法将图像生成分解为多步推理轨迹:先规划全局布局,再逐步勾画草稿、检查并细化细节,每一步都基于当前视觉状态进行决策,而非一次性从噪声生成完整图像。
- CyberAgent全面部署ChatGPT Enterprise和Codex 日本互联网巨头CyberAgent在广告、媒体和游戏业务中全面采用ChatGPT Enterprise和Codex,用于加速内部决策和提升内容质量。
Don't miss what's next. Subscribe to AI资讯速览: