枪手在ChatGPT上排练暴力,OpenAI发现后纠结数月不敢报警
1. OpenAI数月前发现枪手在ChatGPT上排演暴力,却在「要不要报警」中犹豫不决 去年六月,OpenAI内部的滥用监控工具标记了一组异常对话:一名用户在ChatGPT上反复描述枪击暴力场景,内容具体到触发了人工审核。几名员工查看记录后发出内部警告,认为这背后可能存在真实威胁。
2. Google高管点名两类AI创业公司难以存活,同周OpenAI推理速度突破1200 token/秒 两类AI创业模式正被上下游同时挤压。Google一位副总裁上周公开警告:靠在大模型上做薄层优化的「包装型」公司,和靠整合多家模型做路由的「聚合器型」公司,利润空间在萎缩,差异化在消失。
3. 微软游戏新CEO承诺不做「AI垃圾」,Altman称训练人类也很费电 微软游戏部门换帅,新CEO Sharma上任第一天就表态:「我们不会追求短期效率,不会让生态充斥无灵魂的AI垃圾。游戏永远是艺术,由人类创造。」
快讯
- Karpathy提出「Claws」概念:LLM代理之上的新抽象层 Andrej Karpathy发文称「Claws」是LLM代理之上的新层,将编排、调度、上下文和持久化从代理中抽离出来。他买了一台Mac Mini来本地运行OpenClaw,但表示对其安全性「有点警觉」。
- Arcee发布Trinity Large:400B参数MoE,每token激活13B Arcee公开Trinity系列技术报告。旗舰Trinity Large总参数400B,每token激活13B,架构包含交错局部/全局注意力、门控注意力和sigmoid路由。同期发布6B(激活1B)和26B(激活3B)两个小型版本。
- 前沿AI风险管理框架更新至v1.5 该框架对前沿AI模型进行五个维度的风险评估,覆盖网络攻击、说服与操纵等领域,本次更新针对大模型能力演进和代理式AI扩散做了更细粒度的分析。
- 开发者讨论Claude桌面端为何选择Electron 开发者Drew Breunig撰文分析Anthropic的Claude桌面应用为何采用Electron框架,文章在Hacker News引发讨论。
- 论文提出LLM代理的成本感知探索策略 「Calibrate-Then-Act」研究LLM代理在交互式任务中如何权衡探索成本与不确定性,例如生成代码后是否值得写测试来验证正确性,而非直接提交答案。
- 研究对比车载AI代理的中间反馈策略 一项45人实验对比了车载LLM助手在多步任务中实时展示进度与仅给出最终回复两种模式,聚焦驾驶等注意力敏感场景下代理式AI的用户体验。
Don't miss what's next. Subscribe to AI资讯速览: