枪手在ChatGPT上排练暴力，OpenAI发现后纠结数月不敢报警


            
        February 22, 2026
    
    
枪手在ChatGPT上排练暴力，OpenAI发现后纠结数月不敢报警


        1. OpenAI数月前发现枪手在ChatGPT上排演暴力，却在「要不要报警」中犹豫不决
去年六月，OpenAI内部的滥用监控工具标记了一组异常对话：一名用户在ChatGPT上反复描述枪击暴力场景，内容具体到触发了人工审核。几名员工查看记录后发出内部警告，认为这背后可能存在真实威胁。
2. Google高管点名两类AI创业公司难以存活，同周OpenAI推理速度突破1200 token/秒
两类AI创业模式正被上下游同时挤压。Google一位副总裁上周公开警告：靠在大模型上做薄层优化的「包装型」公司，和靠整合多家模型做路由的「聚合器型」公司，利润空间在萎缩，差异化在消失。
3. 微软游戏新CEO承诺不做「AI垃圾」，Altman称训练人类也很费电
微软游戏部门换帅，新CEO Sharma上任第一天就表态：「我们不会追求短期效率，不会让生态充斥无灵魂的AI垃圾。游戏永远是艺术，由人类创造。」

快讯

Karpathy提出「Claws」概念：LLM代理之上的新抽象层 Andrej Karpathy发文称「Claws」是LLM代理之上的新层，将编排、调度、上下文和持久化从代理中抽离出来。他买了一台Mac Mini来本地运行OpenClaw，但表示对其安全性「有点警觉」。


Arcee发布Trinity Large：400B参数MoE，每token激活13B Arcee公开Trinity系列技术报告。旗舰Trinity Large总参数400B，每token激活13B，架构包含交错局部/全局注意力、门控注意力和sigmoid路由。同期发布6B（激活1B）和26B（激活3B）两个小型版本。


前沿AI风险管理框架更新至v1.5 该框架对前沿AI模型进行五个维度的风险评估，覆盖网络攻击、说服与操纵等领域，本次更新针对大模型能力演进和代理式AI扩散做了更细粒度的分析。


开发者讨论Claude桌面端为何选择Electron 开发者Drew Breunig撰文分析Anthropic的Claude桌面应用为何采用Electron框架，文章在Hacker News引发讨论。


论文提出LLM代理的成本感知探索策略 「Calibrate-Then-Act」研究LLM代理在交互式任务中如何权衡探索成本与不确定性，例如生成代码后是否值得写测试来验证正确性，而非直接提交答案。


研究对比车载AI代理的中间反馈策略 一项45人实验对比了车载LLM助手在多步任务中实时展示进度与仅给出最终回复两种模式，聚焦驾驶等注意力敏感场景下代理式AI的用户体验。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI资讯速览:
                            
                        
            Email address (required)