Anthropic撕掉安全标签，OpenAI一边反滥用一边搞监控


            
        February 26, 2026
    
    
Anthropic撕掉安全标签，OpenAI一边反滥用一边搞监控


        1. Anthropic放弃标志性安全承诺，同一周收购计算机操控公司Vercept
2023年，Anthropic立下底线：无法事先证明安全措施到位，就不训练下一代模型。这条「负责任扩展政策」是它拿到数十亿融资的信任基础。本周，底线被正式撤掉了。
2. AI编程的接口从聊天框变成了API
一个框架级项目从零到94%API覆盖率，不到一周。一个编码代理开放远程控制接口。一套代理工程方法论被系统整理成文。三件事指向同一个变化：AI编程正在从对话工具变成可编程的基础设施。
3. OpenAI同一周发威胁报告反滥用，被曝参与政府身份监控
OpenAI二月威胁报告详述了公司如何检测并封禁利用AI进行钓鱼和社交操纵的恶意账户，称这是「保护用户免受AI滥用」的核心工作。

快讯

Salesforce财报稳健，CEO称AI颠覆SaaS「不是第一次」 Salesforce发布年终财报，业绩表现稳健。CEO Marc Benioff在财报会上反驳「AI将杀死SaaS」的论调，称公司此前已多次应对类似的行业变局。


Benedict Evans：OpenAI多数用户每周只用几次，谈不上改变生活 Benedict Evans指出，如果用户平均每天想不到使用场景，AI就还没真正改变他们的生活。OpenAI自己也承认存在「能力差距」——模型能做的和用户实际做的之间有落差。广告业务部分是为了覆盖超过90%不付费用户的服务成本。


Simon Willison总结Agentic编程模式：红/绿TDD最有效 Simon Willison将「先写测试、再让代理实现」列为最有效的agentic编程模式。先确认测试失败（红），再让代理迭代直到测试通过（绿），用测试结果约束代理行为，而非依赖自然语言指令。


Gushwork融资900万美元，押注AI搜索获客 印度初创公司Gushwork完成900万美元种子轮融资，SIG和Lightspeed领投。公司为客户从ChatGPT等AI搜索工具中获取销售线索，已有早期客户牵引力。


论文系统研究LLM终端代理的训练数据工程 研究者提出Terminal-Task-Gen管线，支持基于种子和技能的合成任务生成，并全面分析了数据策略对代理终端操作能力的影响。此前这一领域的训练数据方法基本未公开。


VLANeXt梳理视觉-语言-动作模型的关键设计选择 针对当前VLA模型领域训练协议不一致、评估设置各异的碎片化现状，研究者系统比较了不同设计选择，识别出真正影响模型性能的因素。


新研究证明测试时训练本质上是线性注意力 研究者发现，基于KV绑定的测试时训练（TTT）架构可以表示为学习的线性注意力算子。这一等价关系解释了此前多个实验中的反直觉现象，并为TTT架构的改进提供了新方向。


SkillOrchestra用技能迁移解决多代理路由的成本问题 论文提出SkillOrchestra框架，针对现有代理路由的两个瓶颈：输入级路由粒度过粗，以及RL训练的编排器在多轮场景中反复调用最贵的模型。框架通过技能迁移在成本和性能之间取得平衡。

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI资讯速览:
                            
                        
            Email address (required)