AI资讯速览

Archives
Log in
February 26, 2026

Anthropic撕掉安全标签,OpenAI一边反滥用一边搞监控

1. Anthropic放弃标志性安全承诺,同一周收购计算机操控公司Vercept 2023年,Anthropic立下底线:无法事先证明安全措施到位,就不训练下一代模型。这条「负责任扩展政策」是它拿到数十亿融资的信任基础。本周,底线被正式撤掉了。

2. AI编程的接口从聊天框变成了API 一个框架级项目从零到94%API覆盖率,不到一周。一个编码代理开放远程控制接口。一套代理工程方法论被系统整理成文。三件事指向同一个变化:AI编程正在从对话工具变成可编程的基础设施。

3. OpenAI同一周发威胁报告反滥用,被曝参与政府身份监控 OpenAI二月威胁报告详述了公司如何检测并封禁利用AI进行钓鱼和社交操纵的恶意账户,称这是「保护用户免受AI滥用」的核心工作。


快讯

  • Salesforce财报稳健,CEO称AI颠覆SaaS「不是第一次」 Salesforce发布年终财报,业绩表现稳健。CEO Marc Benioff在财报会上反驳「AI将杀死SaaS」的论调,称公司此前已多次应对类似的行业变局。
  • Benedict Evans:OpenAI多数用户每周只用几次,谈不上改变生活 Benedict Evans指出,如果用户平均每天想不到使用场景,AI就还没真正改变他们的生活。OpenAI自己也承认存在「能力差距」——模型能做的和用户实际做的之间有落差。广告业务部分是为了覆盖超过90%不付费用户的服务成本。
  • Simon Willison总结Agentic编程模式:红/绿TDD最有效 Simon Willison将「先写测试、再让代理实现」列为最有效的agentic编程模式。先确认测试失败(红),再让代理迭代直到测试通过(绿),用测试结果约束代理行为,而非依赖自然语言指令。
  • Gushwork融资900万美元,押注AI搜索获客 印度初创公司Gushwork完成900万美元种子轮融资,SIG和Lightspeed领投。公司为客户从ChatGPT等AI搜索工具中获取销售线索,已有早期客户牵引力。
  • 论文系统研究LLM终端代理的训练数据工程 研究者提出Terminal-Task-Gen管线,支持基于种子和技能的合成任务生成,并全面分析了数据策略对代理终端操作能力的影响。此前这一领域的训练数据方法基本未公开。
  • VLANeXt梳理视觉-语言-动作模型的关键设计选择 针对当前VLA模型领域训练协议不一致、评估设置各异的碎片化现状,研究者系统比较了不同设计选择,识别出真正影响模型性能的因素。
  • 新研究证明测试时训练本质上是线性注意力 研究者发现,基于KV绑定的测试时训练(TTT)架构可以表示为学习的线性注意力算子。这一等价关系解释了此前多个实验中的反直觉现象,并为TTT架构的改进提供了新方向。
  • SkillOrchestra用技能迁移解决多代理路由的成本问题 论文提出SkillOrchestra框架,针对现有代理路由的两个瓶颈:输入级路由粒度过粗,以及RL训练的编排器在多轮场景中反复调用最贵的模型。框架通过技能迁移在成本和性能之间取得平衡。

阅读完整版 →

Don't miss what's next. Subscribe to AI资讯速览:
Powered by Buttondown, the easiest way to start and grow your newsletter.