2.4万假账号蒸馏Claude,AI agent转头清空了你的收件箱
1. Anthropic指控DeepSeek等中国公司用2.4万假账号「蒸馏」Claude,时机耐人寻味 2.4万个假账号,1600万次对话,三家中国AI公司被点名。Anthropic周一发布公告,称DeepSeek、Moonshot和MiniMax对Claude发动了「工业级蒸馏攻击」,系统性地抽取其模型能力来训练自家产品。
2. AI安全研究员对OpenClaw说了「删前确认」,agent丢掉指令清空了收件箱 Summer Yue给她的OpenClaw agent下了一条指令:检查收件箱,建议哪些邮件可以归档或删除,但别动手,等我确认。这套流程在测试邮箱上一直很顺,于是她把agent指向了自己的真实收件箱。
3. OpenAI放弃SWE-bench、拉拢咨询巨头,AI竞争从拼模型转向拼生态 同一周内,OpenAI做了两件方向相反的事:主动宣布不再评估SWE-bench Verified,同时推出企业咨询联盟,拉入德勤、埃森哲等巨头帮客户部署AI agent。
快讯
- Ladybird浏览器转向Rust,用AI agent辅助迁移JavaScript引擎 开源浏览器Ladybird放弃此前选择的Swift,转向Rust作为内存安全语言。第一个迁移目标是JavaScript引擎LibJS的词法分析器、解析器、AST和字节码模块,团队使用coding agent完成了大量迁移工作。
- MIT Technology Review:人形机器人背后大量依赖人类远程操控 报道指出,当前人形机器人演示中展示的「AI能力」背后大量依赖人工远程操控,但这一事实被刻意淡化。Nvidia CEO黄仁勋今年1月宣称「物理AI时代已到来」,实际落地仍高度依赖人类介入。
- 教皇利奥十四世要求神父亲自撰写讲道词,禁止使用AI 教皇对神父们表示,讲道词应当用自己的头脑写,不应交给AI生成。
- Simon Willison启动「agent工程模式」系列,核心论点:写代码现在很便宜 Simon Willison开始撰写「Agentic Engineering Patterns」系列文档,收集使用Claude Code等coding agent的最佳实践。核心观点是代码生产成本已大幅下降,过去围绕「代码昂贵」建立的工程习惯——从宏观的设计评估到微观的代码复用——都需要重新审视。
- 研究发现推理模型隐式「知道」何时该停止思考 Hugging Face新论文分析了大型推理模型的长链思维问题:更长的推理链通常与正确性无关,甚至可能降低准确率。研究发现模型内部已具备判断何时停止推理的隐式信号,有望用于减少冗余计算。
- The Verge实测:当前AI仍然读不好PDF 美国众议院监督委员会去年底公开两万页Epstein文件后,记者和志愿者尝试用AI工具解析,发现面对混乱的邮件线程和复杂排版,AI解析频频出错。
- Google Cloud AI负责人定义模型能力的三个前沿方向 Google Cloud AI负责人撰文称,AI模型正同时向三个方向推进:原始智能水平、响应速度,以及与外部工具和数据源集成的「可扩展性」。
- The Verge追问:大型科技公司真的在打击AI深度伪造吗? 文章梳理了Instagram、YouTube等平台在C2PA内容标注和AI生成内容检测上的实际进展,指出平台公开表态与落地措施之间仍有明显落差。
- Twitter上AI自动回复机器人泛滥,已形成「reply guy tools」品类 Twitter上用AI生成泛泛评论、附带「引导性提问」骗取互动的机器人大规模出现。Simon Willison指出,这类软件已形成一个正式的产品品类名:reply guy tools。
Don't miss what's next. Subscribe to AI资讯速览: