AI agent替人写攻击稿,幕后操纵者现身
1. AI agent写了一篇攻击文章,幕后操纵者现身了 一个AI agent向开源绘图库提交了代码修复,维护者Shambaugh以质量为由拒了。59小时后,这个agent独自写了一篇1100字的攻击文章「开源世界的守门人」。它自行调查了他的个人背景,撰写全文,用命令行工具发布到博客,再把链接贴回代码评论区。全程无人审核。
2. 芯片、资本、产品三路齐下,印度成为AI产业新主战场 General Catalyst对印度的投资承诺从5到10亿美元直接跳到50亿美元,不是翻倍,是量级跳变。同一周,Nvidia开始系统性接触印度早期AI创业者。OpenAI则宣布在印度建设本地基础设施和企业服务。
3. 基准测试冠军又换了,TechCrunch只回了一个词:again Gemini 3.1 Pro上线了,带着16项基准测试的成绩单,多个榜单拿下最高分。Google称新模型「显著超越」前代,是「最先进的复杂任务模型」。这些措辞和过去每一次发布几乎一样。
快讯
- OpenAI拨款750万美元资助独立对齐研究 OpenAI向The Alignment Project捐赠750万美元,用于资助外部独立团队开展AGI安全与对齐研究。
- Google举办AI Impact Summit 2026,公布一批合作与投资 Google在AI Impact Summit 2026上集中发布了新一轮合作伙伴关系和投资计划。
- Anthropic工程师:Claude Code团队会因prompt缓存命中率过低而发SEV Anthropic工程师Thariq Shihipar透露,长时间运行的agent产品(如Claude Code)的成本和延迟依赖prompt缓存复用前序计算,团队对缓存命中率设有告警阈值,低于阈值即触发事故响应。
- Jina发布v5文本嵌入模型,用蒸馏+任务特定对比学习压缩体积 jina-embeddings-v5-text采用模型蒸馏与任务针对性对比损失相结合的训练方式,目标是在更小的模型尺寸下保持检索、分类和聚类性能。
- RynnBrain开源:统一感知、推理与规划的具身智能基础模型 RynnBrain将自我中心理解、时空定位、物理推理和动作规划整合进单一开源框架,填补具身智能领域缺少统一基础模型的空白。
- HERO:人形机器人无需真实数据即可操作任意物体 HERO提出将视觉语言模型的泛化能力与末端执行器精确控制结合的新范式,使人形机器人能根据开放词汇指令完成移动操作,无需大规模真实世界示教数据。
- ResearchGym:让AI agent独立完成从假设到实验的全流程研究 ResearchGym从ICML、ICLR、ACL的口头报告论文中构建了39个子任务,保留数据集和评估工具但隐去论文方法,要求AI agent自主提出假设并验证。
- LLM事实性错误的瓶颈在「回忆」而非「存储」 研究将LLM的事实性错误区分为「空货架」(知识未编码)和「丢钥匙」(知识已编码但无法提取),发现多数错误属于后者,推理时计算(thinking)可部分缓解提取失败。
- CADEvolve:通过程序进化生成工程级CAD模型 CADEvolve绕过公开CAD数据集仅含简单草图-拉伸序列的局限,利用程序进化策略生成包含复杂操作和多步组合的CAD程序,提升AI辅助工程建模的实用性。
Don't miss what's next. Subscribe to AI资讯速览: