AI资讯速览

Archives
Log in
March 13, 2026

xAI只剩2个创始人,AI识别救命也能害命

1. 同是AI识别技术,一个把无辜祖母送进监狱,一个在澳洲偏远社区筛查心脏病 北达科他州一位祖母因AI人脸识别的错误匹配,被当作欺诈嫌疑人逮捕,关了数月。她没有犯罪记录,和真正的嫌疑人也不像,但警方拿到匹配结果后直接抓人,没做任何人工复核。

2. AI助手接管外卖、游戏和二手交易,三大平台争夺「替你办事」入口 对着手机说「帮我点杯咖啡」,Gemini自动打开外卖app、选好饮品、完成下单。这个场景本周在三星和Google最新机型上成了现实,首批支持外卖和打车两类app。

3. xAI创始团队只剩2人,Musk称要「从地基重建」 xAI的编程产品团队负责人上周告诉同事,他要走了。这位联合创始人被Musk指责为产品表现不力的责任人,随后被解除核心职务。同一周,另一位联合创始人也离开了公司。


快讯

  • Anthropic Claude新增图表和可视化生成能力 Claude现在可以在对话中直接生成图表、流程图等可视化内容。当Claude判断视觉呈现有助于理解时,会将图像嵌入对话流中,而非放在侧边栏。
  • Netflix与Ben Affleck押注定制AI模型用于电影制作 好莱坞开始转向为特定影片训练专用AI模型,而非依赖Sora、Veo等通用视频生成工具。Netflix等公司认为,通用模型的输出质量不足以用于正式制作流程,定制模型才是可行路径。
  • 「Can I Run AI Locally」上线,帮用户判断本地硬件能跑哪些模型 一个新工具网站上线Hacker News热榜,用户可查询自己的硬件配置能否本地运行特定AI模型。
  • 研究提出用执行录屏视频评估计算机操作agent 一篇新论文提出通过agent执行过程的屏幕录像关键帧来判断任务是否完成,不依赖agent内部推理或动作日志。该方法与具体agent架构无关,但需解决画面高度冗余和关键线索局部化的问题。
  • IndexCache通过跨层索引复用加速稀疏注意力 针对长上下文agent工作流,研究者提出IndexCache方法,解决DeepSeek Sparse Attention中索引器本身仍为O(L²)复杂度的瓶颈,通过跨层复用索引降低计算开销。
  • Spatial-TTT:用测试时训练实现流式视觉空间理解 研究者提出Spatial-TTT方法,让模型在处理连续视频流时通过测试时训练持续更新空间信息,解决传统方法无法在无限长视频流中有效保留和组织空间证据的问题。
  • MADQA基准测试:多模态agent在文档集合中是策略推理还是随机搜索? 研究者发布包含2250个问题和800份PDF文档的MADQA基准,基于经典测试理论设计,用于区分多模态agent究竟具备真正的策略推理能力,还是仅在做随机试错。
  • GOLF框架让强化学习利用自然语言反馈引导探索 新提出的GOLF框架将大语言模型与环境交互中获得的自然语言反馈聚合为组级信号,用于指导强化学习的定向探索,而非仅依赖标量奖励。

阅读完整版 →

Don't miss what's next. Subscribe to AI资讯速览:
Powered by Buttondown, the easiest way to start and grow your newsletter.