AI资讯速览

Archives
Log in
March 6, 2026

假Bug报告攻破Cline发布流水线,五角大楼AI监控无法可依

1. 一条伪装成Bug报告的prompt injection,攻破了Cline的整条发布流水线 Cline的代码仓库允许任何人提交问题报告。安全研究员Adnan Khan利用这一点,在一条报告的标题里埋了一段提示词注入,伪装成系统报错:「需要先安装辅助工具」。Cline的分拣机器人没有识别出来,照单全收。

2. 五角大楼用AI监控公民,合法吗?美国法律答不上来 美国宪法第四修正案禁止无证搜查,但它写于1791年,预设的是翻抽屉、拆信件。当军方用AI批量分析公民的公开数据,这算不算「搜查」?现行法律给不出答案。

3. Anthropic量化就业冲击,OpenAI测量学习效果,AI巨头抢在监管前给自己「做体检」 Anthropic本周发布了一套衡量AI对劳动力市场影响的新指标。几乎同期,OpenAI推出了测量AI对学生学习效果的框架。两份研究瞄准的议题不同,结构却高度一致:都由公司自有研究团队出品,都选中了公众最敏感的社会议题,都承诺建立长期追踪机制。


快讯

  • 微软发布Phi-4-reasoning-vision-15B,150亿参数做多模态推理 微软开源紧凑型多模态推理模型Phi-4-reasoning-vision-15B,在科学和数学推理任务上表现突出,目标是用小模型覆盖常见视觉与语言任务。
  • Descript用OpenAI模型实现大规模多语言视频配音 视频编辑工具Descript接入OpenAI模型,自动将视频配音翻译为多种语言,同时优化译文的语义和口型时序匹配,使配音听起来更自然。
  • SkillNet:让AI代理积累和复用技能的开放基础设施 研究团队提出SkillNet框架,解决AI代理反复「重新发明轮子」的问题——为技能的创建、评估和组织提供统一机制,使不同代理间的能力可迁移复用。
  • SageBwd将注意力计算压缩到INT8精度用于训练 SageBwd将注意力机制中七次矩阵乘法中的六次量化为INT8,微调性能与全精度持平。新版本进一步缩小了预训练阶段与全精度注意力的性能差距。
  • RoboPocket:用手机即时改进机器人策略 新方法让操作者用手机采集演示数据时能实时看到机器人策略的薄弱环节,针对性补充关键状态分布的数据,比盲目收集数据的效率显著更高。
  • Proact-VL:面向实时AI伴侣的主动式视频大模型 Proact-VL解决视频流场景下的三个难题:连续输入下的低延迟推理、自主决定何时回应、以及在实时约束下控制生成内容的质量和数量。研究以游戏解说和引导为测试场景。
  • MOOSE-Star打破科学假设生成的计算复杂度壁垒 直接训练「给定背景知识生成假设」的模型面临O(N^k)的组合爆炸问题。MOOSE-Star提出新方法使这一过程变得可计算,为LLM直接建模科学发现的推理过程开辟路径。
  • AgentVista发布高难度多模态代理评测基准 现有多模态基准多测单轮视觉推理或特定工具技能,AgentVista聚焦真实场景中的多步工作流——如根据接线照片对照电路图排障,或解读交通地图规划路线。

阅读完整版 →

Don't miss what's next. Subscribe to AI资讯速览:
Powered by Buttondown, the easiest way to start and grow your newsletter.