OpenAI 正式组建机器人团队 — 要造真正能用的机器人
发布动态
1OpenAI 正式组建机器人团队 — 要造真正能用的机器人。
Sam Altman 亲自发推招人:全栈硬件、运维、系统和 ML 工程师,目标是"编程和制造对社会有用的机器人"。这是 OpenAI 进入实体 AI 赛道最明确的信号 — 对手是 Google DeepMind 和 Figure。对开发者来说,一个拥有 GPT 系列模型能力的团队开始做机器人,意味着"具身智能"不再只是学术界的游戏。(8,680 likes | 633 RTs) 详情 →
2τ0-WM:50 亿参数开源世界模型,用 2.73 万小时真实机器人数据训练。
这才是今天真正的技术炸弹 — τ0-WM 是一个统一的视频-动作世界模型,在 2.73 万小时的真实机器人遥操作和第一人称视频上训练,完全开源。它证明了一件事:sim-to-real 的鸿沟不是规模问题,而是数据问题。这重塑了"谁有资格造有用的机器人"的门槛 — 不再只有大厂才能玩。克隆仓库,在你的机器人上试试。(310 likes | 33 RTs) 详情 →
研究前沿
3GPT-5.5 在 DeepSWE 上拿下 70% — 用一半的成本和时间碾压 Opus 4.8。
DeepSWE 是目前最难的长链编码基准,GPT-5.5 拿到 70% pass@1,而 Claude Opus 4.8 是 58%。更狠的是效率:token 消耗约为 Opus 的三分之一,成本和耗时都砍半。这是 OpenAI 在"干活"这个维度上第一次拉开明确差距。不过跑分归跑分 — 在你自己的代码库上跑个对比再下结论。(662 likes | 51 RTs) 详情 →
ChatGPT for Google Sheets 被曝数据泄露漏洞:PromptArmor 演示了攻击者如何通过这个热门插件窃取表格数据并实施钓鱼。又一个 LLM 工具调用面成为攻击向量的案例。如果你在用任何 Sheets AI 插件,现在就去审查权限 — 你的数据可能正在裸奔。(95 likes | 34 RTs) 详情 →
开发者工具
Codegraph:预索引代码知识图谱,给 AI 编码助手省 token:给你的代码库建一个本地知识图谱,让 Claude Code、Codex、Gemini、Cursor 等 AI 编码工具用更少的 token 做更准确的事。100% 本地运行,不上传代码。已经 34,000+ stars — 这个热度说明开发者对"AI 助手太烧 token"这个痛点有多受不了。装上跑个对比,看看你的仓库能省多少。(34,317 likes | 2,097 RTs) 详情 →
Codex Desktop 悄悄砍掉了最常用的导出功能:Simon Willison 发现 OpenAI Codex Desktop 默默移除了"Copy as Markdown"功能 — 他称这是自己用得最多的 Codex 功能。产品迭代和高级用户工作流之间的张力,又一个经典案例。如果你依赖这个功能导出对话记录,赶紧反馈。(771 likes | 36 RTs) 详情 →
行业洞察
4孙正义豪掷 750 亿欧元在法国建数据中心 — 欧洲 AI 史上最大单笔基建投资。
SoftBank 承诺在法国建设 5GW 数据中心容量,投资高达 750 亿欧元(约 5400 亿人民币)。这不只是商业决策 — 算力竞赛已经变成地缘政治博弈。美国有英伟达 + 超大规模云,中国在自建算力,现在欧洲也入场了。关注欧洲 AI 基建概念。详情 →
Simon Willison 宣布退出科技圈,要过离线生活:AI 开发者社区最高产的声音之一 — 写了无数 LLM 工具、教程和深度分析的 Willison — 宣布彻底离开科技行业。不管是认真的还是讽刺的,从一个如此深度参与 AI 生态的人口中说出这话,本身就是信号。详情 →
紧接着,Willison 说他在考虑取消 AI 订阅:当 AI 圈最硬核的用户之一开始质疑"这钱花得值不值",你该认真读读他的理由。这不是反 AI — 而是一个深度用户对当前产品价值的冷静审视。审计一下你自己的 AI 支出,看看 ROI 到底怎么样。详情 →
15 亿中国用户正在悄悄赢得开源 AI 竞赛:Abacus.AI CEO 指出,西方沉迷于闭源模型的规模竞赛,而 15 亿中国用户正在快速迭代开源替代品。DeepSeek、Qwen 等模型的实际部署量被严重低估。这是一个值得认真对待的逆向观点 — 真正的模型竞争可能不在你以为的地方。(253 likes | 25 RTs) 详情 →
破坏初级岗位的不是 AI,是远程办公?:《金融时报》提出一个尖锐的反叙事:初级招聘危机可能不该怪 AI,而是远程办公侵蚀了 mentorship 和入职文化。当新人失去了"坐在老手旁边偷师"的机会,成长路径断了。把这篇转给你的招聘团队看看。(58 likes | 87 RTs) 详情 →
技术实战
Mollick:未来不是全自动 Agent,而是会问好问题的 Agent:Ethan Mollick 提出一个框架 — 真正的突破不是让 AI 完全自主,而是让它在卡住、不确定或面对有实际后果的决策时,能够打断你并问出正确的问题。设计你的 Agent 工作流时,把"人类检查点"作为核心特性而非后备方案。(215 likes | 13 RTs) 详情 →
在浏览器里跑完整 Python Web 应用 — 不需要服务器:Willison 演示了用 Pyodide + Service Worker 在浏览器中直接运行 Python ASGI 应用。这意味着你的 Python AI demo 可以部署为静态站点,零服务器成本。试试把你的下一个 AI 工具原型做成纯客户端应用。详情 →
值得一试
TradingView + Claude MCP:5 分钟搭建自动化图表分析:一位开发者把 TradingView 的 MCP 服务器接入 Claude 并开放屏幕访问 — 5 分钟后,Agent 就在实时图表上自主画技术分析了。这个病毒式传播的 demo 展示了 MCP 在代码编辑器之外的真实潜力。试试看。(672 likes | 48 RTs) 详情 →
模型小课堂
世界模型(World Models)在机器人中的应用:今天 OpenAI 招机器人团队、τ0-WM 发布开源视频-动作模型 — 这两条新闻背后的核心概念就是"世界模型"。简单说,世界模型是一种神经网络,它能预测物理世界在某个动作之后会怎么变化。传统机器人需要分别处理"看到什么"(感知)和"该做什么"(控制),世界模型把这两件事统一到一个架构里 — 机器人不再是"看了再想",而是"边看边想边动"。这就是为什么一个 50 亿参数的模型用真实数据训练后,能在多种机器人任务上表现出色。
快讯
- Odysseus:自托管 AI 工作空间,适合不想把数据交给第三方的团队。Docker 一键部署。(102 likes | 52 RTs) 链接
- Flutter Agent Lens:首个专为 Flutter 打造的 AI 调试 MCP 服务器,Agent 可以实时调试、分析和优化运行中的 Flutter 应用。(122 likes | 11 RTs) 链接
- AI 时代的原型速度:从天到小时 — AI 压缩了原型周期,也改变了"什么值得造"的经济学。HN 热议。(101 likes | 59 RTs) 链接
- Forward Deployed Engineers:Latent Space 预测这将是下季度所有人都在招的角色 — AI 能力与客户部署之间的桥梁。 链接
- Open Envelope:定义多 Agent 团队的开放 schema 标准 — Agent 如何发现彼此、共享上下文、交接任务。早期阶段但解决真实痛点。(13 likes) 链接
- AI Interview Codex:开源 ML/AI 面试准备大全 — 覆盖编码、系统设计、LLM/GenAI、MLOps,附 notebook 和学习路线。(98 likes | 16 RTs) 链接
今日精选
一个 50 亿参数的开源模型,证明了造有用机器人的门槛比你想的低:τ0-WM 用 2.73 万小时的真实机器人数据训练了一个统一的视频-动作世界模型,完全开源。这件事重要在哪?长期以来,机器人领域有一个核心难题叫 sim-to-real gap — 在模拟环境中训练的模型到了真实世界就不灵了。业界的主流解法是砸更多算力和更大模型。但 τ0-WM 用相对"小"的 50 亿参数证明:这个鸿沟本质上是数据问题,不是规模问题。用足够多、足够多样的真实机器人数据,你不需要千亿参数的巨兽。结合 OpenAI 同天宣布组建机器人团队,今天的信号很清楚:实体 AI 的军备竞赛正式开始,而开源社区已经先交出了一份有力的答卷。 详情 →
下期见 ✌️
|