MiniMax M3 开源 428B 参数 MoE，只激活 23B


            
        June 13, 2026
    
    
MiniMax M3 开源 428B 参数 MoE，只激活 23B


MiniMax M3 开源 428B 参数 MoE，只激活 23B


  MiniMax M3 开源 428B 参数 MoE，只激活 23B


LoreAI
AI 日报


2026-06-13


MiniMax M3 开源 428B 参数 MoE，只激活 23B

发布动态
1MiniMax M3 开源 428B 参数 MoE，只激活 23B。
你没看错 — 428B 总参数，每个 token 只激活 23B。MiniMax 把这个庞然大物直接扔上了 HuggingFace，开源可用。效率什么概念？参数量是 Llama 3.1 405B 的量级，推理成本却只有零头。HuggingFace Transformers v5.12 已经同步支持，pip install --upgrade transformers 就能跑。对于想在本地部署大模型又不想烧卡的团队，这可能是目前性价比最高的选择。(2,123 likes | 248 RTs) 详情 →
Moonshot AI 开源 Kimi K2.7 Code。 月之暗面的专用代码模型来了 — 开源阵营的编码模型赛道又多一个选手，和 Cohere、小米的方案正面竞争。中国 AI 实验室在开源代码模型上的投入越来越凶，开发者的选择也越来越多。(331 likes) 详情 →
Google Project Genie 全球开放。 谷歌最高端 AI 能力层 — Project Genie — 面向 Ultra 5X 订阅用户全球上线。这个分层策略跟 Anthropic 的高级能力分级一个思路：最强的模型能力，只给付费最多的用户。(688 likes | 100 RTs) 详情 →


开发者工具
2Codex 接入 Chrome DevTools Protocol — Agent 能真正调试前端了。
OpenAI 给 Codex 加了个杀手级功能：直接通过 Chrome DevTools Protocol 做 JavaScript 性能分析、网络请求调试、页面状态检查。这不是"帮你写 CSS"级别的 AI 辅助 — 而是 Agent 可以像你打开 F12 一样看到浏览器里发生的一切。前端开发者，拿一个真实的调试场景试试。(2,825 likes | 192 RTs) 详情 →
GitHub Copilot Code Review 支持 MCP 和自定义 Agent 技能。 Public preview 阶段。意味着你可以把公司内部的代码规范、安全检查工具直接接入 PR review 流程 — 对企业团队来说，这是 Copilot 从"通用助手"变成"懂你团队规矩的 reviewer"的关键一步。(122 likes | 14 RTs) 详情 →
Claude Code 一天发三个版本。 v2.1.174 到 v2.1.176，会话标题本地化、Bedrock 凭证缓存、滚动加速控制、模型选择器修复 — Fable 发布后 Anthropic 的迭代节奏肉眼可见地加快了。claude update 走起。详情 →
Transformers v5.12 当天支持 MiniMax M3 视觉语言版。 MiniMax M3 上午发布，HuggingFace 下午就 ship 了原生支持 — 包括 CLIP 视觉塔和 3D 旋转位置编码。开源生态的速度：从模型发布到 pip install 可用，几个小时。详情 →


技术实战
3Simon Willison 从 Fable 怀疑论者变成了"真香党"。
上周还在挑 Fable 5 毛病的 Simon Willison，用了两天后的评价是"relentlessly proactive（主动到令人发指）"。他分享了一个例子：给 Fable 一张截图，它自动启了个自定义 CORS Python 服务器来调试。从批评者到印象深刻的用户 — 这个转变本身就是信号。试试用截图驱动 Fable 调试 bug。(667 likes | 44 RTs) 详情 →
如何管理 Fable 在长对话中的"信息轰炸"。 Anthropic 开发者关系负责人 Alex Albert 分享了一个实用技巧：在长 Agent 会话中，Fable 的输出量可能多到你跟不上。他给了一个具体的 prompt 片段来控制输出节奏 — 加到你的 CLAUDE.md 里。(676 likes) 详情 →


研究前沿
4Fable 5 在 FrontierMath 拿下 87-88% — 它甚至不是推理专用模型。
Epoch AI 的独立数学基准测试确认：Fable 5 在 Tier 1-3 达到 87%，Tier 4 达到 88%。关键在于 — Fable 不是像 o3 那样专门优化推理的模型，但数学能力已经到了这个水平。如果你的应用涉及数学推理，现在有了一个不牺牲通用能力的选择。(684 likes | 93 RTs) 详情 →
通用大模型全面碾压专用临床 AI。 一篇论文显示，frontier LLM（大语言模型）在所有三项评测中都打败了专门为医疗场景构建的 AI 工具。启示很残酷：如果你在用 2024 年架构构建的垂直 AI 产品，通用模型可能已经比你强了。该重新评估技术栈了。(315 likes | 33 RTs) 详情 →
微软研究院发布 Arbor — 通用自主研究 Agent。 Arbor 用持久化假设树（hypothesis tree）做自主研究，不是线性的 Agent 链条，而是可以分支、回溯、持续精炼的树状结构。微软出手做通用研究 Agent，说明业界已经在从"任务型 Agent"向"研究型 Agent"升级。(220 likes | 37 RTs) 详情 →


行业洞察
548 小时 Fable 5 社区作品展 — 跑分测不出来的东西。
Claude 官方账号整理了 Fable 5 发布 48 小时内社区构建的项目集锦。跑分告诉你模型"能做什么"，但社区项目告诉你"人们真的在用它做什么"。刷一遍这个帖子，找找灵感。(29,885 likes | 1,596 RTs) 详情 →
LeCun 开炮：Amodei 的 AI 治理方案就是要干掉开源。 Yann LeCun 对 Dario Amodei 的 AI 政策文章发出了迄今最尖锐的批评 — "先宣布 AI 太危险不能竞争，再提出一个只有你家实验室能活下来的监管方案"。不管你站哪边，这场辩论的实质已经从"安全 vs 开放"变成了"市场结构之争"。在选边站之前，两边的论述都该读。(1,985 likes | 167 RTs) 详情 →
TCS 联手 Anthropic，Claude 进军银行和政府。 TCS 是全球最大的 IT 服务公司之一，这次合作给了 Claude 一条直通银行、保险、政府机构的通道。加上昨天的 DXC 联盟，Anthropic 正在系统性地锁定企业咨询层。对于受监管行业的技术团队 — 是时候评估 Claude 了。详情 →
Anthropic 发布首份"公共记录" — Chris Olah 谈教皇的 AI 通谕。 一种新的透明度实验：Anthropic 的 Chris Olah 对教皇的 AI 伦理通谕发表评论，以"公共记录"形式发布。AI 安全与更广泛的社会话语结合 — 这个方向值得关注。详情 →
Richard Socher 声称 Recursive 实现了 AI 自我改进研究。 AI 做 AI 研究 — Agent 在做让 Agent 更好的研究。不管你信不信这个说法，严肃的研究者公开宣称这件事，本身就说明 frontier 实验室认为自己离这个目标已经很近了。等独立验证。(578 likes | 83 RTs) 详情 →


值得一试
Extend CLI 开源文档解析。 从终端直接做文档解析和提取，自带 Agent 技能 — Claude Code 和 Codex 可以原生调用。CLI 工具出厂自带 Agent 技能正在成为标准模式，这就是工具生态适应 Agent 工作流的方式。npm install -g @extend-ai/cli。(128 likes | 14 RTs) 详情 →
architect-loop：Fable 做架构师，Codex 做码农。 一个跨供应商的 Agent 协作工具 — 让 Fable 5 做架构决策，把编码任务路由给 GPT-5.5 Codex。这是第一个把"模型套利"（用不同模型做不同层次工作）落地到实用开发工具的实现。Claude Code 技能，直接安装可用。(77 likes | 5 RTs) 详情 →
手把手：在 macOS 上搭建本地编码 Agent。 HN 热帖，226 赞。填补了"编码 Agent 存在"和"具体怎么在自己电脑上跑起来"之间的空白。从零到可用，一步步来。(226 likes | 68 RTs) 详情 →


模型小课堂
混合专家模型（MoE）— 总参数 vs 激活参数：MiniMax M3 有 428B 总参数，但每个 token 只激活 23B — 这就是 MoE（Mixture of Experts）的魔法。想象一个公司有 400 名员工，但每个项目只需要 23 人参与。模型把参数分成很多"专家组"，每次推理时只调用最相关的几组。这就是为什么 M3 可以很大却不贵 — 参数量决定模型"知道多少"，激活量决定"每次推理花多少钱"。以后看模型别只看总参数了，激活参数才是你真正要付费的部分。


快讯

MiniMax M3 权重上线 HuggingFace：428B/23B-active MoE，245 likes，已可下载。(245 likes | 442 downloads) 链接
Google 一周 AI 汇总：Live Translate GA、NotebookLM 升级 Agent 对话、Genie 全球扩展。(466 likes | 34 RTs) 链接
OpenAI API 平台加入 ⌘K 搜索：跨页面、设置和文档的快速搜索。(814 likes | 52 RTs) 链接
Ollama v0.30.8：prompt 缓存优化，MLX 推理稳定性提升，本地跑模型的更新一下。链接


今日精选
LeCun vs Amodei — 当最大声的安全倡导者提出只有自己能活的治理方案，"安全 vs 开放"的本质就暴露了。 Dario Amodei 写了篇长文论述 AI 治理，核心主张是 frontier 模型需要严格监管。LeCun 的反驳一针见血："先把 AI 说成太危险不能自由竞争，再提出一个只有你家实验室能通过审批的监管框架。" 这场辩论表面上是安全之争，实质上是市场结构之争。对开发者来说，关键问题不是"谁更关心安全"，而是"什么样的治理框架既保护公众又不扼杀创新"。MiniMax M3 今天的开源发布就是最好的注脚 — 428B 参数的模型说开源就开源了，这在 Amodei 的治理框架下还能存在吗？在你选边站之前，先问自己：你支持的"安全"方案，是真的在保护公众，还是在保护某几家公司的市场地位？(1,985 likes | 167 RTs) 详情 →
下期见 ✌️


    每个工作日早晨，最精炼的 AI 简报。
  

在浏览器中阅读
     · 
    历史存档
     · 
    推荐给朋友
     · 
    退订


𝕏
      
    loreai.dev


                                Don't miss what's next. Subscribe to LoreAI:
                            
                        
            Email address (required)