调研报告

小米 MiMo 大模型 Token Plan 调研报告

调研时间:2026年4月3日  |  调研范围:产品介绍、各方反应、正负面评价、市场对比

一、概述

2026年4月3日,小米正式推出 MiMo 首个 Token Plan,标志着小米大模型业务正式进入商业化运营阶段。小米采用统一 Credit 点数订阅制,而非传统的按次、按量计费模式。

核心亮点:无行业常见的"5小时 token 使用限额",支持集中消耗;一次订阅覆盖 Pro/Omni/TTS 三款模型;API 定价约为 GPT-4o 的 1/18。

二、MiMo 大模型与 Token Plan 详情

2.1 MiMo 系列模型一览

模型定位发布时间核心亮点
MiMo-7B端侧推理先锋2025年4月能耗仅为竞品1/5,深度集成HyperOS 3.0
MiMo-VL-7B多模态视觉语言2025年6月GUI交互和复杂推理刷新开源记录
MiMo-V2-Flash云端MoE引擎2025年12月开源MIT协议,SWE-Bench开源第一,推理成本仅Claude 2.5%
MiMo-V2-Pro旗舰Agent模型2026年3月1万亿参数,420亿激活参数,100万token上下文,AI编程接近Claude Opus 4.6
MiMo-V2-Omni全模态感知模型2026年3月原生支持图像、视频、音频、文本跨模态
MiMo-V2-TTS语音智能体2026年3月语音生成,限时免费

2.2 Token Plan 四档套餐

套餐月费(原价)首购88折每月 Credits约可完成任务数国际版月费
Lite¥39¥34.326,000万(60M)~120个中等复杂度任务$6(约¥43)
Standard¥99¥87.122亿(200M)~400个中等复杂度任务$16(约¥110)
Pro¥329¥289.527亿(700M)~1,400个中等复杂度任务$50(约¥344)
Max¥659¥579.9216亿(1.6B)~3,200个中等复杂度任务$100(约¥688)

2.3 Credit 消耗规则

模型上下文范围换算比例
MiMo-V2-Omni256k以内1 Token = 1 Credit
MiMo-V2-Pro256k以内1 Token = 2 Credits
MiMo-V2-Pro256k~1M1 Token = 4 Credits
MiMo-V2-TTS0 Credits(限时免费)

2.4 核心特点

三、各方反应与评价

3.1 媒体与科技圈评价

量子位(正面为主):单次订阅即可灵活调用三大模型,满足绝大部分 Agent 任务需求;无行业普遍存在的 5 小时 token 使用限额,支持集中消耗,能为大容量套餐用户带来更高强度、不中断的"养龙虾"体验。

i黑马(中性偏审慎):小米选择了按月订阅加 Credit 点数扣费的混合模式,这种定价策略试图平衡用户的使用灵活性和平台的收入稳定性。不过,小米的大模型商业化才刚刚起步,用户付费意愿还需市场验证。

华尔街见闻:腾讯、阿里、百度等大厂的"龙虾 Coding Plan"近期均已售罄,阿里云 AI 算力和存储产品也宣布提价,整个行业正从免费铺量转向精细化收费。小米此时推出 Token Plan,时机耐人寻味。

3.2 开发者社区(V2EX/Reddit)反应

负面/质疑声音(为主)

  • "有点担心小米在大模型上投入的决心,其他几家要么是云厂商,要么是 All in AI 的公司"
  • "即使在 V 站,估计都没几个人知道他们的模型"
  • "MiMo 干活上感觉不如 GLM(OpenCode pro-free)"
  • "白给都不是很想用的水平"
  • 网友计算后称:39元 Lite 套餐、99元 Standard 套餐都不够用来"养龙虾"(有用户两周用掉4亿 Token,有用户5天用掉1.3亿 Token)
  • 对比腾讯本地虾 QClaw 现在每天还送免费 Token,显得小米定价偏贵

正面/中性声音

  • "相反,小米可能是最稳的,因为他们家自带造血能力业务和落地场景"
  • "只要大模型还有发展空间,哪怕亏本也有能力有动机坚持投入"
  • "看他后面模型能力能不能持续跟上"
  • 标准套餐 ¥99/月 对日常开发者用户"够用"的评价出现分化

3.3 "养龙虾"是什么梗

"养龙虾"是 AI 编程圈对高强度使用 Claude Code / OpenClaw 等 Agent 工具的戏称(因为这类工具的 Logo 往往与龙虾/小龙虾形象相关)。高强度"养龙虾"即频繁调用大模型执行复杂编程任务,Token 消耗极快。

四、正面与负面反馈汇总

4.1 正面反馈

维度具体内容
定价透明Credit 点数制让成本清晰可见,无隐含限制
无时间限制没有"5小时用完就断"的尴尬,可集中消耗
多模型覆盖一次订阅覆盖 Pro/Omni/TTS 三款模型
性价比API 定价(输入 ¥1/百万 Token,输出 ¥3/百万 Token)约为同级闭源模型的1/5
模型能力MiMo-V2-Pro 在 Artificial Analysis 排名全球第八,国内第二;编程能力接近 Claude Opus 4.6
生态兼容已接入 OpenClaw、OpenCode、Claude Code、Cline、KiloCode、Blackbox 等主流工具
商业前景自带硬件生态(手机+汽车),有造血能力,不是纯烧钱

4.2 负面反馈

维度具体内容
价格偏贵月费 39~659 元,高强度用户两天即可耗尽低档套餐;对比 GLM、DeepSeek 等免费或有低价 API 的竞品,小米价格竞争力不足
Credits 消耗快MiMo-V2-Pro 的 2x 消耗系数(256k内)和 4x(超长上下文)让实际用量大幅缩水
品牌认知弱开发者社区对小米的 AI 能力认知不足,"没几个人知道他们的模型"
模型实际表现有用户反馈 MiMo 干活不如 GLM(OpenCode pro-free);与头部模型(GLM-5、Claude)仍有差距
生态疑虑纯云厂商和 All in AI 的公司有更强的持续投入动力,小米的战略优先级存疑
商业化刚起步无包年、连续包月,Credits 不结转,灵活性不足
与豆包差距大MiMo 累计 1万亿 Token vs 豆包日均 120万亿 Token,市场份额差距悬殊

五、与其他大模型定价横向对比

5.1 国内主流模型 API 定价对比(每百万 Token,人民币)

模型输入价格输出价格备注
豆包 2.0 Pro¥3.2¥16行业偏低,字节跳动
DeepSeek V3.2¥0.14¥0.28价格屠夫
GLM-4.7¥3¥14智谱
GLM-5¥1¥3.2智谱最新旗舰
Kimi K2.5约¥3约¥15月之暗面
文心一言(ERNIE)曾免费曾免费百度
小米 MiMo-V2-Omni¥1¥3256k内,1 Token=1 Credit
小米 MiMo-V2-Pro¥2¥6256k内,1 Token=2 Credits

5.2 国际主流模型 API 定价对比(每百万 Token,美元)

模型输入价格输出价格备注
GPT-5.2$12.25$98OpenAI 旗舰
GPT-4o$2.5$10OpenAI 主力
Claude Opus 4.6$5$25Anthropic 旗舰
Gemini 2.5 Pro$1.25$10Google
Gemini 3 Flash-Lite$0.10$0.40Google 最便宜
DeepSeek V3.2$0.14$0.28中国价格杀手
MiMo-V2-Pro$0.14$0.42API定价约GPT-4o的1/18
MiMo-V2-Flash$0.10开源免费调用

5.3 订阅制套餐横向对比(国内 Coding Plan 类)

方案月费主要特点
GLM Coding Plan免费(有限并发)有免费档,pro-free 版本免费
腾讯 QClaw/本地虾免费(每天送 Token)持续免费策略
GLM-5 订阅版$10(约¥72)含 GLM-5、Qwen3.5-plus、Kimi K2.5 等
小米 MiMo Token Plan¥39~659Credit 点数制,无并发限制
阿里/腾讯/百度"龙虾"套餐各不相同近期均已售罄或涨价

六、总结与判断

6.1 核心结论

  1. 小米 MiMo Token Plan 是小米大模型商业化的第一步,采用订阅制 Credit 点数模式,定价透明但整体偏贵。
  2. 正面:无使用时限、多模型覆盖、API 价格具有竞争力(约为 GPT-4o 的1/18)、模型能力排名靠前、生态接入广泛。
  3. 负面:低档套餐额度在高强度场景下严重不足;开发者社区对小米的 AI 品牌认知弱;与豆包等竞争对手的规模差距悬殊;商业化刚刚起步,灵活度不足。
  4. 行业趋势:整个大模型行业正从"免费铺量"转向"精细化收费",腾讯/阿里/百度的类似套餐近期已售罄或涨价,小米此时入场时机尚可,但能否持续仍取决于模型能力迭代速度。
  5. 适合用户:中低强度开发者(日常编程辅助)、需要多模态能力(Omni 模型)、重视成本透明度的用户。不适合高频"养龙虾"型重度用户(建议直接上 Max 档或选 GLM 免费方案)。

6.2 主要信息来源