调研报告

小米 MiMo 大模型 Token Plan 调研报告

调研时间：2026年4月3日 | 调研范围：产品介绍、各方反应、正负面评价、市场对比

一、概述

2026年4月3日，小米正式推出 MiMo 首个 Token Plan，标志着小米大模型业务正式进入商业化运营阶段。小米采用统一 Credit 点数订阅制，而非传统的按次、按量计费模式。

核心亮点：无行业常见的"5小时 token 使用限额"，支持集中消耗；一次订阅覆盖 Pro/Omni/TTS 三款模型；API 定价约为 GPT-4o 的 1/18。

二、MiMo 大模型与 Token Plan 详情

2.1 MiMo 系列模型一览

模型	定位	发布时间	核心亮点
MiMo-7B	端侧推理先锋	2025年4月	能耗仅为竞品1/5，深度集成HyperOS 3.0
MiMo-VL-7B	多模态视觉语言	2025年6月	GUI交互和复杂推理刷新开源记录
MiMo-V2-Flash	云端MoE引擎	2025年12月	开源MIT协议，SWE-Bench开源第一，推理成本仅Claude 2.5%
MiMo-V2-Pro	旗舰Agent模型	2026年3月	1万亿参数，420亿激活参数，100万token上下文，AI编程接近Claude Opus 4.6
MiMo-V2-Omni	全模态感知模型	2026年3月	原生支持图像、视频、音频、文本跨模态
MiMo-V2-TTS	语音智能体	2026年3月	语音生成，限时免费

2.2 Token Plan 四档套餐

套餐	月费（原价）	首购88折	每月 Credits	约可完成任务数	国际版月费
Lite	¥39	¥34.32	6,000万（60M）	~120个中等复杂度任务	$6（约¥43）
Standard	¥99	¥87.12	2亿（200M）	~400个中等复杂度任务	$16（约¥110）
Pro	¥329	¥289.52	7亿（700M）	~1,400个中等复杂度任务	$50（约¥344）
Max	¥659	¥579.92	16亿（1.6B）	~3,200个中等复杂度任务	$100（约¥688）

2.3 Credit 消耗规则

模型	上下文范围	换算比例
MiMo-V2-Omni	256k以内	1 Token = 1 Credit
MiMo-V2-Pro	256k以内	1 Token = 2 Credits
MiMo-V2-Pro	256k~1M	1 Token = 4 Credits
MiMo-V2-TTS	—	0 Credits（限时免费）

2.4 核心特点

无行业常见的"5小时 token 使用限额"，支持集中消耗
三款模型（Pro/Omni/TTS）一次订阅即可调用
购买套餐可获新模型优先内测体验权
不支持套餐降级，支持补差额升级
暂不支持连续包月/包年（未来一周内上线自动续费）
套餐到期 Credits 不结转

三、各方反应与评价

3.1 媒体与科技圈评价

量子位（正面为主）：单次订阅即可灵活调用三大模型，满足绝大部分 Agent 任务需求；无行业普遍存在的 5 小时 token 使用限额，支持集中消耗，能为大容量套餐用户带来更高强度、不中断的"养龙虾"体验。

i黑马（中性偏审慎）：小米选择了按月订阅加 Credit 点数扣费的混合模式，这种定价策略试图平衡用户的使用灵活性和平台的收入稳定性。不过，小米的大模型商业化才刚刚起步，用户付费意愿还需市场验证。

华尔街见闻：腾讯、阿里、百度等大厂的"龙虾 Coding Plan"近期均已售罄，阿里云 AI 算力和存储产品也宣布提价，整个行业正从免费铺量转向精细化收费。小米此时推出 Token Plan，时机耐人寻味。

3.2 开发者社区（V2EX/Reddit）反应

负面/质疑声音（为主）

"有点担心小米在大模型上投入的决心，其他几家要么是云厂商，要么是 All in AI 的公司"
"即使在 V 站，估计都没几个人知道他们的模型"
"MiMo 干活上感觉不如 GLM（OpenCode pro-free）"
"白给都不是很想用的水平"
网友计算后称：39元 Lite 套餐、99元 Standard 套餐都不够用来"养龙虾"（有用户两周用掉4亿 Token，有用户5天用掉1.3亿 Token）
对比腾讯本地虾 QClaw 现在每天还送免费 Token，显得小米定价偏贵

正面/中性声音

"相反，小米可能是最稳的，因为他们家自带造血能力业务和落地场景"
"只要大模型还有发展空间，哪怕亏本也有能力有动机坚持投入"
"看他后面模型能力能不能持续跟上"
标准套餐 ¥99/月对日常开发者用户"够用"的评价出现分化

3.3 "养龙虾"是什么梗

"养龙虾"是 AI 编程圈对高强度使用 Claude Code / OpenClaw 等 Agent 工具的戏称（因为这类工具的 Logo 往往与龙虾/小龙虾形象相关）。高强度"养龙虾"即频繁调用大模型执行复杂编程任务，Token 消耗极快。

四、正面与负面反馈汇总

4.1 正面反馈

维度	具体内容
定价透明	Credit 点数制让成本清晰可见，无隐含限制
无时间限制	没有"5小时用完就断"的尴尬，可集中消耗
多模型覆盖	一次订阅覆盖 Pro/Omni/TTS 三款模型
性价比	API 定价（输入 ¥1/百万 Token，输出 ¥3/百万 Token）约为同级闭源模型的1/5
模型能力	MiMo-V2-Pro 在 Artificial Analysis 排名全球第八，国内第二；编程能力接近 Claude Opus 4.6
生态兼容	已接入 OpenClaw、OpenCode、Claude Code、Cline、KiloCode、Blackbox 等主流工具
商业前景	自带硬件生态（手机+汽车），有造血能力，不是纯烧钱

4.2 负面反馈

维度	具体内容
价格偏贵	月费 39~659 元，高强度用户两天即可耗尽低档套餐；对比 GLM、DeepSeek 等免费或有低价 API 的竞品，小米价格竞争力不足
Credits 消耗快	MiMo-V2-Pro 的 2x 消耗系数（256k内）和 4x（超长上下文）让实际用量大幅缩水
品牌认知弱	开发者社区对小米的 AI 能力认知不足，"没几个人知道他们的模型"
模型实际表现	有用户反馈 MiMo 干活不如 GLM（OpenCode pro-free）；与头部模型（GLM-5、Claude）仍有差距
生态疑虑	纯云厂商和 All in AI 的公司有更强的持续投入动力，小米的战略优先级存疑
商业化刚起步	无包年、连续包月，Credits 不结转，灵活性不足
与豆包差距大	MiMo 累计 1万亿 Token vs 豆包日均 120万亿 Token，市场份额差距悬殊

五、与其他大模型定价横向对比

5.1 国内主流模型 API 定价对比（每百万 Token，人民币）

模型	输入价格	输出价格	备注
豆包 2.0 Pro	¥3.2	¥16	行业偏低，字节跳动
DeepSeek V3.2	¥0.14	¥0.28	价格屠夫
GLM-4.7	¥3	¥14	智谱
GLM-5	¥1	¥3.2	智谱最新旗舰
Kimi K2.5	约¥3	约¥15	月之暗面
文心一言（ERNIE）	曾免费	曾免费	百度
小米 MiMo-V2-Omni	¥1	¥3	256k内，1 Token=1 Credit
小米 MiMo-V2-Pro	¥2	¥6	256k内，1 Token=2 Credits

5.2 国际主流模型 API 定价对比（每百万 Token，美元）

模型	输入价格	输出价格	备注
GPT-5.2	$12.25	$98	OpenAI 旗舰
GPT-4o	$2.5	$10	OpenAI 主力
Claude Opus 4.6	$5	$25	Anthropic 旗舰
Gemini 2.5 Pro	$1.25	$10	Google
Gemini 3 Flash-Lite	$0.10	$0.40	Google 最便宜
DeepSeek V3.2	$0.14	$0.28	中国价格杀手
MiMo-V2-Pro	$0.14	$0.42	API定价约GPT-4o的1/18
MiMo-V2-Flash	$0.10	—	开源免费调用

5.3 订阅制套餐横向对比（国内 Coding Plan 类）

方案	月费	主要特点
GLM Coding Plan	免费（有限并发）	有免费档，pro-free 版本免费
腾讯 QClaw/本地虾	免费（每天送 Token）	持续免费策略
GLM-5 订阅版	$10（约¥72）	含 GLM-5、Qwen3.5-plus、Kimi K2.5 等
小米 MiMo Token Plan	¥39~659	Credit 点数制，无并发限制
阿里/腾讯/百度"龙虾"套餐	各不相同	近期均已售罄或涨价

六、总结与判断

6.1 核心结论

小米 MiMo Token Plan 是小米大模型商业化的第一步，采用订阅制 Credit 点数模式，定价透明但整体偏贵。
正面：无使用时限、多模型覆盖、API 价格具有竞争力（约为 GPT-4o 的1/18）、模型能力排名靠前、生态接入广泛。
负面：低档套餐额度在高强度场景下严重不足；开发者社区对小米的 AI 品牌认知弱；与豆包等竞争对手的规模差距悬殊；商业化刚刚起步，灵活度不足。
行业趋势：整个大模型行业正从"免费铺量"转向"精细化收费"，腾讯/阿里/百度的类似套餐近期已售罄或涨价，小米此时入场时机尚可，但能否持续仍取决于模型能力迭代速度。
适合用户：中低强度开发者（日常编程辅助）、需要多模态能力（Omni 模型）、重视成本透明度的用户。不适合高频"养龙虾"型重度用户（建议直接上 Max 档或选 GLM 免费方案）。

6.2 主要信息来源

量子位（2026-04-03）
i黑马（2026-04-03）
华尔街见闻（2026-04-03）
新浪财经（2026-04-03）
V2EX 技术社区讨论帖
今日头条科技专栏
知乎相关问题
Reddit r/artificial
Artificial Analysis 排行榜
AnotherWrapper LLM Pricing 对比
LLM-Price GitHub 汇总库