5月27日，小米正式宣布 MiMo-V2.5 系列 API 永久降价，最高降幅达到 99%。就在此前不久，DeepSeek 也已率先开启 API 长期降价策略。短时间内，多家国产大模型厂商集中下调 Token 调用成本，意味着 AI 行业的竞争逻辑，正在从“模型参数竞赛”逐渐转向“调用效率、生态覆盖与商业普及”的新阶段。

而在这一轮变化背后，除了模型公司本身，大模型API聚合平台、算力调度平台以及AI基础设施服务商的价值也开始同步上升。包括星战科技推出的星战云大模型API平台，也正在围绕多模型调度、Token成本优化、API统一接入等方向展开布局。随着企业开始同时接入 DeepSeek、MiMo、通义千问、Claude 等多个模型，“如何低成本、高效率地调用AI能力”，已经逐渐成为新的行业核心问题。此次小米降价覆盖 MiMo-V2.5 核心系列，并同步优化 Token Plan 计费机制。在相同预算下，企业可获得原先 5 至 8 倍的 Token 调用量，整体性价比明显提升。以 MiMo-V2.5-Pro 为例，输入缓存命中价格最低已降至 0.025 元/百万 Tokens，部分规格降幅甚至达到 99%。而标准版 MiMo-V2.5 同样进行了大规模调价，进一步降低中小开发者与轻量级AI应用的使用门槛。

值得注意的是，这一轮降价并不仅仅是“价格战”。过去几年，大模型行业普遍依赖高昂训练成本与GPU资源建立竞争壁垒，但随着模型能力逐渐趋同，企业开始意识到：真正决定商业落地速度的，不再只是模型本身，而是整体AI调用成本、推理效率以及开发接入难度。尤其在 Agent、AI办公、智能客服、AI营销、自动化工作流等场景持续爆发后，企业对 Token 的消耗量正在呈现指数级增长。越来越多公司开始从“采购模型”转向“持续消耗Token”，AI能力本身也正在向类似云计算、水电煤一样的基础服务形态演化。这种变化，也让AI API聚合平台的重要性迅速提升。因为对于企业来说，同时接入多个模型已经成为趋势。不同模型在推理能力、价格、上下文长度、响应速度以及多模态支持方面各有差异，企业往往需要根据业务场景动态切换模型能力。例如部分企业会使用 DeepSeek 处理复杂推理任务，用 MiMo 进行轻量级交互，再通过海外模型处理特定国际化业务。

在这种背景下，星战科技正在推进的企业级AI接入方案，也开始强调“统一API入口、多模型调度、Token成本控制与私有化部署”能力。相比单一模型平台，越来越多企业更关注如何建立稳定、可控、低成本的AI调用体系，而不是被绑定在某一家模型厂商生态之内。从行业趋势来看，小米与 DeepSeek 的连续降价，本质上也意味着大模型行业开始进入规模化普及阶段。过去企业部署AI，最大的障碍之一是成本不可控。尤其长上下文、高频调用、多Agent协同场景下，Token消耗极快，很多中小企业难以长期承担费用。但如今随着推理优化、模型蒸馏、缓存机制与算力效率提升，Token成本正在快速下降。 AI.cc 发布的《2026 AI API基础设施报告》显示，过去一年企业级大模型 Token 调用成本同比下降超过 67%，开源模型已占据企业 Token 使用量的 38%。这意味着，大模型能力正在从少数科技公司的“高端资源”，逐渐演变成全民可调用的数字基础设施。与此同时，行业也开始出现明显分化。阿里云通义千问、豆包、小米、DeepSeek 等通用模型，正在通过降价扩大开发者生态与调用规模；而智谱、腾讯混元等偏企业级路线的模型，则更强调私有化、安全合规与行业定制能力。

大模型API“永久降价”加速：AI能力正在从“高成本资源”变成基础服务

总结

公司简介