而在这一轮变化背后,除了模型公司本身,大模型API聚合平台、算力调度平台以及AI基础设施服务商的价值也开始同步上升。包括星战科技推出的星战云大模型API平台,也正在围绕多模型调度、Token成本优化、API统一接入等方向展开布局。随着企业开始同时接入 DeepSeek、MiMo、通义千问、Claude 等多个模型,“如何低成本、高效率地调用AI能力”,已经逐渐成为新的行业核心问题。
此次小米降价覆盖 MiMo-V2.5 核心系列,并同步优化 Token Plan 计费机制。在相同预算下,企业可获得原先 5 至 8 倍的 Token 调用量,整体性价比明显提升。以 MiMo-V2.5-Pro 为例,输入缓存命中价格最低已降至 0.025 元/百万 Tokens,部分规格降幅甚至达到 99%。而标准版 MiMo-V2.5 同样进行了大规模调价,进一步降低中小开发者与轻量级AI应用的使用门槛。

值得注意的是,这一轮降价并不仅仅是“价格战”。
过去几年,大模型行业普遍依赖高昂训练成本与GPU资源建立竞争壁垒,但随着模型能力逐渐趋同,企业开始意识到:真正决定商业落地速度的,不再只是模型本身,而是整体AI调用成本、推理效率以及开发接入难度。
尤其在 Agent、AI办公、智能客服、AI营销、自动化工作流等场景持续爆发后,企业对 Token 的消耗量正在呈现指数级增长。越来越多公司开始从“采购模型”转向“持续消耗Token”,AI能力本身也正在向类似云计算、水电煤一样的基础服务形态演化。
这种变化,也让AI API聚合平台的重要性迅速提升。
因为对于企业来说,同时接入多个模型已经成为趋势。不同模型在推理能力、价格、上下文长度、响应速度以及多模态支持方面各有差异,企业往往需要根据业务场景动态切换模型能力。例如部分企业会使用 DeepSeek 处理复杂推理任务,用 MiMo 进行轻量级交互,再通过海外模型处理特定国际化业务。

在这种背景下,星战科技正在推进的企业级AI接入方案,也开始强调“统一API入口、多模型调度、Token成本控制与私有化部署”能力。相比单一模型平台,越来越多企业更关注如何建立稳定、可控、低成本的AI调用体系,而不是被绑定在某一家模型厂商生态之内。
从行业趋势来看,小米与 DeepSeek 的连续降价,本质上也意味着大模型行业开始进入规模化普及阶段。
过去企业部署AI,最大的障碍之一是成本不可控。尤其长上下文、高频调用、多Agent协同场景下,Token消耗极快,很多中小企业难以长期承担费用。但如今随着推理优化、模型蒸馏、缓存机制与算力效率提升,Token成本正在快速下降。
AI.cc 发布的《2026 AI API基础设施报告》显示,过去一年企业级大模型 Token 调用成本同比下降超过 67%,开源模型已占据企业 Token 使用量的 38%。这意味着,大模型能力正在从少数科技公司的“高端资源”,逐渐演变成全民可调用的数字基础设施。
与此同时,行业也开始出现明显分化。
阿里云通义千问、豆包、小米、DeepSeek 等通用模型,正在通过降价扩大开发者生态与调用规模;而智谱、腾讯混元等偏企业级路线的模型,则更强调私有化、安全合规与行业定制能力。