垂直领域大模型逆袭：Cursor Composer 2以成本优势挑战通用AI巨头

2026年3月19日，知名AI集成开发环境Cursor发布第三代自研编码模型Composer 2，其公布的基准测试数据显示，该模型在终端编码任务和多语言软件工程等场景中，性能已逼近Claude Opus 4.6等通用大模型，而成本仅为后者的十分之一。这场垂直领域与通用AI的正面较量，揭示了AI产业算力优化与专业化分工的新趋势。

在Terminal-Bench 2.0测试中，Composer 2取得61.7%的得分，较Claude Opus 4.6官方公布的58.0%基准高出3.7个百分点。但行业观察人士指出，由于Anthropic采用优化配置时该指标可达65.4%，实际性能对比仍需考量测试框架差异。值得关注的是，Cursor专门设计的CursorBench内部测试中，Composer 2以61.3%的得分超越上一代44.2%的表现，验证了其针对真实开发场景的优化成效。

成本优势成为Composer 2的核心竞争力。该模型定价仅为每百万token输入0.5美元/输出2.5美元，相比Claude Opus 4.6和GPT-5.4具有显著价格优势。Cursor透露，这一突破得益于专为长周期编码任务设计的RL训练框架，以及独创的"自我摘要"技术，在保持模型性能的同时大幅降低算力消耗。此次发布折射出AI产业的结构性变化。随着大模型基础设施日趋成熟，头部厂商如OpenAI、Anthropic持续深耕通用能力，而Cursor等垂直领域玩家则通过任务专用化实现降本增效。据The NewStack分析，Composer 2的推出将加速"多模型路由"架构的普及，开发者可根据任务复杂度灵活调用不同层级的AI算力资源。

总结