Skip to content

Kimi(月之暗面):一个 30 岁创业者,如何用"长上下文"撼动中国 AI 市场

2023 年 11 月,一个叫 Kimi 的 AI 产品悄然上线。主打的卖点很简单也很夸张:支持 200 万中文字的超长上下文。当时的 AI 聊天产品,上下文窗口基本在 8K-32K tokens(大概几千中文到几万字),突然跳出来一个说能处理 200 万汉字的,很多人第一反应是"营销噱头"。

但 Kimi 是真的能做到。你可以上传整本《三体》三部曲(约 90 万字),然后问它"汪淼和罗辑有没有间接交集?"。Kimi 会分析全文,找到答案,还能引用原文出处。这不是简单的关键词检索——它真的在"阅读"和"理解"200 万字的内容。

月之暗面(Moonshot AI)由杨植麟(Yang Zhilin)创立于 2023 年 3 月。杨植麟是清华交叉信息学院的博士,卡内基梅隆大学博士后,在 NLP 学术界有深厚的积累。30 岁出头,已经累计融资超过 10 亿美元——在 AI 创投圈被称为"中国最贵创业项目之一"。

200 万中文字 ≠ 200 万 Token,这很重要

很多人搞混了一个概念:"200 万中文字"和"200 万 token"是完全不同的量级。Token 是模型处理的最小单位——英文大概每 4 个字符一个 token,中文大概每 1-2 个汉字一个 token。Kimi 的 200 万中文字换算下来大约相当于 400 万 token

作为对比:

  • GPT-5.5:1M token(约 75 万英文字)
  • Claude Opus 4.7:1M token
  • Gemini 3.5:1M token
  • DeepSeek-V4:1M token
  • MiniMax-01:400 万 token

Kimi(初代)在 2023 年底就让上下文达到了 400 万 token 级别。当时所有竞品(GPT-4 是 32K-128K,Claude 是 100K)都远远无法企及。直到 2025 年,多数商业模型才把上下文提升到 1M,Kimi 的首发优势至少领先了一年以上。

怎么做到的?RoPE + 优化的注意力机制

长上下文的实现不是"把窗口参数调大就行",那是会崩的。核心难点有两个:

第一:位置编码(Position Encoding)的泛化。标准的绝对位置编码在训练时的最大长度是固定的(比如 2048),如果推理时超过这个长度,模型就会"迷路"——它无法理解超出训练范围的位置关系。Kimi 使用的是 RoPE(Rotary Position Embedding)的扩展版本,通过对位置编码的频率进行插值或外推,让模型在没有训练过长序列的情况下,仍然能够推理到远超训练长度的上下文。

这就像是教一个人阅读 10 页的文档,但给了他一种能力让他可以在第一次面对 500 页的书时也能理清页码关系。技术上主要通过 NTK-aware scaling 和 YaRN 等方法对 RoPE 的频率进行非线性缩放实现。

第二:注意力机制的显存瓶颈。标准 Attention 的显存随序列成 O(n²) 增长,200 万中文字 = 400 万 token,粗算下来 KV Cache 的显存开销会是天文数字。Kimi 必然使用了某种形式的稀疏注意力或分块注意力来降低这个开销——具体技术细节月之暗面没有完全公开,但从公开信息来看,可能采用了类似 Ring Attention 的分布式长序列处理,结合 Flash Attention 的算子优化,在多 GPU 上并行分块计算注意力。

更关键的验证是"大海捞针"测试——在超长文本中隐藏一个非常具体的事实(比如"第 127354 句提到小明在东京吃了个苹果"),然后问他"小明在哪里吃了什么"。Kimi 在 200 万字窗口内的"大海捞针"准确率达到了接近 100%——这证明它不只是"支持"长上下文,而是真的能"利用"长上下文。

Kimi K2:从"读得多"到"想得深"

如果说初代 Kimi 的核心竞争力是"长",那 Kimi K2 的升级方向就是"聪明"。2025 年发布的 K2 在保留长上下文优势的基础上,大幅增强了推理能力。Kimi K1.5 作为中间版本,开始探索推理链强化学习,而 K2 进一步整合了多步推理、工具调用、和自主决策能力。

Kimi K2 的性能在多个基准上挑战了前沿水平——数学推理、代码生成、多工具协作。在一些 Agent 基准测试中,K2 表现出超出预期的能力:它能自主使用浏览器、解析网页结构、提取结构化数据、然后基于提取的信息做多步分析——这些是真正"有用"的 Agent 能力,而不仅仅是在封闭基准上做题。

2026 年,Kim K2 继续作为月之暗面的旗舰模型,在中文长文本和 Agent 两个核心场景上持续巩固优势。

Kimi 探索版:把"研究"交给 AI

"探索版"是我觉得 Kimi 产品线里最有趣的功能。它的工作方式是这样的:

  1. 你问一个复杂问题(比如"对比一下华为和小米的 AI 战略差异")
  2. Kimi 不直接回答,而是自己分解成多个子问题(华为的 AI 战略是什么?小米的 AI 战略是什么?它们的芯片策略差异?人才布局差异?)
  3. 然后自动搜索多轮——它可以搜索数十个网页、阅读相关内容、综合信息
  4. 最后生成一份结构化的分析报告,包含对比表格、要点总结和引用来源

本质上,探索版是一个自主研究的 Agent——它模拟了人类做研究的过程:分解问题 → 收集资料 → 分析比较 → 形成结论。相比"一次性搜索+总结"的模式,探索版的多步分解和自主搜索让它能处理更复杂、更开放的问题。

举个例子:你让普通 AI "分析新能源车市场的竞争格局",它的回答大概率是一段总结性的概括。你让 Kimi 探索版做同样的事,它可能会先搜索"2025 年中国新能源车销量排行榜",然后搜索"比亚迪的市场份额变化",再搜索"华为和小米的造车策略",最后综合这些具体数据生成一份有数据支撑的分析。

月之暗面的技术与产品哲学

观察 Moonshot AI 的发展,我发现他们有几个很坚定的选择:

第一,做减法,不做什么。 Kimi 一直没有做图像生成(不像 MiniMax 的 CogView)、没有做语音合成(不像 MiniMax Speech)、没有做视频生成。它的核心产品就是一个"阅读+思考"的 AI 助手——你可以喂给它超长文档、让它搜索网页、让它做分析推理,但它不会帮你画图做视频。这在"什么都能做"的 AI 市场里很少见,但也很聪明——聚焦让 Kimi 在"阅读分析"这一个点上做到了极致。

第二,重视产品体验胜过技术跑分。 Kimi 的网页端和 App 界面设计简洁干净,没有乱七八糟的功能堆砌,交互逻辑清晰。在中文长文本上传和分析这个场景下,用户体验是所有竞品中最好的——包括文件上传的稳定性、阅读进度的展示、引用的精确度。

第三,C 端优先。 和智谱(to B 为主)不同,月之暗面的核心用户是普通消费者——学生看论文、律师看合同、分析师看财报、作者看长篇资料。Kimi 已经积累了超过 3000 万用户,在中文 AI 产品里是月活最高的之一。API 收入固然稳定,但 C 端的规模效应和品牌价值是 B 端给不了的。

市场格局:Kimi 在中国 AI 混战中的位置

中国 AI 市场大概是全球竞争最激烈的地方:

  • Kimi:长上下文 + 搜索 + 阅读分析
  • DeepSeek:极致性价比 + 开源
  • Qwen(通义千问):开源生态 + 全能矩阵
  • 智谱 GLM:学术底蕴 + 企业服务
  • 豆包(字节):短视频生态 + 海量用户
  • 文心一言(百度):搜索生态 + 中国市场

Kimi 的差异化在于:它是一个"做减法"的产品。其他家都在做"万能 AI",Kimi 专注在一个场景里做到第一。这种策略在小公司对抗巨头时往往是正确的——你不需要在所有维度上都比对手强,只需要在一个用户真正需要的维度上做到"不可替代"。

挑战与争议

月之暗面面临的核心挑战是:

可持续性。 长上下文处理的计算成本极高。每次推理需要处理 200 万中文字的上下文,意味着推理成本是同等质量但 128K 上下文模型的 10-30 倍。如果 Kimi 的用户规模继续增长,算力开支会是一个天文数字。杨植麟融了超过 10 亿美元,但这个钱在 AI 算力面前并不经花。

长上下文优势的"保质期"。 当 GPT-5.5、Claude 4.x、Gemini 3.x 都把上下文做到了 1M token 级别,Kimi 的独有优势正在被蚕食。虽然 400 万 token 仍然大于 100 万,但对于大多数实际场景(几本书、一大堆合同),1M token 已经够用了。

商业化路径。 Kimi 目前主要依赖订阅制 + 部分企业合作,API 定价相对主流。在 DeepSeek 的"白菜价"面前,Kimi 不可能打价格战——它必须靠产品和体验的溢价来维持商业模型。

杨植麟本人的争议。 2024 年底,关于杨植麟"套壳模型"和"过于激进的融资策略"的讨论在 AI 圈子里一度很热烈。不过这些争议更多是行业八卦,对普通用户来说并不重要——Kimi 好用才是王道。

我的建议

  • 如果你经常需要阅读和分析长篇内容——论文、书籍、法律文件、财报、合同——Kimi 是目前最好的选择,没有之一。 200 万中文字的上下文能力和搜索整合,在这个场景下是碾压级的。
  • 需要深度研究和多源信息整合:用 Kimi 探索版——它不只是搜索,是真的在帮你"做研究"。
  • 日常对话、创意写作、代码生成:Kimi 不是最优选择——这些场景我更推荐 Claude Sonnet 4.6(代码)、GPT-5.4(综合)、或 DeepSeek-V4(中文高性价比)。
  • 学生和研究者:Kimi 是你的"研究副驾驶"——把参考文献丢给它,让它帮你快速了解一个领域的已有成果。
  • 律师/分析师/咨询师:长文档对比分析是 Kimi 最擅长的——把多份合同/报告一起丢进去做交叉对比,省的时间是真实的。

总结一下我的判断:Kimi 是"AI 时代的 Kindle + 研究助手"——你不要指望着它什么都做,但在"阅读、理解、分析长篇内容"这件事上,目前还没有对手能真正撼动它。问题是这个利基(niche)能否大到支撑一家估值数十亿美元的公司,月之暗面需要用 K3 或未来的产品进化给出答案。

基于 VitePress 构建 | 部署于 Cloudflare Pages