第37章 案例五:AI 公司如何识别真飞轮与伪飞轮

AI 时代最容易出现的一种误判,是把“技术看起来很强”误判成“商业模式已经成立”。

模型很强,不等于公司有护城河。

用户增长很快,不等于系统有正反馈。

调用量很大,不等于客户离不开。

演示效果惊艳,不等于真实工作流被嵌入。

融资很多、算力很多、新闻很多,也不等于这家公司会越来越强。

AI 公司当然可能形成非常强的正反馈,但它的飞轮必须被严格识别。因为 AI 行业里有太多“看起来像飞轮”的东西,实际只是热度、资本、算力、流量或短期新鲜感。

这一章要回答最后一个案例问题:在 AI 公司里,什么是真飞轮,什么是伪飞轮?

一、AI 公司最常见的伪飞轮:更多用户使用,不等于系统更强

很多人会天然认为:AI 产品用户越多,数据越多,模型越好,产品越强,所以飞轮成立。

这句话只在很苛刻的条件下成立。

原因很简单:不是所有使用都会留下有价值的数据,也不是所有数据都能改善产品,更不是所有改善都会只属于这家公司。

一个普通 Chatbot,如果用户只是随便问问题、写文案、查资料、聊天、生成图片,那么它确实会产生大量交互记录。但这些记录未必构成真正的商业资产。

它们可能有几个问题:

第一,数据噪音很大。

用户输入杂乱,任务边界不清,质量标准不稳定,很多内容只是一次性表达,不构成可复用知识。

第二,反馈信号很弱。

用户是否满意,很多时候没有明确标注。即使用户继续聊天,也不代表答案正确;即使用户停止使用,也不一定知道哪里失败。

第三,数据不一定独占。

如果底层模型来自外部模型公司,产品公司拿到的使用数据能否训练出独特能力,取决于数据权属、工程能力、标注能力和任务闭环。

第四,模型改进可能外溢给所有竞争者。

如果用户增长只是带来更多通用需求,而底层通用模型持续进步,那么竞争对手也能受益。公司未必因为自己用户更多就形成独特优势。

第五,用户迁移成本可能很低。

如果产品只是一个对话框,用户可以今天用 A,明天用 B,后天用系统自带工具。使用量不等于锁定。

所以 AI 产品的第一条判断是:

更多使用之后,系统里到底留下了什么?

如果只留下 token 消耗、聊天记录和短期活跃,那不是飞轮。

二、真飞轮的第一条件:使用必须进入真实任务

AI 公司的真飞轮,首先不应该建立在“聊天”上,而应该建立在“真实任务”上。

真实任务有几个特征:

  1. 有明确目标;
  2. 有上下文;
  3. 有操作对象;
  4. 有质量标准;
  5. 有反馈结果;
  6. 有后续动作;
  7. 有重复发生的场景。

比如,一个企业用 AI 处理客服工单,这不是随便聊天。每一个工单都有客户问题、历史记录、产品信息、处理动作、满意度、是否升级、是否解决等反馈。

再比如,一个代码智能体帮工程师修改代码。它不是单纯回答“怎么写函数”,而是进入代码库、理解上下文、修改文件、运行测试、根据错误反馈继续修正。

再比如,一个法律、财务、医疗、投研、供应链或销售系统中的 AI,如果它只是生成一段文字,价值有限;如果它进入业务流程,参与资料读取、判断、操作、校验、归档和复盘,价值就完全不同。

真实任务会产生更强的数据。

因为真实任务里的数据不是空泛语料,而是带有场景、约束、动作和结果的任务数据。它能告诉系统:什么输入导致什么输出,什么输出被采纳,什么动作失败,什么结果有效,什么风险被暴露。

这种数据才可能形成正反馈。

三、真飞轮的第二条件:必须有结果反馈

AI 公司最关键的正反馈对象,不是“数据”两个字,而是“可验证结果”。

没有结果反馈,AI 系统很难知道自己有没有真的变好。

很多生成式 AI 产品看起来很聪明,但缺少闭环。它给出答案,用户复制走了,之后发生什么,系统不知道。答案有没有被采用?有没有出错?有没有帮用户省时间?有没有带来收入?有没有降低风险?系统都不知道。

这种情况下,使用量再大,也很难形成高质量学习。

真飞轮需要结果反馈。

结果反馈可以有很多种:

代码是否通过测试;

客服问题是否解决;

销售线索是否转化;

文档是否被采用;

合同风险是否被后续验证;

预测是否命中;

流程是否缩短;

成本是否下降;

客户是否满意;

任务是否按时完成;

业务结果是否改善。

AI 商业模式越往 Outcome 靠,结果反馈越重要。

因为 Outcome 模式不是卖“我生成了多少字”,也不是卖“我调用了多少 token”,而是卖“我帮你完成了什么结果”。一旦卖结果,公司就必须定义结果、追踪结果、验证结果、归因结果,并承担一部分责任。

这个过程本身会形成新的数据壁垒。

谁更早进入结果闭环,谁就更可能知道什么才是真正有效的智能。

四、真飞轮的第三条件:必须嵌入工作流

AI 产品如果停留在工具层,替换成本通常较低。

工具可以好用,但好用不一定形成护城河。尤其在 AI 时代,底层模型能力快速扩散,很多工具功能会被平台、操作系统、办公软件、浏览器、云厂商、SaaS 巨头内置。

所以判断 AI 公司时,要看它有没有从“工具”进入“工作流”。

工具是用户主动打开来用;

工作流是用户的任务自然经过它。

工具解决一个点;

工作流连接多个步骤。

工具可以被替换;

工作流一旦嵌入组织流程、权限、数据、审批、记录、协作和结果归因,就更难替换。

举例来说,一个 AI 写作工具,如果只是帮用户写邮件,可能很容易被其他模型替代。但如果它进入企业销售流程,连接 CRM、客户历史、报价系统、合同模板、审批流程、成交结果和后续复盘,它就不再只是写作工具,而是销售工作流的一部分。

再比如,一个 AI 编程工具,如果只是自动补全,替代风险很高;如果它进入代码库、CI、测试、Issue、Review、部署和错误追踪,它就更接近生产系统。

工作流嵌入会形成几个正反馈:

第一,任务上下文越来越完整。

第二,系统对组织流程越来越了解。

第三,用户越用越依赖历史记录和流程配置。

第四,结果反馈越来越可追踪。

第五,迁移成本越来越高。

所以 AI 公司真正的护城河,往往不在对话框里,而在它进入了多少真实工作流。

五、真飞轮的第四条件:数据必须独特、可用、可行动

AI 公司常说“我们有数据”。

但投资判断不能停在这句话。

必须继续问四个问题:

第一,这些数据是否独特?

如果竞争对手也能轻易拿到,数据不构成壁垒。

第二,这些数据是否有结构?

没有结构的数据很难直接变成系统能力。大量聊天记录如果没有任务标签、上下文、反馈和结果,很可能只是噪音。

第三,这些数据是否可用?

数据是否能合法使用?是否有隐私和合规限制?是否能用于训练、微调、检索、评估或流程优化?

第四,这些数据是否可行动?

数据能不能直接改善产品表现、降低成本、提高成功率、减少错误、缩短流程或提升客户结果?

只有同时满足这些条件,数据才可能成为正反馈对象。

否则,“数据越多越强”只是口号。

真正有价值的是任务数据、流程数据、结果数据、纠错数据和组织上下文数据。

这些数据不是互联网上随便抓来的,而是在真实工作中沉淀出来的。

六、伪飞轮清单:AI 公司最容易骗到人的指标

AI 公司有很多漂亮指标,但不少指标不能直接证明商业模式成立。

第一,模型榜单不是飞轮。

模型跑分领先,说明当前能力强,但不等于商业闭环强。尤其当模型能力快速追赶时,单点领先可能很快被抹平。

第二,token 调用量不是飞轮。

调用量大可能说明用户试用多,也可能说明成本高、效率低、任务低价值。token 是消耗,不天然是资产。

第三,月活不是飞轮。

月活高不代表高留存、高付费、高迁移成本或高结果价值。AI 产品的新鲜感很容易制造短期活跃。

第四,Demo 惊艳不是飞轮。

Demo 只证明某个场景下可以展示,不证明复杂真实环境中稳定交付。

第五,融资和 GPU 规模不是飞轮。

资本和算力是资源,不是商业模式。资源可以放大优势,也可以放大错误。

第六,套上 Agent 名字不是飞轮。

很多所谓 Agent 只是多步提示词和工具调用。真正的 Agent 飞轮必须有任务闭环、权限边界、错误反馈、结果验证和长期记忆。

第七,平台热度不是飞轮。

生态热闹、开发者多、插件多,未必说明核心公司能捕获价值。要看价值最终被谁拿走。

这些指标不是没用,而是不能单独使用。

它们最多是线索,不是结论。

七、真飞轮清单:AI 公司应该被问的十个问题

判断一家 AI 公司有没有真飞轮,可以用十个问题。

第一,用户使用之后,哪个对象变强了?

是模型能力、任务数据、工作流、客户关系、结果验证能力,还是只是消耗了 token?

第二,使用数据是否独特?

竞争对手能不能用相同模型、相同公开数据、相同产品形态快速复制?

第三,数据是否带结果反馈?

系统知道自己做得对不对吗?还是只知道用户输入了什么?

第四,产品是否嵌入真实工作流?

用户是偶尔打开,还是日常任务必须经过它?

第五,客户迁移成本是否上升?

越用之后,客户是不是积累了历史、配置、流程、权限、团队习惯和结果记录?

第六,收费是否靠近价值结果?

它卖的是 token、订阅、座席、动作、工作流,还是结果?越靠近结果,越需要真实能力,也越可能形成更深护城河。

第七,底层模型进步是增强它,还是削弱它?

如果通用模型变强后,客户更容易绕过它,那它的护城河弱;如果通用模型变强后,它的工作流系统、数据和交付能力更强,那它可能受益。

第八,单位经济模型是否改善?

规模扩大后,推理成本、服务成本、交付成本是否下降?还是用户越多亏损越大?

第九,错误责任如何处理?

高价值任务一定涉及错误、责任和信任。如果公司不能处理责任边界,就很难进入高价值工作流。

第十,增长之后留下了什么?

这是全书的核心问题。AI 公司也逃不过这一问。

八、AI 公司真正可能形成护城河的地方

综合来看,AI 公司真正可能形成护城河的地方,不只是模型。

模型当然重要,尤其在短期内,高级模型能力差异非常明显。但长期看,普通通用能力会越来越普及。真正稀缺的,可能是把高级可靠智能嵌入工作流、交付结果、承担责任并持续改进的系统能力。

未来 AI 公司的护城河可能出现在几个地方。

第一,高价值垂直工作流。

比如代码、法律、金融、医疗、工业、供应链、销售、客服、设计、投研等领域。越高价值、越长链条、越难校验、越需要上下文,越可能形成专业系统。

第二,专有任务数据和结果数据。

不是泛泛的语料,而是“真实任务如何完成”的数据。

第三,工作流嵌入和组织迁移成本。

AI 一旦成为组织生产流程的一部分,替换就不只是换一个模型,而是重做流程、权限、数据、培训和责任边界。

第四,结果验证与归因能力。

谁能定义结果、追踪结果、验证结果、按结果收费,谁就更接近商业模式上游。

第五,可靠性和责任系统。

高价值任务不是“生成一个看似正确的答案”,而是“在可接受风险内稳定交付”。这需要评估、审计、回滚、人工协同、权限控制和错误处理。

第六,分发入口。

如果 AI 公司控制高频入口、企业工作入口或开发者入口,它可能把模型能力转化成更强的平台优势。

所以 AI 公司最强的飞轮,不是“模型越大越强”,而是:

真实任务越多;

任务数据越好;

结果反馈越清楚;

工作流嵌入越深;

客户越信任;

高价值任务越多;

系统越能交付结果;

商业模式越靠近结果收费。

九、投资判断:别被 AI 的速度带偏

AI 行业变化很快,容易让人产生一种错觉:必须马上判断,必须马上追上,必须马上参与。

但价值投资里,越是变化快的领域,越要慢下来问底层问题。

技术进步是真实的;

用户兴奋也是真实的;

资本投入也是真实的;

但商业模式是否成立,仍然要回到正反馈对象。

一家 AI 公司看起来增长很快,不代表它越长越强。它可能只是烧钱买用户,或者把模型能力包装成产品,或者短期吃到平台空窗期。

真正值得重视的,是那些每一次交付之后都留下系统资产的公司。

它们留下的可能是:

更深的客户流程;

更好的任务数据;

更强的结果验证;

更高的客户信任;

更低的交付成本;

更强的组织学习;

更高的迁移成本;

更接近 Outcome 的收费能力。

这些东西才是 AI 时代的新正反馈对象。

十、本章小结

AI 公司最危险的误判,是把技术强、热度高、用户多、调用量大、融资多,当成商业模式飞轮。

真正的 AI 飞轮,必须回答一个更严格的问题:

使用之后,系统是否更懂真实任务?

交付之后,结果是否被验证?

客户越用,工作流是否越深?

数据越多,能力是否独特改善?

规模越大,单位经济是否更好?

模型进步,是强化它,还是替代它?

如果这些问题答不上来,再漂亮的 AI 故事也只是故事。

一句话压缩:

AI 公司的真飞轮,不是更多人和模型聊天,而是更多真实任务进入系统,生成独特数据、结果反馈、工作流嵌入和客户信任,让公司越来越能交付可验证的高价值结果。