作者:Prukalpa
原文:https://x.com/prukalpa/status/2018703494744600908
上下文图谱是近来热门的话题。然而,我总觉得这个故事似曾相识……
回想一下几年前语义层的热潮。各种会议、博客和推特都在宣称它是现代数据栈中缺失的一环。人们争论语义层应该放在中心层还是继续嵌入到工具中。作为首发合作伙伴,我亲历了dbt发布其语义层的过程,以及dbt和Transform在我们公司内部展开的激烈竞争。数据大辩论数据世界迅速攀升至过高的期望之巅,我们也悄然滑落至失望的低谷。
快进到今天,这种感觉惊人地相似。场景图谱的热潮始于去年12月,由Jaya Gupta发起和 Ashu Garg 的发布的文章,认为场景图谱是下一个万亿美元的商机。自那以后,人们一直在争论场景图谱应该是什么样子,如何构建它,以及它将如何影响更广泛的数据生态系统——包括来自 Glean 公司的首席执行官 Arvind Jain。而且,嗯,我首席信息官们纷纷发表对 LinkedIn 的热情评论,而各地的创业公司则将他们的产品定位为“X 的场景层”。
我完全赞同——关于场景图谱的讨论与我过去几年从数据领导者那里听到的观点不谋而合。上下文至关重要,而场景图谱有潜力解决这个问题。但我同时也目睹了当一个精妙的理论遇到混乱的企业现实时会发生什么。
所以我的问题是:
如何确保场景图谱避免重蹈语义层的覆辙?
语义层为何失败
曾经流行的观点,事后看来往往错得离谱。我们会改写历史,仿佛缺陷一直显而易见,结局也一直不可避免。
但事实并非如此,语义层并非源于糟糕的想法或不成熟的技术。事实上,从理论上讲,它具备所有成功要素。
语义层的核心承诺既简单又强大:
- 一个所有人都理解的通用指标定义平台。
- 无合约限制——客户可以自由切换工具
- 定义一次,即可处处使用
问题与价值的契合度非常高。所有人都认同这是必要的,数据人员宁愿跳窗逃生也不愿再为相互矛盾的指标或“活跃用户”的真正含义争论不休。问题与解决方案的契合度也无可挑剔——这项技术行之有效,dbt 的工具就证明了这一点,例如MetricFlow, Transform, Cube。
问题在于:产品与市场的契合度始终未能实现。语义层始终未能作为一个独立的类别脱颖而出。这并非因为人们不需要它,而是因为它遇到了三个结构性问题。
1.激励机制错位
对于 Power BI、Tableau 和 Looker 等公司而言,语义并非普通商品,而是护城河。尽管指标本身存在局限性,但它们早已存在于 BI 系统中。如果将它们放到独立的语义层,就意味着客户可以轻易地从一款 BI 工具切换到另一款。
BI没有动力去支持独立的语义层。本·斯坦西尔换句话说,“他们(BI 工具)一直不愿将语义层外包给他们无法控制、但其他人都可以使用的第三方。”
理论上,每个人都说他们想要开放性。实际上,每个主流的商业智能工具都想成为语义学的聚集地。
2. 迁移投入产出不划算
语义层风靡一时的那段时间,对大多数人的数据预算来说都是一段艰难时期。
当时,大多数企业已经构建了第一代BI系统。他们投入了数年时间和金钱来构建 Power BI 仪表板、Tableau 工作簿或 Looker 探索的第一版。
迁移到独立的语义层意味着要重建大部分技术栈,而最终的业务结果却基本相同,没有新的洞察或答案,只是承诺未来会更加清晰。
2023年数据预算收紧后,这种计算方式对企业来说很难让人接受,语义层似乎在商业上毫无意义。
3. 它不在执行路径中
语义层一直以来都被视为治理层,而不是执行层。
在使用语义层之前,必须先构建它并定义所有指标。它的价值体现在投资之后,而不是在工作过程中。即使设置完成后,分析师也并非每天都需要操作语义层来解答所有数据问题。它独立运行,根据需要在后台工作。
与此形成鲜明对比的是 Fivetran,它的成功在于数据摄取本身就是工作内容;而 dbt 的成功则在于数据转换本身就是执行路径。这些工具并非日常工作之上的附加层,它们本身就是工作内容,从第一天起就创造了价值。
指标存储的首要核心用例是BI仪表板或可视化,而将语义层构建融入日常工作流程是确保其持续运行的关键。乔治·弗雷泽预测道:“如果没有内置的可视化/仪表板/用户/权限层,他们(Looker)就无法销售他们的指标商店,这种情况不会改变。”
为什么场景图谱可能不同
乍一看,场景图谱似乎与语义层有着本质的区别。
任何从事人工智能相关工作的人都知道,上下文并非“锦上添花”,而是至关重要。缺乏正确的上下文,智能体就会产生幻觉、停滞不前,或者做出自信满满却又错误的决定。
正如Anthropic公司所说——“场景是AI智能体的关键但有限的资源”。
让人工智能发挥作用,关键在于场景工程。安德烈·卡帕蒂将其定义为“在上下文窗口中填充下一步所需的正确信息,这是一门精妙的艺术和科学”。或者说,托比·吕特克更确切地说,这是“为LLM提供所有必要的场景信息,使任务有可能得到解决的艺术”。
正是这个问题引起了场景图谱理论的强烈共鸣。Jaya 和 Ashu 道出了许多团队早已感受到的:记录系统捕捉了发生了“什么”,但却丢失了“为什么” ,也就是决定企业实际决策方式的所有机构记忆。场景图谱有望通过追踪决策过程并将这种逻辑转化为可搜索的先例来改变这一现状。随着时间的推移,这将成为AI智能体“人工智能智能体实现“自主性”的真相来源“。
场景图谱不同的情况
很容易将场景图谱与语义层或知识图谱等同起来。它们的原理相同:创建共享的真理来源。语义层旨在为分析创建单一真理来源,而当我们开始思考场景图谱时,它旨在为人工智能创建单一上下文来源。
事实上,人们对语义层、知识图谱、场景图谱和本体之间的区别一直存在很多误解,杰西卡·塔利斯曼(Jessica Talisman)甚至专门就此上周发表了一篇文章到元数据周刊(Metadata Weekly )。但我认为这忽略了一个非常重要的方面:在人工智能领域,上下文并非抽象概念或最佳实践。相反,上下文之于人工智能,正如数据之于商业智能,是系统运行的原始输入。
让AI智能体正常工作,关键在于为其提供正确的上下文。否则,智能体不仅效率低下或给出不确定的答案,还会直接失败。而且与语义不同,你无法在后期为人工智能添加上下文。场景是日常工作中至关重要的环节,它决定了代理接收哪些输入,并指导其输出。
简而言之,场景工程是工作内容,而场景就位于执行路径中。
场景图谱的致命缺陷
Jaya 和 Ashu 认为,垂直领域的智能体将掌握上下文信息,因为他们“处于执行路径上”。销售代理人将掌握续约上下文信息,客户支持代理人将掌握升级上下文信息,以此类推。
这种说法暗含着一个假设:存在一条单一的执行路径,上下文信息会自然地累积。对于简单的流程来说,这个假设成立,但除此之外就不成立了。大多数决策都发生在不同的流程和系统中,场景信息也来自四面八方。
例如,当续约代理提出 20% 的折扣时,它不仅仅从 CRM 系统中提取数据,还需要从以下多个渠道中提取数据。
- PagerDuty 事件历史记录
- Zendesk 用于升级线程
- Slack 上季度需要副总裁批准
- Salesforce 用于交易记录
- Snowlake 用于使用数据
- “健康客户”定义的语义层
虽然上下文在执行路径中绝对起着作用,但大多数决策并没有唯一的执行路径。
这是问题的关键所在,也是我曾经探讨过的内容。我之前的文章在企业上下文层面,异构性正沿着技术栈向上蔓延,从杂乱无章的数据工具扩展到日益庞大的AI智能体、辅助驾驶系统和应用程序。这意味着,尽管执行路径可能是局部的,但上下文却是全局的。
销售人员可以记录销售背景信息,支持人员可以记录支持背景信息。但是,如果不跨越数十个系统重建相同的集成、定义和假设,他们都无法看到,更遑论掌握决策背后的完整逻辑。
这种方法非但没有消除碎片化,反而有可能在更高一层重新创造碎片化:这么多的智能体,每个智能体都捕获部分上下文、嵌入私人定义、相互冲突的决策逻辑,以及他们自己私人定义的“为什么”。
场景层与语义层有着根本的不同……但如果我们将其构建成碎片化的、供应商拥有的、激励机制错位的孤岛,我们将以新的形式重蹈覆辙,犯同样的错误。
决定场景图谱存亡的原则
Fivetran 和 dbt 之所以能在日益混乱、碎片化的数据栈中胜出,并非因为他们承诺提供更优的架构,而是因为他们直接融入到日常数据仓库构建工作中,将自身打造为工作平台,而非凌驾于其上的一个层。他们从一开始就创造了价值,并随着时间的推移不断改进——无需耗时两年的初步标签项目。
如果场景图谱要真正发挥其巨大的潜力,就必须遵循同样的模式。本体构建不能是一个耗时三年的IT项目,也不能成为阻碍工作的绊脚石。它必须经过深思熟虑,自然而然地构建起来,随着智能体的部署和决策的制定而逐步形成。
以下四个原则将使情境层真正成为现实,而不仅仅是炒作:
1. 专为人类协作而设计,而不仅仅是为机器
场景不能是一个黑箱。如果代理人提出20%的续约折扣,人们需要了解背后的原因,不仅仅是结果,还有背后的逻辑:哪些信号起了作用,参考了哪些先例,以及做出了哪些假设。
人们需要能够根据组织环境审查这些流程,更重要的是,还要能够纠正这些流程。例如,假设一位代理人在处理续约决定时,因为客户是预算充足的企业客户,所以决定不给予折扣。但如果这位代理人忽略了这位客户不仅有流失风险,而且还是公司在新行业的重要标杆客户呢?这完全是另一种情况,需要不同的处理方法,而这种方法并非代理人能够完全掌握的。
来自人类的反馈,不仅来自人工智能工程师,也来自所有一线团队,将创造机构知识,并使系统随着时间的推移变得更加智能。
2. 机器原生且为变化而生
场景层不能仅仅围绕现有的协议来设计,我们仍处于智能体基础设施的早期阶段,变化是必然的。
最初使用人工智能时,大部分工作都是由人类完成的,人工智能只是在过程中提供一些帮助(即人工智能辅助工作流程)。但最近,我们正处于人工智能增强工作流程的早期阶段。这种模式发生了转变,人工智能开始承担大部分工作,然后才向人类寻求帮助。
过去一个月就是一个很好的例子,整个科技界都为人工智能增强型编程的巨大进步而兴奋不已。西蒙·威利森换句话说,“我真的觉得 GPT-5.2 和 Opus 4.5 在 11 月的发布代表了一个转折点——模型逐渐改进,跨越了一条看不见的能力界限,突然间,一大堆更难的编码问题被打开了。”
我不知道接下来会发生什么,但我可以保证,MCP、A2A 以及如今的智能体框架绝不会是我们构建的最终版本。场景层必须首先面向人工智能使用,由人工智能承担繁重的工作,并在需要时向人类寻求帮助,而不是反过来。更重要的是,它必须具备适应变化的能力。我们不能仅仅根据当今世界的情况来构建场景层,因为我们无法预知未来。
3. 开放、便携,且规模大于任何单一供应商
企业已经从Iceberg中学到了重要的一课:将你最重要的战略资产交给单一供应商,就会造成永久性锁定。
公司决策背后的逻辑,也就是其决策过程的积累,比原始数据更有价值。没有哪家企业会把这种逻辑拱手让给十几家垂直领域的初创公司,让它们各自掌握公司运营DNA的一部分。
如今,世界瞬息万变,我们正步入大规模创新周期,这一点显得尤为重要。任何企业目前最不应该做的就是只选择一家供应商、一个LLM 系统,从而被锁定。万一选错了怎么办?
理想的场景层必须开放且可移植,上下文需要能够随你跨越智能体、LLM、云平台和工具进行迁移,而不是被束缚于单一的执行环境。
4. 一个共享大脑,多个智能体
垂直智能体可以为各个工作流程运行飞轮,但共享上下文层只需在平台级别运行一次飞轮,所有代理都能从中受益。
举个例子:假设一家公司的销售漏斗顶端资格审核员或入站业务拓展代表发现,某个新类别或搜索词的咨询量有所增加。这一信息需要传递给市场营销人员,以便他们完善公司的理想客户画像 (ICP) 并制定即将开展的营销活动。同时,内容营销人员也需要了解这一信息,以便撰写一篇关于这个新兴关键词的博客文章。
这就是复合效应发生的地方,每个智能体都从同一个鲜活的真理源中学习,因此每个上下文信息都会改进整个系统,每个用例都会让整个企业变得更加智能。
真正的万亿美元问题
我希望场景图谱能够成功。它们所解决的问题真实存在、迫在眉睫,而且对于当今所有使用人工智能的企业来说都不可回避。
但我见过这样的例子:一些精妙的想法最终变成了独立的基础设施,无法融入日常工作,而且需要很长时间才能证明其价值。语义层就是这样失去了它原本的潜力。
如果场景图谱遵循语义层的模式,它们也将面临同样的命运:前期投入巨大、供应商锁定和垂直碎片化。
还有另一种途径:在部署AI智能体的同时构建构建,使其从人们的工作中涌现,而不是阻碍工作。这是一种开放的、联邦式的、企业所有制的,并且会随着时间的推移而不断改进的模式。
正如Jaya和Ashu所说,万亿美元的商机确实存在。但抓住这个商机的途径并非依靠垂直的智能体构建孤立的上下文图谱。在异构化的世界里,整合者总是最终的赢家。在企业吸取了Iceberg教训的当下,能够让客户掌控自身上下文的平台,终将战胜那些试图替客户掌控上下文的平台。
场景图谱很有价值——这一点毋庸置疑。真正值得探讨的是如何构建它们。是构建成垂直的孤岛,从而无意中重现碎片化问题,还是构建成一个通用的、开放的层,从而一劳永逸地解决这个问题?
这个故事我以前看过。这一次,我希望结局会不一样。