作者:Jaya Gupta 和 Ashu Garg
原文:https://x.com/JayaGup10/status/2003525933534179480
上一代企业软件通过成为记录系统,创造了一个价值万亿美元的生态系统。Salesforce 服务于客户,Workday 服务于员工,SAP 服务于运营。掌握了权威数据,掌握了工作流程,也就掌握了锁定效应。
目前的争论焦点在于,这些系统能否在向智能体过渡的过程中继续存在。Jamin Ball 最近发表的文章——“记录系统万岁”这番话触动了大家的神经。他反驳了“智能体扼杀一切”的说法,认为智能体不会取代记录系统,而是提高了优秀记录系统的标准。
我们一致认为,智能体具备跨系统属性,且以行动为导向。工作场景的用户体验正与底层数据层逐步解耦,智能体将成为核心交互界面,但底层仍需存在一套标准化的权威体系。
需要进一步指出的是,Jamin Ball的框架假设智能体所需的数据已存在于某个载体中,其核心诉求仅为实现对这些数据的更高效访问,同时建立更完善的治理体系、语义契约,以及明确的规则体系,界定不同定义在不同应用场景下的有效性判定标准。
这只是问题的一半,另一半则是支撑企业实际运转、却长期缺失的关键层级:即决策轨迹(Decision Traces) —— 包括那些当下散落在在Slack中的对话串、交易台沟通记录、通话内容,以及员工脑海中的例外情况、人工干预操作、过往先例和跨系统上下文信息。
这才是关键的区别:
规则告诉智能体一般应该怎么做(“使用官方 ARR 进行报告”)
决策轨迹记录了此特定案例中发生的事情(“我们使用了 X 定义,在策略 v3.2 下,并根据先例 Z 进行了 VP 例外处理,以下是我们所做的更改”)。
智能体需要的不仅仅是规则,他们还需要访问决策轨迹,这些轨迹显示了规则在过去是如何应用的,例外情况是如何被批准的,冲突是如何解决的,谁批准了什么,以及哪些先例实际上支配着现实。
这就是智能体初创公司所具有的结构性优势所在,它们位于执行路径中,能够在决策时看到完整的上下文:跨系统收集了哪些输入、评估了哪些策略、调用了哪些异常处理路径、由谁批准以及写入了哪些状态。如果将这些跟踪信息持久化,就能获得目前大多数企业所不具备的东西:一份可查询的决策制定过程记录。
我们将这些轨迹累积形成的结构称为场景图谱:它并非“模型的思维链”,而是跨越实体、时间串联而成的决策轨迹动态记录,使得先例可追溯。随着时间的推移,这些场景图谱成为自主性决策的真正事实来源——因为它不仅解释了发生了什么,还解释了这些事情为什么允许发生。
核心问题不在于现有的记录系统能否存续,而在于是否会涌现出全新的记录系统——用于记录决策而非仅仅是对象的记录系统——以及这些系统是否会成为下一个价值万亿美元的平台。
记录系统无法捕捉到的信息
智能体正在投入到真实的工作流程中——合同审查、报价到收款、支持问题解决——但团队遇到了仅靠管理无法解决的难题。
这堵墙并非缺少数据,而是缺少决策轨迹。智能体正遭遇着与人类每天依靠判断和组织记忆解决同类型的歧义问题,而支撑这些判断的关键输入信息,并没有被转化成长期留存的资产。具体来说:
- 存在于人们脑海中的例外逻辑。“我们总是给医疗保健公司额外10%的折扣,因为他们的采购周期非常漫长。” 这并非记录在客户关系管理系统(CRM)中,而是通过入职培训和非正式交流代代相传的经验。
- 以过往决策为先例。“我们上个季度为X公司设计了类似的交易——我们应该保持一致。”但系统并未将这两笔交易关联起来,也没有记录选择这种结构的原因。
- 跨系统整合。客户支持主管查看 Salesforce 中的客户年度经常性收入 (ARR),发现 Zendesk 中有两个未解决的升级问题,阅读 Slack 上关于客户流失风险的讨论串,然后决定升级。这种整合过程在他们的脑海中完成,而工单上只显示“已升级至三级支持”。
- 审批链发生在系统之外。例如,一位副总裁通过 Zoom 会议或 Slack 私信批准了一项折扣。商机记录显示的是最终价格,但不会显示是谁批准了这项折扣,也不会显示原因。
这就是“从未被采集”的含义,并非指数据不完整或信息孤岛,而是指将数据与行动联系起来的逻辑从一开始就从未被当作数据来对待。
场景图谱是个持续存在的层级
当初创公司对智能体编排层进行改造,使其在每次运行时发出决策轨迹时,他们就能获得企业如今几乎从未拥有过的东西:一个结构化的、可重放的历史记录,记录了上下文如何转化为行动。
这在实际操作中会是什么样子呢?一位续约专员提出20%的折扣。政策规定续约折扣上限为10%,除非因影响服务水平事件而获得例外情况的批准。该专员从PagerDuty中提取了三个SEV-1级别的事件,Zendesk中一个未解决的“除非修复否则取消”的升级请求,以及上个季度一位副总裁批准类似例外情况的续约讨论记录。他将该例外情况提交给财务部门。财务部门批准了。最终,CRM系统中只记录了一条信息:“20%折扣”。
一旦有了决策记录,“为什么”就成了核心数据。随着时间的推移,这些记录自然而然地形成了一个场景图谱:企业已经关注的实体(账户、续订、工单、事件、策略、审批人、智能体运行)通过决策事件(关键时刻)和“为什么”链接连接起来。现在,企业可以审计和调试自主流程,并将异常情况转化为先例,而不是每个季度都在 Slack 中重新学习相同的极端案例。
反馈循环是构成这一体系的关键,采集的决策轨迹成为可搜索的先例。而每一次自动化决策都会在图中添加一条新的轨迹。
这一切并不需要从一开始就实现完全自主。它始于人机协作:智能体提出方案、收集上下文信息、处理审批流程并记录路径。随着时间的推移,当类似案例不断重复出现时,由于系统拥有一个结构化的先前决策和例外情况库,因此可以实现更多流程的自动化。即使最终仍由人来做决定,图谱也会持续增长,因为工作流层会将输入、审批和理由作为持久的先例记录下来,而不是让它们在 Slack 等闲置资源中失效。
为什么在位者无法构建场景图谱
Jamin Ball乐观地认为,现有的参与者会逐步演进到这种架构中。数据仓库会变成“真理注册表”,而客户关系管理系统(CRM)则会变成“带有API的状态机”。他所描绘的是一种演进,而非替代。
这种方法或许能让现有数据更容易获取,但对于捕捉决策轨迹却行不通。
现有运营部门各自为政,优先考虑现状。
Salesforce正在力推Agentforce,ServiceNow推出了Now Assist,而Workday则在为人力资源部门开发智能体。他们的宣传口号是“我们拥有数据,现在我们为其添加智能”。
但这些智能体继承了其父系统的架构局限性。Salesforce 基于当前状态存储:它只知道当前商机的状态,而不是决策时的场景。当折扣获得批准时,支持该折扣的背景信息不会被保留。你无法重现决策时的状态,这意味着你无法审核该决策、从中吸取教训或将其作为先例。
他们也继承了父母的盲点。客户支持升级并非仅存在于 Zendesk 系统中,它取决于 CRM 中的客户级别、计费系统中的服务级别协议 (SLA) 条款、PagerDuty 中记录的近期服务中断情况,以及 Slack 中标记客户流失风险的讨论串。由于现有系统不具备跨系统交互能力,因此任何现有系统都无法看到这些信息。
数据仓库厂商面临着不同的问题:他们处于读取路径,而不是写入路径。
Jamin Ball认为Snowflake 和 Databricks 都扮演着“真实数据注册”层的角色。两家公司都在积极布局——Snowflake 大力推进 Cortex 项目并收购 Streamlit,Databricks 则收购了 Neon 并推出了 Lakebase 和 AgentBricks。他们的理念是:数据平台取代传统的记录系统,成为智能体的基础。
数据仓库确实具有基于时间的视图,你可以查询历史快照、跟踪指标变化并比较不同时期的状态。但数据仓库是在决策做出后通过 ETL 接收数据的,当数据到达 Snowflake 时,决策上下文已经丢失。
一个只能事后查看读取数据的系统,无法作为决策沿袭的记录系统。它可以告诉你发生了什么,但无法告诉你为什么。
Databricks 在智能体相关技术组件的整合上已处于领先,但做智能体研发,和真正深入到决策发生的执行链路,完全是两回事。
智能体系统初创公司具有结构优势:它们处于编排路径上。
当客服人员对升级事件进行优先级排序、响应突发事件或决定折扣时,它会从多个系统中提取上下文信息,评估规则,协调冲突并采取行动。编排层则能看到全局:收集了哪些输入信息,应用了哪些策略,批准了哪些例外情况,以及原因。由于它负责执行工作流,因此可以在决策时立即捕获这些上下文信息——不是事后通过 ETL 处理,而是作为一级记录实时获取。
这就是上下文图,它将成为人工智能时代企业最有价值的资产。
现有企业将会反击,他们会尝试通过收购来增强自身的编排能力。他们会锁定API并收取出口费用,使数据提取成本高昂——这与超大规模数据中心运营商的做法如出一辙。他们会构建自己的智能体框架,并大力宣传“一切都留在我们自己的生态系统中”的理念。
但要捕获决策轨迹,就必须在提交时就参与执行路径,而不是事后才添加治理机制。现有在位者可以增加提取难度,但他们无法将自己强行插入到他们从未参与过的编排层中。
创业公司的三条路径
智能体系统初创公司将采取不同的发展路径,每条路径都有其自身的权衡取舍。
有些会从一开始就将取代现有的记录系统。例如,围绕智能体执行为核心重构的CRM或ERP系统,其架构本身就具备事件溯源状态管理和策略捕获功能。但这些系统真正落地困难很大,因为现有系统在市场中已经根深蒂固,但在企业系统的转型节点上,这种方案有可能成为现实。
在众多布局AI销售开发代表(AI SDR)赛道的初创公司中,Regie 平台选择构建一个原生 AI 销售互动平台,以取代 Outreach/Salesloft 等传统平台。这些传统平台的设计初衷是让人工在分散的工具链中执行一系列操作。而Regie 专为人机混合协作团队设计,其中智能体是核心成员:它可独立完成潜在客户挖掘、触达内容生成、跟进流程执行、任务路由分配等工作,仅在必要时将问题升级至人工处理。
有些初创公司会替换模块而非整个系统。它们瞄准的是异常情况和审批流程集中的特定子工作流程,然后成为这些决策的记录系统,同时将最终状态同步回现有系统。Maximor 正在财务领域实现这一目标:在不替换总账系统的情况下,实现现金流、结算管理和核心会计工作流程的自动化。ERP 系统仍然保留总账系统功能,但 Maximor 将成为承载对账逻辑的权威事实源。
有些公司会构建全新的记录系统。这些初创公司最初是流程编排层,但它们会保存企业从未系统性存储过的东西:决策轨迹。随着时间的推移,这种可重现的血缘关系会成为权威的凭证。智能体不再仅仅是“自动化”,而是成为企业用来解答“我们为什么这么做?”的地方。
PlayerZero正是这种模式的典型代表。生产工程环节处于站点可靠性工程(SRE)、技术支持、质量保障与研发工作的交叉地带,是典型的 “粘合型职能”—— 该环节中,人工掌握着诸多软件系统无法捕获的关键上下文信息。PlayerZero 以自动化二 / 三线技术支持工作为切入点,但其真正的核心资产,是自身构建的上下文图谱 :这一动态模型,能够真实还原代码、配置、基础设施与客户行为之间的实际交互方式。这份图谱最终成为解答两大核心问题的权威事实源,即 “问题为何发生?”与“此次变更是否会导致生产环境故障?”—— 而这两类问题,现有任何系统都无法给出答案。
随着初创企业探索这些发展路径,智能体的可观测性将成为关键基础设施。随着决策轨迹的积累和上下文图谱的扩展,企业将需要大规模地监控、调试和评估智能体的行为。
Arize 正在为这一全新技术栈构建可观测性层,使团队能够了解智能体的推理过程、故障点以及决策随时间推移的表现。正如 Datadog 已成为监控应用程序的关键基础设施一样,Arize 也有望成为监控和提升智能体决策质量的关键基础设施。
对企业创始人的关键借鉴
各类落地场景和路径虽然存在重叠,但并不完全相同。
两个信号适用于所有这三种机会:
人力高度密集的场景。如果一家公司有 50 个人手动执行工作流程(例如分配工单、分类请求或协调系统间数据),这本身就是一个信号。之所以需要这么多人,是因为决策逻辑过于复杂,无法用传统工具实现自动化。
异常情况较多的决策。常规的、确定性的工作流程不需要决策沿袭,智能体只需执行即可。真正值得布局的有价值的地方在于逻辑复杂、先例至关重要,以及“视情况而定”才是诚实答案的地方。例如交易支持、承保、合规审查和升级管理等用例。
其中一个信号特别指向新的记录系统机遇:
组织中各个系统的交汇点。营收运营(RevOps)的存在是因为需要有人协调销售、财务、市场营销和客户成功部门之间的工作。开发运营(DevOps) 的存在是因为需要有人连接开发、IT 和支持部门。安全运营(SecOps)则位于 IT、工程和合规部门之间。
这些“粘合剂”智能是一个核心信号,它们的出现恰恰是因为没有单一的记录系统能够全面掌控跨职能工作流程。企业只能通过组织架构设置专属岗位,用来承载软件无法捕捉到的上下文信息。
能够自动化这类角色的智能体,不仅仅能更快地完成步骤,还能保存该角色创建之初所要产生的决策、例外情况和先例。这才是构建全新记录系统的途径:并非取代现有系统,而是捕获只有智能体融入工作流程后才能显现的真理类别。
重新构想记录系统的新范式
问题不在于记录系统能否存续——它们肯定会存续。问题的关键在于,下一个万亿美元平台,是通过为现有数据叠加 AI 能力,还是通过捕获决策轨迹、让数据真正具备可落地的业务价值构建而成。
我们认为答案是后者,而如今那些构建上下文图谱的初创公司正在奠定基础。