场景图谱系列2：构建事件时钟

回到主页

场景图谱系列2：构建事件时钟

Building the Event Clock

· 场景图谱,状态时钟,事件时钟

作者：Kirk Marple

原文：https://www.graphlit.com/blog/building-the-event-clock

场景图谱系列— 第2部分（共3部分）

这是探索新兴场景图谱基础设施层的三篇系列文章之一。我们首先探讨智能体为何需要运营场景才能捕获决策轨迹，然后深入研究构建时间事实存储的技术架构，最后解决困扰业界的本体论问题。这些文章共同描绘出一幅完整的图景，展现了构建企业人工智能所需的上下文层究竟需要哪些要素。

第一部分：上下文层

第二部分：事件时钟（本文）

第三部分：本体论问题

本周，一场关于企业人工智能基础设施未来的精彩讨论正在展开。

2025年12 月 22 日，Foundation Capital 发表了题为《场景图谱：人工智能的万亿美元机遇》的文章，认为下一个万亿美元平台不会通过将人工智能添加到现有记录系统中来构建，而是通过捕获决策轨迹（将数据与行动联系起来的推理）来构建。

我在12月24日写了一篇回应文章，同意他们的论点，同时补充了我认为缺失的一层：如果不先解决运营场景层（Operational Context）的问题，就无法捕捉决策轨迹。身份解析、实体关系、时间状态——这些都是决策图谱得以构建的基础。

今天，PlayerZero 公司的首席执行官 Animesh Koratana 发表了一篇更深入的后续文章，详细阐述了如何构建场景图谱。文章介绍了一些引人入胜的概念：“双时钟”问题、作为知情漫游者的智能体，以及作为组织世界模型的场景图谱。

这些想法引起了共鸣——因为自 2021 年以来，Graphlit 一直在构建类似的架构。理论正在逐步跟上生产系统的实际需求，以下是我们从实际构建场景图谱的过程中学到的经验，包括哪些框架恰到好处，哪些需要改进。

双时钟：迄今为止最清晰的框架

PlayerZero 的文章引入了一个比喻，将问题具象化了：

每个系统都有一个状态时钟——记录当前的真实状态——以及一个事件时钟——记录发生了什么，发生的顺序和原因。我们为状态时钟构建了复杂的架构，而事件时钟却几乎不存在。

这是我见过的对目前这种不足最清晰的阐述。

他们举的例子非常贴切：“配置文件里写的超时时间是timeout=30s，以前是timeout=5s，有人把它提升了三倍。为什么？git blame 工具显示了是谁改的，但原因已经消失了。”

这种模式随处可见：

客户关系管理系统显示“成交失败”，但没有说明你是第二选择。
治疗方案上写着“已改用药物B”，但没有说明药物A在保险停止报销前一直有效。
合同规定60天终止期，但没说客户坚持30天，而你为了降低责任上限而妥协了。

我们为当下的现实建造了价值万亿美元的基础设施，却几乎没有为它成为现实的原因投入任何资金。

事件时钟——将观察结果与行动联系起来的推理过程——一直以来没有被视为数据。它存在于人们的脑海中、Slack 讨论串中，以及那些没有被记录的会议中。

时间只是其中一个维度

但我想在此进一步阐述：时间并不是唯一缺失的维度。

2021年我们开始构建Graphlit时，其核心愿景是对非结构化数据进行时空索引——一种多维索引，可以将事件归因于：

时间线：这件事是什么时候发生的？它什么时候变成事实？它什么时候不再是事实？
地理空间坐标：这件事发生在哪里？它与哪个地点相关？
全文搜索：内容中出现了哪些词语和短语？
向量嵌入：它在语义上类似于什么？
图谱关系：它如何与其他实体连接？

大多数系统会选择其中一到两个维度。搜索引擎处理全文信息，矢量数据库处理嵌入信息，知识图谱处理关系信息，时间序列数据库处理时间信息，地理信息系统处理地理空间信息。

但组织知识同时存在于所有这些维度中。一次销售会议发生在特定的时间、特定的城市，讨论的是特定的客户，其语义内容与其他对话相关，并通过关系图谱与人员和产品相连。

“双时钟”框架捕捉到了时间上的差异，完整的画面是一个多维索引，时间只是其中的一个维度——而且所有的维度应该可以同时查询。

这就是我们一直在构建的，事实数据包含validAt时间invalidAt查询所需的元数据，内容包含位置元数据，用于地理空间过滤。所有内容都包含用于语义搜索的嵌入，实体和关系构成图谱层。还可以将它们组合起来：“我们在第三季度于纽约举行的会议上讨论了关于 Acme 公司的哪些内容？”

三层，不是两层

这里我想进一步阐述一下框架，双时钟模型是正确的，但实现起来需要三个不同的层：内容（Content）、实体（Entities）和事实（Facts）。

内容是状态时钟——不可更改的源文档，证据链。内容永远不会被编辑、合并或删除。它是所捕获内容的权威记录。
实体是指内容中提及的对象——人、组织、地点、产品、事件等等。身份解析正是在这里进行的。例如，电子邮件中的“Sarah Chen”、会议记录中的“S. Chen”以及 Slack 中的“@sarah”指的是同一个人。如果没有实体解析，就无法推断角色。
事实是内容中的断言——是对客观世界的时间性陈述，这就是事件时钟。不仅仅是“病人服用A药”，而是“病人于2024年3月15日开始服用A药”，以及“病人于2024年8月3日因保险到期而停止服用A药”。

每一层都逐渐变得更加结构化，内容是原始证据，实体赋予身份认同，事实赋予时间性和断言。

事实作为第一等级数据

我们从构建这个系统中学到的经验是：事实需要成为一等实体，而不仅仅是派生的元数据。

我们系统中的一个事实是：

文本：断言本身（“Paula 在微软担任首席工程师”）
validAt：何时生效？（2024年1月10日）
invalidAt：何时不再为真？（null——仍然有效）
状态：权威的、已被取代、已证实、已综合
提及：此事实引用了哪些实体？（Paula → 人，Microsoft → 组织）
内容：此内容源自哪个源文档？

这种结构原生地就能体现时间有效性。当你查询“Paula目前的雇主是什么？”时，你不用搜索最近的文档并寄希望于语言达模型LLM能够找到答案，只需直接查询invalidAt 字段值为空的相关事实即可。

当你查询“Paula 2022 年在哪里工作？”时，你只用筛选出满足条件validAt <= 2022（invalidAt > 2022或当时为 null）的事实。

事件时钟变成了可查询的数据，而不用重构推理过程。

综合事实：关键洞察

PlayerZero的文章将场景图谱描述为能够进行模拟的“世界模型”，这完全正确，并且指出了一个重要的关键点：事实来源于多个渠道。

考虑以下三个事实来源：

“Paula 在 Google 工作”（有效期至：2020-01-15）
“Paula 是谷歌的高级工程师”（有效期至：2022年6月1日）
Paula 加入微软担任首席工程师（有效期至：2024 年 3 月 15 日）

由此，你可以合成：

Paula于2020年1月至2024年3月在谷歌工作。
“Paula于2022年6月晋升为谷歌高级工程师”。

这些综合得出的事实具有不同的属性——它们是推导出来的，而非直接观察所得，但通常更有利于推理，他们能告诉你的是持续时间，而不仅仅是某个时间点的快照。

综合事实也包含证据链，每一条证据链都指向其来源的事实，而这些来源的事实又指向原始内容，审计追踪得以保留。

这正是事实判定既困难又有价值的原因所在。确定当前真相、历史真相以及可以从多项观察中推断出的结论，都需要判断力。我们正在利用基于大语言模型（LLM）的事实判定方法来实现这一目标，该模型能够对相似事实进行聚类，识别取代关系，并从分散的观察结果中综合出时间线上的事实。

缺乏持续学习的世界模型

关于术语的说明：这里的“世界模型”有特定的内涵——这一概念借鉴自强化学习领域，指对环境运行规律的习得式表征，可以支持预测和仿真模拟。世界模型并非大语言模型本身，而是大语言模型开展推挤所依赖的结构化知识体系。场景图谱就是世界模型，大语言模型是对其进行查询推理的推理引擎。

本周的讨论引出了一个关于持续学习的重要观察结果：

“实现具有经济变革意义的人工智能之路或许并不需要解决持续学习的问题，而是需要构建世界模型。通过扩展证据库和推理时的算力，让静态模型表现得像在学习一样。”

这完全正确，它描述了事实解析所带来的优势。模型无需更新权重来“学习”Paula现在在微软工作。世界模型——即积累的、已解析的事实——已经包含了这一信息。在推理阶段，模型基于当前的事实进行推理，而不是基于过时的训练数据。

场景图谱成为外部记忆，从而让静态模型具备上下文智能。每个已解析的事实、每条合成的时间线、每个实体关系都会扩展模型的推理能力——无需重新训练。这就是贯穿一切的关键：事件时钟不仅仅是历史记录，它赋予了智能体真正有效的记忆能力。

智能体需要地图，而不仅仅是轨迹

有一个方面我想改进一下框架：智能体和他们所遍历的图谱之间的关系。

“智能体作为感知漫游者”的概念本质上描述的是我们所谓的智能体 RAG——一种推理大语言模型，它通过智能体框架协调工具调用，该框架管理工作流循环和上下文窗口。每次“行走”都是一条穿越工具和数据源的轨迹：检索一些上下文，对其进行推理，调用另一个工具，检索更多上下文，最终综合出一个答案。

这些轨迹编码了组织结构，这一洞察是令人信服的。核心论点是，智能体在组织状态空间中的遍历就是一种图谱嵌入形式——通过“使用”而非“预先设定”来发现本体：

“本体论源于遍历行为，反复出现的实体就是重要的实体，所遍历的关系就是真实关系。”

这在理论上很精妙，但我认为它颠倒了实际操作的顺序。

你不能指望通过成千上万次的智能体RAG 运行来“发现”Sarah Chen是Acme公司的员工。你需要在智能体开始推理之前就知道这一点。否则，每个智能体的轨迹都将重新面对身份解析问题——而你将为此付出代价，包括消耗的token数量、延迟和错误。

Node2vec 的例子恰恰说明了这一点。Node2vec 之所以有效，是因为它探索的是一个已知的图结构——该算法通过对现有边的遍历模式来学习嵌入向量。它并非从零开始发现节点和边，图必须先存在。

智能体工作流的运行方式相同。智能体框架根据预先构建的映射表协调工具调用，该映射表代表运营场景：已解析的实体、已建立的关系和时间状态。首先构建映射表，然后智能体才能高效地遍历它。

“智能体即漫游者”的框架非常适合扩展图谱——发现新的关系、验证现有的关系、揭示人类忽略的模式。但这并非启动系统的方法，启动系统需要预先构建基础设施，在智能体到来之前就已完成。

动态发现：缺失的一环

构建场景图谱是一个问题，大规模访场景图谱是另一个问题。

随着智能体连接到更多数据源，你无法预先将所有信息都整合到上下文中。Anthropic 最近在工具探索方面的工作表明了这一趋势：在对话开始之前，50 多种工具可能就已经消耗超过 5.5 万tokens。他们的解决方案——动态工具搜索——在测试中将准确率从 49% 提高到了 74%。

我们遇到了同样的问题，也找到了相同的解决方案。我们的 MCP 服务器只公开了三个元工具（search_tools，describe_tools，execute_tool）而不是 20 多个独立的工具。智能体通过语义搜索发现所需内容，只加载相关的定义，然后执行。Anthropic 刚刚发布了 beta 版，我们已经在生产环境中运行了它，模式也与此相同。

更深层次的一点是：这种模式适用于场景，而不仅仅是工具。你不会想把整个知识图谱塞进上下文窗口，就像你不会想把100个工具定义塞进去一样。

处理客户问题的客服人员不需要完整的知识图谱，他们只需要了解该客户的基本信息、账户涉及的实体，以及与问题相关的具体内容。我们的 MCP 服务器恰好提供了这些信息：客户信息、账户信息retrieveFacts、queryEntities、内容搜索——所有内容都限定在客服人员实际需要的范围内。

一次设置，处处可用。将你的数据源连接到 Graphlit，Cursor、Claude Desktop、自定义编排，以及未来的任何工具都可以使用相同的场景层。场景图谱是难点所在，而标准化的访问方式使其易于使用。

我们正在构建什么

我们将于2026 年第一周在Graphlit Studio中发布事实模式——一个用于浏览、筛选和搜索提取的事实表格视图，以及一个展示事实与实体之间关联的图表视图。这是实现事件时钟可见性和可查询性的第一步。

这就是我们2026年的发展方向：

已发布：

从多模态内容（文档、文字记录、电子邮件）中提取事实
Graphlit Studio 的事实模式，支持按状态、日期范围和搜索进行筛选
为事实添加实体关联标注（将事实断言与已确定的人员、组织、产品联系起来）

开发中：

事实→实体关系边（按实体筛选事实，与内容筛选的用户体验相同）
事实的图形可视化（查看断言如何与实体关联）

规划：

利用大语言模型进行事实认定（确定权威与被取代的事实，综合时间线事实）
retrieveFacts作为第一等级的智能体工具（对断言进行语义搜索，而不仅仅是对文档进行搜索）
CRM集成作为实体骨架（账户、联系人、交易作为组织环境的骨架）

Foundation Capital 和 PlayerZero 所描绘的愿景不仅是可以实现的——我们正在将其变为现实。顺序至关重要：首先是运营场景（身份解析、实体提取、时间建模），然后是事件时钟（包含有效期的事实、解析以确定当前真相、综合得出时间线知识）。忽视基础设施，你就是在沙子上盖房子。

未来之路：2026 年及以后

本周讨论的三项原则将定义场景基础设施的演变方式：

1. 双时钟问题确实存在，而且是可以解决的。我们已经投入万亿美元建设了状态管理基础设施，却几乎没有投入任何资源用于推理。事件时钟需要首次被捕获，这是一个基础设施问题，而不是研究问题。

2. 事实是事件时钟的基本单位。不是文档，不是嵌入向量，也不是聊天记录。它是具有有效期、关联到已解析实体、可追溯到原始证据的时间断言。让事实可查询，就能让推理过程可审计。

3. 解析阶段是世界模型涌现之处。从历史断言中确定当前真相，从零散的观察中综合时间线事实，并针对组织状态进行“假设”查询——正是在这里，场景图谱将真正发挥作用。正是在这里，智能体不再仅仅是巧妙的自动补全工具，而是开始展现组织智能。

构建这种基础设施的公司将拥有截然不同的东西。它们并非仅仅依靠完成任务的智能体，而是能够不断积累的组织智能。这种智能基于累积的上下文信息进行推理，而非每次都从零开始。它无需重新训练即可学习，只需在推理时扩展世界模型即可。

这就是我们在Graphlit正在构建的东西。事件时钟不仅仅是一个比喻，它是一种架构，2026年是它正式投入使用的年份。