场景图谱无法组织从未被记录的知识

回到主页

场景图谱无法组织从未被记录的知识

Context Graphs Can't Organize Knowledge That Was Never Captured

· 场景图谱,记录系统,本体论

作者：Eyal Toledano

原文：https://x.com/EyalToledano/status/2008965413162430508

最近关于本体论的争论很多，先是预设的本体论，还是后天习得的本体论；Palantir公司聘请的昂贵顾问，还是从智能体轨迹中涌现出来的本体论？

观看这场辩论时，我不禁觉得我们忽略了一个影响深远的细微差别。

整个讨论都假定组织知识存在于某个地方，只是需要更好的组织方式。更好的模式，更好的学习算法，更好的图结构。仿佛这些知识就存放在系统中，等待着被妥善整理。

但请注意功能上线后实际发生的情况：

项目经理编写规格说明。
工程师们在 Slack 上提出疑问以寻求澄清。
有人意识到规范与技术限制相冲突。
双方会进行15分钟的通话，做出权衡取舍。
范围缩小，方法改变。
根据实际情况，最终的实现方式与最初的规范有所不同，这些新的变化在整个组织中的落实程度也各不相同。
该功能已上线。

现在，推理过程在哪里？

这份规范很可能已经过时了，它描述的是最初的意图，而不是最终交付的内容。Slack 讨论串已经沉寂很久了，通话没有录音，PR 描述只写着“实现了 X 功能”。提交信息都是技术性的，缺乏上下文信息。

真正塑造最终产品的决策，存在于那次电话会议的三位参与者的脑海中。迫使他们做出权衡取舍的限制因素，他们否决的替代方案，以及他们选择这种方法而非另一种方法的原因。

六个月后，他们中的一人将离开公司，而他们的思维方式也将随之消失。

这种情况每天都会在每个软件组织中发生数千次。决定产品实际构建方式的决策，是在对话中做出的，而不是在系统层面。

在不断滚动的 Slack 对话串中，在结束后消失的 Zoom 通话中，在走廊过道谈话中，这些在数字系统中根本没有存在过。

任何本体论，无论是预设的还是后天习得的，都无法组织从未被记录过的知识。

kirk Marple在回应这场辩论时，提出了一个很有价值的观点：实体建模问题已经基本解决。Schema.org定义了人员、组织和事件。微软的通用数据模型定义了帐户、联系人和商机。医疗保健行业使用 FHIR，金融行业使用 FIBO。

这些名词都是已知的。我们不需要学习“账户”是一个实体，也不需要发现“联系人”与“组织”相关。这些工作多年前就已经完成了。

那么，我们为什么还在争论本体论呢？

我认为问题在于，讨论一直停留在错误的层面。我们知道存在哪些类型的事物，但究竟发生了什么以及为什么会发生，仍然是个谜。

Palantir 的方法成本很高，但这并非因为预设本体本身难以实现。成本高昂的原因在于，前线部署的工程师必须坐在会议室里，手动重建原本从未被记录的上下文。他们要采访相关人员，阅读旧文档，从零碎的信息中拼凑出事件的真相。他们在进行考古工作。

本体论部分很简单，真正耗时的是重建工作，需要几个月的时间。

“习得本体论”的愿景存在另一个问题，它假设智能体的运动轨迹会揭示组织结构，让智能体自由运行，观察它们访问的内容，学习哪些内容是重要的。

但智能体轨迹只能揭示已存在的数据模式。如果推理过程发生在智能体无法访问的 Slack 对话中，或者没有转录的 Zoom 通话中，又或者只是某人的内心独白，那么这些推理过程就不会出现在轨迹中。你无法从从未记录过的信息中学习结构。

这里还潜藏着一个引导问题。只有当智能体能够有效运行时，才能从它们的轨迹中学习。但智能体如果没有基础上下文就无法有效运行。“运行智能体并让结构自然涌现”的前提是，你必须有可供智能体运行的上下文。图谱必须先存在才能在其上遍历。

因此，这两种方法都是在事后解决问题。一种方法依靠人工重建，另一种方法则希望通过机器学习进行推断。但它们都没有触及问题的核心：最有价值的组织知识在产生的那一刻就消逝了。Jaya Gupta 关于决策轨迹的文章提出了一个重要的观点：“将数据与行动联系起来的推理从未被记录为数据。”

我们一直在问如何组织组织知识，但或许更重要的问题是，我们如何在推理过程消失之前将其记录下来。一旦你这样看待它，就会发现关于场景图谱的辩论框架的一些有意思的地方。

它被视为一个基础设施问题。我们如何构建更好的数据库？更好的查询层？更好的时间模型？我们如何对现有工作流程进行检测以捕获正在发生的事情？这就像在汽车时代制造更快的马一样。

但仪器只能捕捉系统中流动的信息，最重要的推理过程并不在系统中流动，而是在系统之间的缝隙中发生。

项目经理的规范说明可能写在 Notion 里，工程师的问题可能在 Slack 上，权衡讨论可能是在 Zoom 上进行的，最终的决定是口头做出的，没有留下任何书面记录。实现代码在 GitHub 上，UI/UX设计在 Figma 的某个地方，最终结果显示在分析仪表盘里。

你可以构建世界上最复杂的场景基础设施，连接所有系统，监控所有工作流程。但你仍然会错过背后的推理过程，因为推理发生在你的基础设施无法触及的空间。

正是这一点让我们相信，场景捕获从根本上来说关乎工作流程，而不是基础设施。

解决这个问题并非通过在现有系统之间铺设更好的管道，而是要从根本上改变工作发生的地点。

妨思考这一，为什么使用 Cursor或 Claude的开发者，在一次性对话中能获得更完整的场景，而使用 ChatGPT 的开发者却做不到？原因并非前者的集成能力更优，而是工作本身就发生在这个工具环境内—— 代码就在这里，文件就在这里。。场景并非从外部系统拼凑而来，而是这个环境的原生能力。

同样的道理也适用于组织知识。如果在 Slack 上进行目标一致性讨论，讨论中的逻辑推理会散落在各个讨论串中，最终消失。但如果在一个旨在记录目标一致性的系统中进行讨论，这些逻辑推理就会自然而然地保留下来。

场景图谱的机遇或许并非在于构建基础设施，来观察和组织其他地方发生的事情，而在于构建真正开展重要工作的界面。在那里，意图得以明确，权衡取舍得以做出，最终达成共识。

如果你是决策发生的地方，你不需要重建决策过程，只需将其作为输出物输出即可。

这重新定义了需要建设的内容。

基础设施建设的重点在于读取路径，我们如何查询组织知识？我们如何为智能体提供所需的场景信息？这些都是实际存在的问题，但它们只是更复杂问题的下游问题。

机遇在于正确的路径，组织知识在哪里产生？如果你身处其中，那么读取路径自然迎刃而解。知识之所以存在，是因为它诞生于你的系统中，而非从其他地方拼凑而成。

软件团队中存在速度差距是有原因的。个人使用人工智能可以几个小时就完成交付，而团队仍然需要几周时间，瓶颈从实现阶段转移到了协调阶段。这指的是，确定要开发什么以及如何确保每个人都达成共识的过程，分散且缺乏记录。

组织知识正是在这种协调一致的过程中产生的。每次团队就开发目标达成一致时，他们都会生成相关的场景信息：意图、限制条件、权衡取舍以及最终决策。然而，目前这些信息却都消散在 Slack 和 Zoom 等工具以及无人更新的文档中。

现在的本体论之争实际上是在争论如何组织艺术博物馆，而真正的机遇在于亲临艺术创作的工作室。

我们需要构建的远不止是更完善的本体论（无论是预先设定的还是后天习得的），也不仅仅是更完善的时间数据库，或决策追踪基础设施（尽管这些也很重要）。

关键在于团队在哪里开展工作，这是产生场景信息的第一现场。

预设框架与习得框架之争将持续不断，因为两者都试图通过观察来解决信息获取问题，另一种选择是停止观察，开始主导。

身处决策发生的地方，场景图谱会自然填充。