作者:Daniel Davis原文:https://dev.to/jackcolquitt/context-graphs-reification-not-decision-traces-33pc
最近的“场景图谱热潮”引起了广泛的讨论,从Foundation Capital 的Jaya Gupta 和 Ashu Garg 的原创文章《人工智能的万亿美元机遇:场景图谱》,到我的《场景图谱宣言》(这件事引起了太多关注,我甚至还专门做了个YouTube视频——《什么是场景图谱》)。其中的一个话题尤其引人注意:决策轨迹(Decision Trace),我第一次听到这个词时感到很不舒服——现在依然如此。尽管如此,我理解人们谈论决策痕迹的用意,问题在于,“决策”这个词用得不对。
这实际上关乎的是“物化”(Reification,也称作“实体化”)。
物化?这又是什么?
别担心,我们稍后会详细展开。但首先,我们需要讨论一下“决策”。
计算机系统,不会做出决定。
这就是我想说的。
在你厌恶地点击离开或者愤怒地滚动到评论区告诉我我是个白痴之前(如果你读完了全文仍然觉得有必要这么做,那也无可厚非),让我解释一下我的意思。
什么是决策?
决策是人类创造的概念,而且出人意料地难以捉摸。听起来很简单,但决策究竟是什么?你究竟在哪个瞬间“决定”去做某件事?行动更容易观察,但我们如何确定引发行动的确切转折点?我们真的能断言某个想法或信息直接导致了某个行动吗?
斯坦福大学研究员罗伯特·萨波尔斯基认为,人类根本没有自由意志。在他看来,决策只是一种假象——这一假象掩盖了经年累月的生物因素、环境因素和外部力量,对人类思想和行为的产生的累积性塑造作用。
从行为经济学的角度来看,决策与激励、目标和初始条件密不可分。人们常常引用简化的博弈论例子,例如囚徒困境,其中结果似乎取决于一个离散的选择:背叛其他囚犯还是保持沉默。虽然这些例子可以作为入门介绍,但它们并不能很好地代表现实世界。
博弈论的局限性
随着博弈论应用于更复杂的系统,一种占优策略往往会浮现:模仿行为。如果你曾被告知“别想太多”,那么你可能在不知不觉中就得到了博弈论中的经典建议。在许多情况下,最优策略就是简单地复制第一个行动者的行为。
我们在新兴行业中反复看到这种情况,创新者往往并非最终的赢家。为什么?因为创新者要承担不确定性和市场教育的成本,而后发者则可以等待、观察,并在前者完成艰苦的工作后进行模仿。
但模仿效应并非唯一的缺陷。
初始条件至关重要
诺贝尔经济学奖得主、行为经济学家丹尼尔·卡尼曼(Daniel Kahneman)通过前景理论揭示了古典博弈论的一个更深层次的局限性:它忽略了初始条件。
让我们再次考虑囚徒困境,但这次要结合具体情况。一名囚犯18岁,另一名囚犯80岁,身患绝症,寿命不足一年。如果两人都保持沉默,则各自被判处两年监禁。如果其中一人出卖另一人,出卖者将被释放,而另一人则将被判处20年监禁。
对18岁的年轻人来说,两年或许痛苦但尚可忍受;二十年则是灾难性的。对80岁的老人来说,两种结果都无法接受——他们不想死在监狱里。他们的动机和限制从根本上就不同。一旦考虑到初始条件,“选择”的含义就截然不同了。
为什么这对计算机系统很重要
如果我们仅仅依赖博弈论,可能会倾向于认为计算机系统会做出决策。毕竟,它们会评估各种选项并选择结果。但前景理论清楚地表明,我们所谓的决策深受人类目标、激励机制和条件的影响——而这些计算机都不具备。
你或许会说,我们可以编写程序让系统倾向于某些选择。但这种偏见从何而来?并非系统本身,而是源于人类设计者。系统只不过是在执行由他人目标、激励机制和初始条件所构建的逻辑结构。
实体化和场景图谱
“决策”这个词用得不对,这个事情真的重要吗?也许并不重要。我当然也说过这样的话——“别让真相妨碍了好的营销”,我们是不是在咬文嚼字?
从某种意义上说,是的——但这正是场景图谱的意义所在。
大语言模型系统之所以需要场景图谱,是因为当信息脱离原始上下文时,语言模型难以消除歧义。场景图谱使我们能够检索正确的上下文信号来指导模型的解释。这个概念并不新鲜,而对于知识图谱爱好者来说,这又让我们回到了物化(Reification)的话题。
什么是物化?
关于物化有很多复杂的定义。我发现最简单也最好的定义是这样的:
物化是一种表示关于陈述的陈述的技术。
乍一看,这似乎没什么帮助。我一开始也是这么想的,但请听我详细介绍。
请考虑一个简单的事实:
Fred -> hasLegs -> 4
现在假设我们想记录马克告诉我弗雷德有四条腿这件事。我们可以创建一个全新的陈述,但理想情况下,我们希望将这个陈述与场景图谱中的原始事实联系起来。
这就是物化。
一种方法是引入一个新节点:
[Statement1] -> hasSubject -> Fred
[Statement1] -> hasPredicate -> hasLegs
[Statement1] -> hasObject -> 4
[Statement1] -> assertedBy -> Mark
[Statement1] -> assertedDate -> “2026-01-08”
这种方法可行,但存在一个问题。物化的语句与原始语句没有直接关联。查询变得繁琐,需要从各个组成部分重构原始事实。
这时,属性图谱表爱好者们就开始露出笑容了。
属性图谱和RDF 1.2
RDF 图和属性图谱的主要区别之一在于属性图谱允许在边上定义属性。使用属性图谱,相同的信息可以表示为:
Fred -> hasLegs -> 4
└> assertedBy: Mark
└> assertedDate: “2026-01-08”
这样更简洁、更直观,查询也更容易。
2025年12月5日,W3C发布了RDF 1.2的工作草案,其中引入了关于物化的及时改进。一项主要新增功能是能够将关系本身视为一个对象:
<< Fred -> hasLegs -> 4 >> assertedBy -> Mark
<< Fred -> hasLegs -> 4 >> assertedDate -> 2026-01-08
这种方法与属性图和基于四边形的模型(S、P、O、G)非常相似,其中G充当标识符或上下文。正如《场景图谱宣言》中所述,没有唯一正确的方法。在 RDF 1.2 中,RDF 和属性图之间的选择越来越取决于偏好和工具,而非功能。
物化作为一种记录系统
虽然“决策轨迹”这个名称可能不太恰当,但“记录系统”这个术语更接近场景图谱实际实现的功能:对系统行为、数据流和输出进行可审计的记录。
当你考虑治理问题时,就会更清楚地明白为什么这个问题经常被定义为“决策”。
在成熟的组织中,决策权通过治理结构得到正式确立。特定角色被赋予特定决策权,并设有相应的升级机制,以应对影响更大的结果。然而,治理常常令人反感——它往往与官僚主义、效率低下和繁文缛节联系在一起。
但政府的存在是有原因的。
记录重要的真正原因
如果你曾担任过高级管理人员、合规官或公司律师,你肯定已经知道答案:责任。
更委婉地说,良好的治理表明组织已履行其注意义务——即依法有义务采取合理谨慎的措施以避免可预见的损害。而损害并不一定指人身物理伤害,违反服务级别协议 (SLA) 或合同也属于此类。例如,AWS 美国东部 1 区宕机数小时后,往往会引发诉讼。
企业需要记录系统,不仅是为了追究内部责任(虽然这种情况确实会发生),也是为了在用户声称受到损害时保护自身权益,缺乏记录本身可能被视为未能尽到应有的注意义务。
想象一下,一位诉讼律师辩称:“被告甚至不了解他们的系统是如何运作的,他们没有任何记录表明采取了合理的预防措施,他们怎么可能知道自己没有过错?”大多数陪审团都会点头表示赞同,而辩方律师团队则开始劝说他们和解。
从黑箱到可审计性
如今,人工智能系统大多是黑箱,而实体化则为我们通往透明化之路铺平了道路。
在 RAG 系统中,溯源信息可以直接附加到检索到的上下文中:
<<:dataset-common-crawl-2024 :containsData :source-wikipedia-en>>
:includeDate "2024-02-01T00:00:00Z"^^xsd:dateTime ;
:recordCount 6500000 ;
:dataQualityScore 0.94 ;
:licenseType "CC-BY-SA-3.0" ;
:preprocessingPipeline :pipeline-cleaner-v3 ;
:duplicatesRemoved 125000 ;
:piiFiltered true ;
:approvedBy :data-governance-team ;
:auditTrail :audit-log-20240201 .
推理事件也可以用同样的方法捕获:
<:model-gpt4-mini :generated :response-abc123>>
:timestamp "2025-01-07T14:32:11Z"^^xsd:dateTime ;
:inputTokens 450 ;
:outputTokens 280 ;
:latencyMs 1250 ;
:temperature 0.7 ;
:topP 0.9 ;
:modelVersion "gpt4-mini-v1.2.3" ;
:requestId "req-xyz-789" ;
:userId :user-john-doe ;
:sessionId "session-2025-01-07-14" ;
:containsSensitiveInfo false ;
:moderationScore 0.02 .
甚至政策执行也成为图表的一部分:
<<:deployment-prod-gpt4-mini :hasConstraint :policy-no-medical-advice>>
:policyEffectiveDate "2024-07-01T00:00:00Z"^^xsd:dateTime ;
:policyVersion "v2.1" ;
:enforcementLevel "strict" ;
:enforcedBy :guardrail-system-v3 ;
:violationCount 0 ;
:lastReviewDate "2024-12-01T00:00:00Z"^^xsd:dateTime ;
:nextReviewDate "2025-06-01T00:00:00Z"^^xsd:dateTime ;
:nextReviewDate "2025-06-01T00:00:00Z"^^xsd:dateTime ;
:approvedBy :legal-compliance-team .
我们能够将系统行为直接与其产生的数据和上下文联系起来。
物化让我们能够将系统行为直接与其产生的数据和上下文联系起来。这一过程既生成了可审计的跟踪记录,并为更精确、更少拟人化的AI“记忆”概念打开了大门。
完成AI记忆的闭环
“记忆”这个词几乎和“决策”一样问题重重。人类记忆存在诸多缺陷,因此,以人类记忆为蓝本构建人工智能系统一直以来都被认为是不明智的。
与其问如何赋予人工智能记忆,我们不如问问我们想要实现什么目标。我们真的想存储对话中的每一个词元吗?当历史记录远超上下文窗口时会发生什么?
场景图谱自然而然地演变成分层系统:
- 基于精心挑选的知识构建的基础层
- 记录系统行为的系统记录层
- 由模型输出生成的合成接地层
分离这些层至关重要。它使我们能够衡量场景漂移(Context Drift)——即合成上下文与原始真实上下文之间的偏差程度。在某些情况下,这种演变是预期的;而在另一些情况下,这种偏差则意味着失败。记录系统层使我们能够观察、测量并纠正这种漂移。
付诸实践
在TrustGraph我们最初的重点是构建生产级基础层所需的工具和基础设施:可以在任何地方、使用任何模型部署的上下文图,并完全由用户控制。
现在TrustGraph该产品已投入实际用户使用,我们清晰地看到了下一阶段的发展方向。基础已经就绪。Reified 将上下文图从静态知识库转变为可审计的、可学习的系统。
TrustGraph 2.0 即将面世——而且一如既往,它将是免费开源的。