作者:Gaurav
原文:https://x.com/IT_Kabootar/status/2013912529261793435
如今,谈到人工智能,就不得不提及场景图谱。自从Jaya Gupta提出这个人工智能领域的机遇被估值达到万亿美元,在业内引起了热议。仅在过去24小时内,我就参加了一个风险投资小组讨论,与人就此进行了多次咖啡闲聊,并阅读了相关资料parkadei精辟的总结。
在过去的 6 个月里,我一直在为专业个人用户和组织构建场景管理产品,旨在释放人工智能驱动的生产力。
我很高兴看到大家对场景图谱的关注,因为当智能体能够展现出类似人类的推理和决策能力时,才能真正提高生产力。
然而,我还没有完全投入其中,这并非因为问题不存在,也并非因为每个人对问题的理解都不同(这对于早期概念来说很正常),我的犹豫源于一个更根本的问题:人性的现实。
人的因素
隐性决策
大多数决策都是隐性的,从未被论证、解释或详细阐述,它们深深根植于人们的思维和行为方式中。并非所有事情都由委员会决定,而许多决策痕迹就隐藏在委员会之外。那么,下一步该怎么做?在组织架构中构建个体层面的性格特征场景,以便更好地理解他们的决策吗?
信任人类
假设我们掌握了决策轨迹。我们能相信它们吗?
假设一个场景图谱,能够拼凑出为什么销售代表 A 向销售经理 B 申请给客户 C 大幅折扣,以及为什么该折扣最终获得批准的决策过程。我们如何确定它的准确性,足以让其他人员(智能体)从中学习?人们常常会在事后为自己的决策辩解。
- 也许A或B之前在C公司工作过。
-也许这只是为了完成销售指标而做出的一次性决定(可能是因为A在其他交易上耽误了时间,而这与销售指标无关)。
-或者是因为有人即将升职。
-或者,这可能是销售主管D要求B这么做的。
-或者,这可能仅仅是一些老套的公司政治。
这类决策不太可能留下正式的“真实痕迹”,这种情况在大多数职能部门都并不少见。我并非暗示人们腐败,而是想指出,人类倾向于将那些棘手的细节包装得更体面、更符合政治规范。
将决策与结果相关联
假设你准确地识别出了决策推理过程,它就可以输入到智能体中了吗?除非我们基于结果(通常是多个类似决策的结果)能够确凿地判断出这个决策是否正确,否则不能。即使是人类,也很难对决策进行事后分析,并确定其与结果之间的因果关系。
忘了它
人类非常擅长遗忘,这是人类的特性之一。虽然场景图谱旨在创建正式的决策轨迹,让智能体了解事件的来龙去脉,但它们也需要被告知事件已经发生了变化。那么,如何划定这些变化的边界呢?尽管重大决策会被以某种形式记录下来,但我们知道,大多数变化都是一个连续的过程,而非离散的步骤,因此很少被记录下来。
而这仅仅是人为因素,技术方面虽然具有挑战性,但也很有趣。
技术因素
假设我们开始着手建造它。
我们还有一些非常有价值的问题需要解决,因为“由于成本和延迟开销,不能把 大语言模型(LLM) 用于所有事情”。即使能这样做,也需要一些架构和指导才能使其可用。
轨迹提取用户体验
这个有趣的问题包含两个部分:
- 追溯过往决策
- :
- 收集来自组织内各个系统的信息是一个有趣的想法,但这更可能提供的是决策步骤的时间线,而非决策背后的逻辑。不过,它可以帮助缩小决策逻辑的候选范围,而且也比较容易让相关人员确认究竟是哪一种。
- 决策记录的未来
- :
- 既然我们已经认识到决策记录的重要性,组织就应该更加重视对决策进行更深入的记录。它可以是简短的网页表单、Slack 消息、电子邮件或实时在线文档。如果制定了统一的格式和深度要求,就能更容易地鼓励人们参与。现在很多微决策都是通过人工智能协作完成的。如何让人们更容易记录这些决策,同时又不泄露整个对话或让他们感到隐私暴露呢?
组织内部规范化
例如,同一份文档在不同的语境下可能被称为“PR-FAQ”或“6页文档”(尽管由于附录,它实际上超过6页,这一点大家都知道)。或者,同一个销售职位,在一个职级体系中可能被称为“客户经理”,而在另一个职级体系中则被称为“销售代表”。诸如此类。
时序性提取
检测文本中的时间信号很容易,但要将其与正确的文档创建时间 (DCT) 相结合,从而提取有意义的时间信息却很难。此外,还存在一些问题,即事物本身具有隐含的时间特性,即使没有时间结构也难以察觉。总而言之,无论是否使用 LLM,这些操作都非常耗时,而且我们也不知道何时应该使用这些信号,何时应该忽略它们。
储存内容与方式
数据仓库和数据湖的出现是因为在处理海量数据时,延迟、成本、正常运行时间和分片等问题都是切实存在的难题(这些问题并不会因为人工智能而迎刃而解)。判断数据的有效性是短暂的还是长期的,以及判断数据是琐碎的还是重要的,都非常困难。
数据安全
将数据存储在不同系统中是一种权宜之计的数据安全措施,但如果所有这些数据突然被集中到一个逻辑系统中会发生什么呢?由此造成的后果将是灾难性的。原本投资回报率低的攻击方法,突然间看起来却极具吸引力。
图谱,废话
我们需要的是数据结构中的图,还是数据库中的图?或者我们需要的是图表示?还是三者都需要?图是存储关系?还是存储溯源信息?还是两者都有?那么,我们该如何构建它们呢?
上下文窗口
递归语言模型领域正在取得令人瞩目的进展,新的上下文访问模式正被用于最大限度地提高智能体能够获取的上下文信息量。那么,我们是否可以允许智能体在数据仓库、数字图书馆和大量的应用程序接口(多级控制点)上自由探索呢?
我到底想表达什么?
如果我们能够追踪决策,将决策与结果关联起来,保存时间状态并以智能体的速度检索它们,同时找到一种安全存储和访问它们的方法,避免它们成为有害的漏洞,那么场景图谱就能真正发挥作用。届时,它们将从一个备受争议的概念演变为认知工作的操作系统。
如果场景图谱真的有效,我们不仅可以拥有人工智能员工,还可以拥有人工智能经理。我们不仅可以实现繁琐工作流程的自动化,还能提升人类的智能生产力。我相信它甚至可能催生出人人都在谈论的“一人独角兽”公司。
因为这些模型并非由前沿实验室的训练后数据或僵化的智能体框架驱动,而是由对组织如何思考和判断的真正洞察驱动。判断会累积。
我还不确定我们什么时候能到,但我确信我们终究会达到。