回到主页

AI 领域的能力过剩

The Capability Overhang in AI

原文:https://x.com/levie/status/2037928306977509601

作者:Aaron Levie

“未来已来,只是分布不均。” —— 威廉·吉布森(William Gibson)

如果你身处科技行业,你一定对目前 AI Agent(智能体)领域的动态有着敏锐的感知。我们看到一个又一个编码 Agent 的案例,它们能够处理运行周期更长的任务,承担规模大得多的开发项目;越来越多的团队表示,他们的产品现在完全是由 Agent 编写的。模型在编程方面已经变得极其出色,而用于编程的 Agent 系统正迅速加速,彻底改变了这一特定的工作领域。

然而,当你与科技行业以外(甚至包括行业内部分人员)的知识工作者交流时,你会发现我们仍处于多么早期的阶段。AI 目前通常被视为一个非常有用的助手,可以回答快速提问并帮助查找信息,但在产出大规模工作成果和实现自动化方面,它还处于婴儿期。即使以今天的技术水平,依然有巨大的潜力尚未挖掘。正如 Ethan Mollick 所指出的:“即便我们现在就停止 AI 研发,现有的模型也足以改变大部分白领工作……哪怕考虑到目前模型的局限性。”

而且,这些局限性正在迅速消失。最前沿的 AI 模型正越来越多地在几乎所有知识工作领域接受训练,随着时间的推移,它们的能力只会越来越强。它们了解冷门的法律课题,洞察医疗保健和生命科学的深奥领域,在市场营销和写作等创意领域也表现得越来越好。对于任何它们起初不了解的事物,它们可以立即调用工具并连接数据源以获取所需信息。在未来几年内,它们几乎肯定会在各自领域的特定任务上超越任何人类专家。

随着 AI 模型在各知识领域变得越来越聪明,对于构建和应用 Agent 的公司来说,现在的巨大机会在于:我们如何将 AI 模型带来的突破性能力,应用到企业工作流中,从而在知识工作发生的环境中交付真正的 Agent 化工作?

Agent 面临的“上下文鸿沟”

部署 Agent 的最大挑战之一仍然是为其提供正确的上下文(Context)。Buccocapital 精准地指出了大多数 Agent 工作流自动化的瓶颈:

“上下文现在(或许一直以来)是增长的瓶颈,因为任何拥有完整上下文的任务都可以被自动化。现在的竞争在于如何让组织的‘集体大脑’变得对 AI 可读。”

对于大多数在 Agent 时代之前就存在的企业来说,Agent 开展工作所需的上下文通常并不具备现成的、整洁的格式。Dwarkesh Patel 在与 Anthropic CEO Dario Amodei 对话时假设:编程之所以不同于其他工作领域,是因为大部分关键的上下文就存在于代码库本身。而与其他知识工作领域不同,关键上下文散落在碎片化的系统中、视频通话里、面对面会议中,以及公司及其客户周围发生的外部事件中。

即便上下文已经数字化,大多数企业仍受困于许多陈旧且破碎的系统。尽管云计算增长多年,仍有大量软件、数据和基础设施困在本地(On-premises)或笨重的系统中,无法轻易与运行在云端的 Agent 通讯。我们在 Box 经常看到这种情况:公司的大量非结构化数据存储在永远无法与 Agent 协作的系统中,而他们终于开始寻求将这些数据迁移到云端。在未来几年,将出现一股将这些平台现代化为云原生和 AI 原生架构的激进浪潮,但这仍然是 Agent 在组织内自由穿梭、自动化工作的前提条件。

接着是权限和访问控制的问题。在大多数组织中,没有哪两个用户拥有完全相同的信息访问权限,这是设计使然。经理可以查看下属的薪酬细节,但不能看同级的;咨询师可以看到自己负责的项目,但不能看同公司内竞争对手的项目。组织中无限排列组合的访问控制防止了人员接触错误信息,而在一个 Agent 处理任务量比人类高出 100 倍或 1000 倍的世界里,这引入了全新的复杂性。在某些场景下,Agent 的权限应远超传统用户;而在另一些场景下,Agent 的权限应远低于用户的技术权限。如何确保妥善管理,两者都是难题。

最后,企业正面临着快速变化的技术格局。就在他们实施一套方案时,最佳实践就变了,需要再次推倒重来。企业是否应该将所有数据索引到向量数据库并使用 RAG(检索增强生成)?Agent 是否应该通过 MCP 服务连接各种 SaaS 工具?代码执行 Agent 是否应该利用各系统的 CLI 并拥有这些平台的完整能力?在 18 个月的时间里,你可能已经确定了其中任何一种架构并标准化了下游的 AI 方案,却发现世界再次移动了“标杆”,改变了顶尖水平的定义。

摆在面前的巨大机遇

那些能够提供优秀软件和用户体验,让终端用户轻松采用 Agent 并为其提供正确上下文的公司,将走得最远。

很大一部分采用挑战将归结为:非技术用户转型为组织内“Agent 管理者”的难度有多大。 就像编程工具必须从 IDE 中的 AI 辅助编写,演变为专注于管理和监督 Agent 工作的体验一样,所有知识工作领域(从法律、财务到咨询和制造)都必须经历这一过程。这对大多数知识工作者来说并非直觉操作,因此,那些能降低门槛的软件将最终胜出。

部分解决方案将来自与现有工作流和数据深度绑定的既有平台,它们可以将模型的智能与特定领域的正确上下文(或 Harness 工程)相连,端到端地解决客户问题。我们在 Box 正致力于此,安全地将关键企业内容连接到平台内外的 Agent,以加速所有知识工作领域。同样,对于那些在垂直领域或业务场景中完全重塑工作流的新玩家,以及作为跨系统连接的水平智能层的新方案,也存在巨大的机会。

对于那些懂得如何在组织内部交付“变革管理”(Change Management)的 AI 公司来说,这也意味着巨大的机会。这就是为什么 FDE(前线部署工程师)趋势短期内不会消失的原因。大多数组织在为 AI Agent 世界搭建环境时需要切实的帮助,对于大多数公司来说,这将是一个重度依赖专业服务的运营过程。他们需要团队支持,深入理解其工作流,找出如何将 AI Agent 最佳地应用于这些流程,并配置好数据以驱动这一切。

这也为新形式的系统集成商(SI)和咨询公司(以及抓住机会的传统公司)创造了巨大机会,因为他们往往是负责在组织内部进行繁重“清障工作”的人,以确保公司为 AI 进入职场做好准备。那些已经与大型企业建立关系的事务所,只要能迅速进化以支持这些业务领域,通常会在帮助企业通过 AI Agent 进行转型时占据最有利的位置。千万别过早看衰系统集成商。

最后,这对于组织内部那些聪明且具有创业精神的人才来说也是一个巨大的机会,他们可以去重塑 Agent 世界里的工作流。实现 Agent 所需上下文的变革管理,核心在于重新调整底层工作流,使其不再依赖于“部落知识”(Tribal Knowledge)或人与人之间协作的模拟方式。你会看到企业内部此类职位的激增,擅长此道的人将在经济中极具价值。

关于技术扩散的简要解释

值得注意的是,即便拥有最好的架构、正确格式的数据和最新的标准,技术扩散(Diffusion)仍然需要时间。 因为重大工作流需要重塑,数据需要进入组织良好的环境,技术素养需要建立,变革管理需要执行以引导用户入场,且任何受监管或大型企业在部署新技术或 Agent 时都有庞大的治理流程。哪怕只是在复杂组织的某个特定工作流上部署 Agent,只要想想你必须经历的那些处理任务的关键流程,你的头都要裂了。

这里有一个关于历史上增长最快的技术之一——云计算——扩散过程的对比:2010 年,当时硅谷的每个人都知道云是未来,AWS 的年收入估计约为 5 亿美元,Azure 刚刚发布,GCP 当时还叫 Google App Engine。快进到 2025 年,这三大平台产生了约 2250 亿美元的收入,而这仅占云市场的 60% 左右。因此,从科技界看到云的未来到今天,市场扩大了近 1000 倍。而且它仍以疯狂的速度增长。

即使在变化最快的市场中,新技术的扩散也需要时间才能波及整个经济。Agent 也不会例外。这是在现实工作世界中需要时间磨合的部分,但也正是为什么前方仍有如此多机会的原因。

总的来说,我们正处于一个 AI 能力以疯狂速度增长的不可思议的时刻。我们将能够在越来越多的关键知识工作领域解决越来越大的任务。这种扩散必然需要时间,但最终的赢家将是那些能够将这些突破性创新与现实世界的实际运作方式桥接起来的人。