万亿级 AI Agent 正在到来:软件行业即将彻底改变

最近,我们看到 Aaron Levie 在 X 上发布了一篇关于 AI Agent 未来的软件世界 的深度长文。
Aaron Levie 是 Box 的创始人兼 CEO,多年来一直活跃在硅谷科技与创业圈,对 AI 与软件产业的发展有长期观察。
在这篇文章中,他提出一个重要判断:
未来的软件用户可能不再是人,而是 AI Agent。
为了方便中文读者阅读,我们将这篇文章进行了 完整翻译与整理,分享给大家。

为“万亿级 Agent 时代”构建软件
过去几个月,智能体(Agent)领域迎来了重大变革。去年年底前后,代码智能体已能独立完成更长周期的任务,在开发过程中不再需要人类过多干预。
这些智能体早已不是只会调用基础工具的聊天机器人。它们通常拥有独立的沙箱计算环境,能针对遇到的任何问题编写并运行代码,直接与 API 和命令行交互,拥有专属文件系统和长期记忆等能力。这套核心基础能力、智能体调度最佳实践的全面进步,再加上大模型在工具使用与软件开发上的飞速突破,让我们看到了一类能处理任意任务的智能体雏形。
尽管这一架构最初由各类代码智能体定义,比如 Claude Code、Devin、Codex、Factory、Cursor、Replit 等,但我们最近已经跨越鸿沟,将智能体拓展到个人体验与知识工作的全领域,例如 Claude Cowork、Perplexity Computer、Manus,当然还有 OpenClaw—— 它将愿景推向更远的未来,打造出能在持久化环境中7×24 小时运行的智能体。
得益于能力的飞速提升,智能体将渗透到几乎所有工作场景:审阅每一份合同、处理绝大多数一线客服工单、审计企业财务、梳理全部医学研究以助力药物研发、编写绝大部分代码、制作大部分销售与咨询演示文稿、代用户完成全网交易…… 总而言之,参与社会中几乎所有具备经济价值的工作。
这还不只是替代人类现有任务。我们会用智能体完成远超以往的工作量:运行过去成本高到无法承受的模拟;为每一个想法做出多种方案原型;因为启动成本极低、终止简单,我们会推进海量项目;不再抽样数据,而是审阅全部信息。
综合来看,可以预见:企业里几乎每位员工,都会拥有多个为自己工作的智能体。不难想象,未来一家企业的智能体数量,会是员工数量的100 倍、1000 倍。当数万亿智能体同时运转时,智能体将成为未来所有软件的主要使用者。
而如今绝大多数软件都是为人类设计的,这意味着:软件的未来将迎来根本性转变。那么,下一步是什么?
打造智能体想要的产品
保罗・格雷厄姆曾用一句最简单的话总结软件开发:做人们想要的东西。
这条建议催生了 21 世纪最成功的一批软件,推动了工具开发潮流:简单易用、易于上手、无专业术语、清晰解决问题、定价直白等。
如今,前进的方向变成了:做智能体想要的软件。虽然目前智能体的主要使用者还是开发者或极客,他们有自己的工具偏好,但在智能体替知识工作者包办一切的时代,这类个人偏好会逐渐淡化。除非企业已有既定标准,否则智能体将主导各类工作流的工具选型。
这包括它们注册的工具、编写的代码、使用的库、调用的能力等等。对智能体更友好、能最好地解决智能体(及用户)问题的平台,会远超其他竞品。智能体不会看你的线上研讨会或广告,它们只会为任务选择最优工具—— 而你会希望这个工具是你做的。
这条建议的核心启示是:你开发的一切都必须以 API 为优先。如果一个功能没有 API,就相当于不存在;如果无法通过命令行或模型上下文协议(MCP)暴露接口,你就处于劣势;如果 API 设计混乱、路径冲突,你就等于放弃了被智能体使用的机会。在 Box 公司,我们致力于为智能体打造文件系统,正在全面梳理每一处 API,找出在智能体时代会失效的地方,把以往只用于用户体验设计的细致程度,投入到接口可用性中。
正如为人类设计软件要换位思考,为智能体设计也一样。YC 的贾里德・弗里德曼曾提醒所有人:“就算是最好的开发者工具,大多也不支持通过 API 自动注册账号。在 Claude Code 这类智能体时代,这是巨大疏漏 —— 因为 Claude 无法自己注册。把所有账号管理功能放进 API,如今已是基本门槛。”如果智能体无法轻松注册并使用你的服务,你对智能体而言基本就是 “无效产品”。
智能体成为软件主要使用者,还会带来重大的商业模式变革。某些场景下,由用户账号启动智能体,还能适配传统的按席位计费模式,但大量智能体场景既不绑定现有用户,工作量规模也完全不同。比如,智能体只需几句话或几行文本,就能在软件内完成相当于人类数小时的工作,只把最终结果呈现给终端用户。
这最终会推动部分软件的商业模式进化。任何想在智能体时代存活的工具,都必须内置按使用量 / 消耗量计费的模式,甚至支持智能体自主完成支付。
面向智能体的下一代基础设施与工具
Perplexity 的阿拉文德・斯里尼瓦斯说:“把电脑交给人类是个好主意。把电脑交给电脑,让它们替我们在电脑上完成工作,是更好的主意。”
当智能体拥有自己的 “电脑”,能编写并执行代码、调用常用技能、接入外部工具与服务时,一整套专为智能体设计的全新技术体系应运而生。想象一下人类在电脑上做的所有事,智能体也需要一套专为它们设计的同类能力。
部分核心服务自然会由现有厂商提供,因为智能体需要调用已有数据,或人类用户与智能体在系统内的协作与连接具备价值。但同样,也会涌现出全新品类—— 因为问题场景与人类过往需求截然不同,必须从零开始设计服务。
例如,智能体显然需要专属基础设施,且规模前所未有。下一个超算云厂商(或现有巨头),将建立在这样一个理念之上:未来的服务器集群不再为人类应用服务,而是为智能体服务。E2B、Daytona、Modal、Cloudflare 都在朝这个方向发力,这些沙箱环境的算力规模,将超越我们以往见过的任何水平。
智能体还需要访问企业核心文件,管理自身记忆与长时任务数据 —— 这正是 Box 正在打造的方向。同样,各大企业系统必须全面 API 化,让智能体能够操作企业关键服务与数据,例如人力资源系统、客户关系管理系统、工作流、数据湖等。能为智能体提供最无缝数据操作能力的产品,将拿下未来的 workload。
智能体很可能还需要数字身份,并具备沟通能力。比如 Agentmail 就在为智能体提供专属持久化邮箱。Parallel、Exa 等则在为智能体主导的网络信息检索时代,重构搜索引擎。许多智能体需要通过 Stripe、Coinbase 等钱包管理预算,我们或许终于能看到微支付的真实落地场景 —— 智能体可以自主调用付费工具与信息。
安全、合规与治理,将成为智能体时代的核心难题。当智能体访问敏感信息、执行受监管的工作流(如医药、金融)时,企业必须管控并留存智能体的所有操作。长期运行的智能体需要独立身份完成服务认证,严格控制其操作权限与数据访问范围。我们需要一整套全新软件与平台来应对这些挑战,就像过去为人类和应用所搭建的那样。
总而言之,我们正明确迈入软件新时代:工具必须专为大规模智能体使用而设计构建。在数万亿智能体协同工作的世界里,人机协作的方式将被彻底重塑。
