AI Agent “来敲门”

深度推理模型的持续进步,为 Agentic AI 在广泛业务场景中的自动化应用提供了坚实支撑,有望释放出可观的潜力。客户向 Agentic AI 的转型正逐步推进。为顺应这一趋势,软件厂商也需要持续调整自身的业务架构和定价模式,以在未来竞争中保持优势。

关键要点

  • 数十年来,软件系统的开发始终建立在一个核心假设之上:人类在任务执行、流程控制和业务决策中居于主导地位。
  • Agentic Computing 打破了这一传统认知,提出了由具备自主能力的 AI Agent 接管任务执行与决策的新范式。
  • 随着 Agentic 应用持续渗透全球规模超过 6,300 亿美元的应用软件市场,其释放出的价值潜力正日益显现。
  • 这场转型也伴随着深刻变革,包括应用架构的重构,商业模式与定价机制的全面革新。
  • 在这场范式变革中,部分领先的软件公司有望率先受益,包括:AMZN、CRM、GOOG、HUBS、MSFT、NET、NOW、OKTA、OS、PLTR、SAIL、SNOW 与 TEAM。

将 Agency 引入软件体系。过去几十年来,软件开发始终基于一个核心假设:人类在任务执行、流程管理和业务决策中发挥主导作用。然而,随着 Agentic AI 能力的持续增强,这一长期存在的假设正被逐步打破,AI Agent 正日益成为执行任务和做出决策的主体。驱动这一变革的关键因素包括:深度推理模型性能的显著提升、数据语义理解能力的增强,以及智能化部署成本的持续下降。这些进步促使企业加速采用“数字劳动力”以替代传统人力,从而释放出可观的价值潜力。不过,值得注意的是,企业向智能计算模式的转型并非是一次即可完成的革命性跃迁,而是一个循序渐进的演进过程。目前,仍有诸多现实挑战亟待解决:包括基础模型的固有不确定性、长期积累且高度分散的应用与数据孤岛、持续存在的数据质量问题、日益严峻的安全风险,以及缺乏统一标准的治理机制和应用框架。行业需逐步攻克上述障碍,才能推动 Agentic AI 的广泛落地与可持续发展。

拥抱变革。从历史发展的视角来看,Agentic Computing 代表了软件系统向更高抽象层的持续演进,标志着其迈入一个全新的发展阶段,其核心在于引入具备“自主性”的 AI Agent。这类软件程序具备以下关键特征:1)能够理解外部环境并进行交互(接收输入);2)可自主收集并连接多个数据源;3)无需预设规则即可自主执行操作;4)具备基于经验持续学习的能力。如同历史上的每一次范式变革,AI Agent 的兴起将进一步提升自动化水平,显著增强企业的生产力与运行效率。同时,它也将促使软件行业重塑应用开发范式与系统架构,推动商业模式和定价策略的持续演进,并催生出全新的软件产品形态与盈利模式。

System of Record vs. System of Engagement——构建 Agent 生态的框架。新兴的 Agentic AI 生态系统可通过“双元框架”加以划分,分为 System of Record(SoR)与 System of Engagement(SoE)两类,分别反映不同的自动化路径与市场机会。

  • SoR Agent 是一类专注于特定领域功能型自动化的解决方案,主要用于编程、客户服务、销售线索生成和商业智能等结构化流程中,旨在直接替代原本由人类完成的任务。代表性产品包括 GitHub Copilot、Salesforce Agentforce 和 HubSpot Prospecting Agent。此类 Agent 的市场机会较为集中,基本对应 IDC 所定义的“以劳动力为核心”的自动化市场细分。该市场当前规模约为 160 亿美元,预计到 2028 年将增长至 330 亿美元。
  • SoE Agent 通常以监督与协调者的角色运行,专注于跨多个系统的工作流与流程自动化。其价值并非体现在直接取代人工,而是通过提升系统运行效率、优化多环节任务协同,从而间接节省人力投入,创造持续的业务效益。代表性应用包括 ServiceNow 的 Now Assist、GitLab Workflows 以及 Atlassian Rovo。这类 Agent 所面向的市场更为广阔,其定位与 IDC 所界定的“以系统为中心”及“以决策为中心”的自动化范式高度一致,同时也包括“业务价值工程”等相关细分领域。该市场目前的规模约为 360 亿美元,预计到 2028 年将增长至 690 亿美元。

图 1:Agent 组织框架:SoR Agent 与 SoE Agent 对比

当前我们正处于 Agentic AI 发展中的何种阶段?关于 Agentic AI 当前所处的发展阶段,业内尚存较大分歧。一方面,多数客户反馈称,在系统运行稳定的前提下,其表现令人印象深刻,投资回报显著超出预期,因此值得持续加大投入。另一方面,部分应用场景中系统在可靠性、稳定性与输出精度方面仍未达到预期标准。这一现象反映出当前 AI 推理模型在处理复杂任务时仍面临一定挑战。但需要指出的是,Agent能力正在快速演进,推理性能的提升正以“周”的节奏持续推进。根据 AI 研究机构 METR 的数据显示,过去六年间,AI Agent 在自动化任务中可处理的信息长度平均每七个月翻一番。

为更清晰地界定当前市场在 Agent 自动化能力方面的发展阶段,AI Agent 服务商 Sema4.ai 提出了一套五级演进框架。目前,行业整体正处于向“完全自主型 Agentic AI”演进过程中的第三级阶段。该阶段标志着“受限自主性”的起点,AI Agent 开始突破传统基于规则的自动化系统及任务型辅助工具的局限,具备对任务进行规划、执行并根据反馈进行动态调整的能力。同时,系统已能通过多轮推理处理复杂问题。

例如,Salesforce 推出的 Agentforce Agent 具备类人推理能力,能够对一份长达 100 页的发票与内部系统进行自动对账。相比之下,第 0 级的规则驱动自动化与 RPA、第 1 级的 AI 驱动流程自动化,以及第 2 级的任务专属型 AI 助理与协作工具,在智能水平上存在显著差距。然而,当前市场整体尚未达到第 4 级能力,即系统能够实现自我改进与自主修改指令;在未来的第 5 级阶段,系统将具备完全自主的 AGI 能力,可在无监管条件下独立进行推理与创造。这一演进过程表明,尽管自主规划与执行能力已有显著提升,但在多数应用场景中,人工监督仍不可或缺。

图 2:过去六年间通用型前沿模型 Agent 自主完成任务的持续时间呈指数增长(约每 7 个月翻一番)

市场空间有多大?我们从三个维度评估 Agentic AI 所对应的潜在市场空间,每一层级分别对应不同的技术成熟度与市场渗透范围。第一层面聚焦于由 AI 驱动的自动化场景,当前市场规模约为 60 亿美元,预计到 2028 年将增长至 200 亿美元。第二层面涵盖更广义的流程自动化市场,目前市场规模约为 520 亿美元,预计到 2028 年将翻倍至 1,020 亿美元。进一步来看,在最广义的定义下,Agentic AI 应用有望在未来逐步渗透整个应用软件市场,该市场当前整体规模约为 6,370 亿美元。

图 3:Agentic AI 市场广义视角下的增长趋势 —— 2024 年为 520 亿美元,预计 2028 年达 1,020 亿美元(年复合增长率 26%)

哪些环节将成为价值集聚的核心? 通过 Agentic AI 生态系统关键环节的分析,我们认为以下几个环节具有高价值潜力:

  1. 超大规模服务商与 AI 基础设施:随着深度推理型 Agent 对实时计算能力的要求日益提升,AI 基础设施提供商迎来了广阔的发展空间,领先企业不仅具备强大的算力交付能力,还逐步拓展至数据检索、安全防护、治理机制与策略执行等关键模块,构建出支撑 Agentic 应用运行与管理的多维技术体系。
  2. AI 模型提供商:AI 模型提供商持续拓展推理与智能的技术边界,为 AI Agent 提供核心能力支撑。模型能力的演进推动 Agentic 生态向框架构建、数据处理与系统集成等方向延伸,助力其逐步演化为现代智能应用平台的基础模块。
  3. 安全与治理:虽然 Agentic 应用在提升系统可信度、可靠性、准确性及整体安全水平方面具备显著商业价值,但 Agent 架构的开放性也带来了更多的攻击面,面临数据泄露、供应链攻击、提示注入及开源依赖污染等多重安全风险。因此,构建强健的安全机制与治理体系已成为实现商业化落地的核心前提。
  4. 数据基础设施:AI Agent 的可用性高度依赖对关键数据源的实时、合规访问。数据基础设施服务商的核心价值体现在两个方面:一是通过现代化改造与质量提升,增强客户数据资产的可用性;二是在运行时提供快速、精准且稳定的数据检索能力,为智能响应提供关键支撑。
  5. 工作流自动化:随着 AI Agent 深度嵌入企业自动化平台,传统流程中的非结构化任务得以高效自动化处理。此类平台通常贯穿关键业务系统,逐渐演变为连接第一方与第三方 Agent 的统一编排与管理枢纽,进而显著提升业务流程的智能化水平与运行效率。
  6. AI 生命周期平台:AI 生命周期平台中的 Agent 正在承担越来越多 AI 应用开发与部署过程中的任务自动化职能,包括数据管道构建、企业数据与 LLM 集成、模型训练与评估,以及数据可视化等关键环节。同时,Agent 可嵌入外部系统,提升用户交互的智能水平与体验质量。

图 4:鉴于 AI 代理的部署通常伴随着对计算资源的高强度使用,行业价值最有可能沉淀在超大规模服务器和 AI 基础设施层。

哪些企业将在 Agent 浪潮中受益?在分析软件企业在 Agentic 演进路径中的战略定位时,可将市场参与者大致分为三类:1)Agent Beneficiaries(Agent 受益者);2)Agent Contenders(Agent 竞争者);3)Agent Wildcards(Agent 潜在变数)。

  • Agent Beneficiaries 指那些被高度认可能够直接受益于 Agentic 智能的企业。此类企业通常具备以下两类特征之一:a)当前或近期能够通过 AI Agent 及其架构实现商业化变现,并对营收增长产生实质性推动;b)其核心业务模型将在 Agenic 技术广泛采用的推动下显著受益,从而促进整体业务的提效与扩张。
  • Agent Contender 指的是那些属于相关领域的供应商,他们有望从中受益,但仍依赖较强的执行能力,并面临市场尚未成熟所带来的挑战。
  • Wildcards 指的是那些企业在 Agentic 智能的广泛应用中存在较大争议与不确定性,尚不明确其是否能够由此获得增长动力,或是否将对其核心业务构成冲击。

AI 基础设施

  • 微软(增持) – 分析师:Keith Weiss
  • 亚马逊(增持) – 分析师:Brian Nowak
  • 谷歌(增持) – 分析师:Brian Nowak

网络安全

  • Okta(增持) – 分析师:Keith Weiss
  • SailPoint(持平) – 分析师:Keith Weiss
  • Cloudflare(增持) – 分析师:Keith Weiss

SaaS 平台

  • Salesforce(增持) – 分析师:Keith Weiss
  • HubSpot(增持) – 分析师:Elizabeth Porter
  • OneStream(增持) – 分析师:Chris Quintero

数据基础设施

  • Snowflake(持平) – 分析师:Keith Weiss
  • Palantir(持平) – 分析师:Sanjit Singh

工作流自动化

  • ServiceNow(持平) – 分析师:Keith Weiss
  • Atlassian(增持) – 分析师:Keith Weiss

图 5:最有可能从 Agentic AI 发展机遇中受益的厂商

Agent 定价:路径多元化,市场尚未形成统一共识。当前 AI Agent 的定价方式呈现高度分化的态势,不同企业探索不同路径。现阶段的定价方式通常分为两类:一类是基于活动与基于结果的定价模式;另一类则是固定定价结构与按使用量动态调整的可变定价结构。

Agent 定价策略:模型分化与混合演进

在基于活动的定价模式中,Cognition Labs 和 Harvey AI 等公司采用“员工替代”模式,即对每个 Agent 收取固定价格;而微软、OpenAI 与 Anthropic 则采用“消耗计费”模式,根据 Agent 的行为或 Token 进行浮动定价。在基于结果的定价模式中,Salesforce 和 Artisan 推行基于“流程自动化”的计费方式,按完成的工作流程收费。例如 Agentforce 的代理对话,无论是否成功,均计入费用;Zendesk 与 Sierra 则坚持“结果导向”定价模式,仅在客户达成预期成果时才计费。与此同时,Atlassian、ServiceNow 和 HubSpot 等公司正在推动混合定价策略,在高级订阅套餐中嵌入 Agent 功能,其功能具有使用限制,并支持通过额外付费解锁超额使用。

目前,大多数企业仍主要采用按席位计费的传统模式,并正逐步引入基于使用量的计费机制。与此同时,基于工作流和结果导向的定价方式也在市场中逐步获得认可。定价模式的多样化格局反映出企业级 Agentic 解决方案仍处于早期发展阶段,其商业化路径仍在探索之中。

图 6:尽管多数企业仍沿用传统的按座位计费模式,但正在逐步融合基于使用量的计费方式。同时,围绕工作流程与业务成果的价值导向型定价模式也正逐步兴起,获得越来越多企业的认可。

Agentic AI 大规模落地面临的主要障碍。尽管当前大多数企业正积极探索 GenAI 的应用场景,但由于若干关键问题尚未解决,Agentic AI 在企业中的大规模落地尚需时日。首先,现有模型的不确定性仍较高,准确性不足与幻觉问题尚未有效克服,使企业难以完全信任人工智能驱动的决策过程。其次,由于缺乏足够的安全防护措施,企业普遍担忧专有数据或知识产权被恶意方泄露。第三,缺乏用于构建多 Agent 系统的统一标准、协议及开发框架,阻碍了系统间的互操作性,并拖慢了系统开发进度。第四,数据质量参差不齐,且企业内部普遍存在数据孤岛与系统割裂,限制了 AI 对复杂业务流程的高效处理。最后,代理系统对企业专有数据缺乏充分的语义理解能力,尤其在客户组织流程与数据术语高度定制化的背景下更为明显。因此,企业在更广泛采用 AI Agent 系统时普遍趋于审慎。

执行摘要 

核心是什么?赋予软件“自主能力”:过去几十年来,软件系统的设计一直建立在一个核心假设之上:任务执行、流程运转与操作均依赖人工完成。随着 AI Agent 及其相关架构的兴起,软件开发范式正逐步转向以 AI Agent 作为任务执行与决策的核心主体。

  • 影响:为转型做好准备:AI Agent 的兴起代表着软件产业演进正进入下一阶段,其核心目标是实现面向企业级与消费者端流程自动化工具的更高层级抽象化。与以往技术变革类似,向 AI Agent 的过渡将带来更高的自动化水平、效率与生产力,同时也将推动软件行业转变商业模式,并采用全新的定价方法。
  • 市场机会
  • 狭义视角下,Agentic AI 市场当前规模约为 60 亿美元,预计到 2028 年将增长至 200 亿美元;
  • 广义视角下,Agentic AI 市场当前规模已达 520 亿美元,预计到 2028 年将扩大至 1,020 亿美元。
  • 主要受益者(Beneficiaries)
  • 超大规模服务商与 AI 基础设施提供商
  • 向应用层延伸的 AI 模型提供商
  • 提供授权管理、威胁检测、漏洞与配置管理及策略执行能力的安全厂商
  • 数据管理服务提供商
  • 工作流与流程自动化服务商
  • SaaS 平台厂商
  • 风险因素
  • 模型不确定性:准确性不足及幻觉现象依然是现实难题。
  • 缺乏有效的防护机制,难以防止专有数据或知识产权被恶意窃取。
  • 多 Agent 系统缺乏公认的标准、协议及开发框架,限制生态协同发展。
  • 企业间业务数据语义差异显著,Agent 系统难以实现精准理解。
  • 当前系统在处理复杂业务流程时的推理能力仍显不足。

什么是 AI Agent? 

AI Agent 是一种软件系统,能够理解其环境并与之交互(接收输入)、收集数据、做出决策并执行任务,无需依赖预设规则,即可自主实现特定目标。

自主 AI Agent

自主 AI Agent 是指基于 LLM 构建的系统,具备规划并执行任务或流程的能力,基本无需人工干预。与标准的 Gen AI 聊天机器人不同,这类 Agent 能够调用多种工具(如数据库、网站、API,甚至其他 Agent),并结合历史交互记忆,在实现既定目标的过程中自主协调多个推理链条与操作流程。它们能够融合外部信息与模型积累的经验,生成用于完成任务目标的相关输出。

Agentic 架构

Agentic 架构通常指由多个功能模块组成的系统性架构,这些模块分别负责查询理解、策略评估、数据访问与操作执行。在该架构中,LLM 通常作为核心推理引擎,连接各类工具与记忆模块。工具模块用于将 LLM 接入外部数据源或计算资源,并支持执行具体操作(如运行代码、修改文件等)。记忆模块(包括短期与长期记忆)则用于存储并调用 Agent 与人类、其他 Agent 或工具之间的历史交互记录。

市场机会有多大?

  • 狭义视角: 流程自动化的演进:从狭义视角来看,Agentic AI的当前市场规模约为 60 亿美元,预计至 2028 年将增至 200 亿美元。
  • 广义视角:应用功能的广泛扩展:从广义视角来看,Agentic AI 市场当前规模约为520亿美元,预计到2028年将增长至 1,020 亿美元。
  • 主要驱动因素
  • 企业对进一步流程自动化的需求持续增长。
  • 基础模型不断优化,提升业务价值,进而驱动需求扩张。
  • 智能成本持续下降,提高了 AI 项目的 ROI,进一步刺激 Agent 需求。

SoR 与 SoE AI Agent 对比 

SoR AI Agent 与 SoE AI Agent 的划分,构成了理解 Agent 架构格局的上层分类框架。

SoR Agent

  • 实现在单一应用或特定业务领域内的事务自动化。
  • 例如,Salesforce 的 Agentforce 实现了呼叫中心坐席交互流程的自动化。

SoE Agent

  • 实现跨多个应用或系统的业务流程自动化。
  • 例如,人力资源的入职流程涉及薪资、福利及 IT 采购系统的协同运作,以实现完整的工作流程。

SoR Agent 与 SoE Agent 的区分构成了理解组织代理架构的一种分析框架

新兴的 AI Agent 操作系统

新兴的 AI Agent 操作系统(Agent OS)由以下四部分组成: 1)大语言模型(LLM) 2)工具 3)存储访问能力4)规划能力

当前市场格局

Agentic AI 的市场参与者主要分为两类:一类是支持 Agent 开发的服务商,另一类是提供专用或通用型的 Agent 服务商。

哪些层面聚集价值?

价值最有可能集中于超大规模服务商及AI 基础设施提供商,主要是因为 AI Agent 的广泛部署将显著提升对高性能计算资源的需求。

  • 技术栈中其他有望受益的环节:
  • 模型提供商:作为 Agent 式解决方案的核心“大脑”,模型提供商具备向 AI 应用栈更深层级延伸的潜力,从而掌握更大价值空间。
  • 安全、治理与防护机制:在保障系统可信度、可靠性和准确性的同时执行企业级策略,该能力蕴含显著商业化潜力。
  • 数据基础设施:构建高效且可靠的 Agent 系统依赖现代化数据基础设施,实现企业结构化与非结构化专有数据的可治理、可访问集成管理。
  • 工作流自动化提供商:深入嵌入客户关键流程与业务系统的软件厂商,通过自动化或重构现有流程,在Agentic AI 驱动下创造显著价值。

谁能抓住 Agentic 机遇?

最有可能受益的软件厂商通常具备以下两类特征之一:a)具备将 AI Agent 及其架构进行产品化和商业化落地的能力; b)其核心业务能够从企业对 Agent 技术的采用中获得实际的业务增益。

  • Agent Beneficiaries 是指那些明确具备以下能力之一的参与者:能够在当前或可预见的未来将AI Agent 及 Agentic 架构实现商业化,并将其作为显著的业务增长驱动;其核心业务可从 Agent 技术的实际应用中获得实质性价值回报。
  • Agent Contenders 是指那些在战略方向上与 Agentic 技术高度契合、理论上具备受益潜力的供应商。然而,其价值兑现高度依赖于较强的执行能力和市场成熟度,而这两项前提条件目前尚未充分具备。
  • Agent Wildcards 指那些采用 Agentic 技术可能带来业务增长,也可能对核心业务构成冲击,因而整体影响尚不明朗的企业。

AI Agent 如何定价?

Agentic AI 的定价模式正在从基于席位的订阅模式转向更为多样化的计费结构。目前,该领域仍处于早期发展阶段,相关定价机制尚未形成统一的市场共识。

第一部分:核心争议点

争议一:市场机会到底有多大?

保守估计,Agentic AI 市场当前规模约为 60 亿美元,预计到 2028 年将增长至 200 亿美元。

  • 根据 IDC 定义,AI 驱动的自动化涵盖 Agentic 自动化、智能文档处理(IDP)、面向特定业务流程的专业化模型,以及预测性分析。

从广义视角来看,Agentic AI 市场当前规模约为 520 亿美元,预计到 2028 年将增长至 1,020 亿美元。

  • SoR AI Agent 的市场机会与 IDC 所定义的以劳动力为核心的自动化市场细分高度契合。
  • 当前市场规模约为 160 亿美元,预计到 2028 年将增长至 330 亿美元。
  • 以劳动力为核心的自动化包括业务流程自动化(BPA)和 RPA。
  • 此类功能通常用于支持以人为核心的活动,这些活动往往依赖人工操作或决策,例如贷款审批和新员工入职流程。
  • SoE AI Agent:其市场机会可映射至IDC 所提出的三大类市场细分维度:系统导向、决策导向与业务价值工程导向。
  • 当前市场规模约为 360 亿美元,预计到 2028 年将增长至 690 亿美元。
  • 此类功能通常涵盖两个及以上系统的后端自动化,支持系统间的互操作性、信息交换与事务处理,同时结合基于规则的决策自动化。

尽管我们对 SoR AI Agent 与 SoE AI Agent 的定义与 IDC 的市场细分存在一定差异,但二者在分类逻辑上具有相似性,可作为相对接近的参照体系。

随着 Agentic AI 解决方案的日益成熟,其潜在覆盖范围有望进一步扩展至应用软件市场的更多细分领域。

争议二:价值将聚焦于技术栈的哪个层面?

由于 AI Agent 的部署预计将显著提升对高性能计算资源的需求,价值有望集中于超大规模服务商与 AI 基础设施层级。

  • 技术栈中其他有望受益的环节:
  • 模型提供商:作为 Agentic 解决方案的核心引擎,模型提供商有望在AI 应用栈中占据更大主导地位。
  • 安全、治理与防护机制:具备执行企业级安全策略,确保系统可信度、可靠性与准确性的能力,蕴含显著商业化潜力。
  • 数据基础设施:构建实用、高效且精准的 Agent 系统,必须依托现代化的数据基础设施,以实现企业结构化与非结构化专有数据的可治理性与可访问性。
  • 工作流自动化提供商:深度嵌入客户核心流程与业务操作的软件厂商,通过进一步自动化及结合Agentic AI 重构流程,创造可观价值。

价值会在技术栈的哪一层沉淀?

争议三:哪些上市公司有望把握这一机会?

最有可能受益的软件厂商通常符合以下两项条件之一:a)能够实现 AI Agent 或 Agentic 架构的商业化落地,并以此驱动业务增长;b)其核心业务因企业用户采用 Agentic 技术而获得实际的业务收益。

  • Agent Beneficiaries 指的是被广泛认为具备以下能力的软件厂商:a)在当前或可预见的未来,能够通过 AI Agent 或 Agentic 架构实现商业化落地,并由此驱动业务增长;b)其核心业务可因企业用户采用 Agent 技术而获得实质性收益,带动整体业绩提升。
  • Agent Contenders 指处于有望从Agentic技术中受益的正确赛道,但其价值实现依赖于高度执行力及尚未显现的市场成熟度的厂商。
  • Agent Wildcard 指市场存在争议的厂商,其Agentic技术的采用究竟是促进增长的顺风因素,还是可能对核心业务造成冲击,尚无定论。

争议三:哪些厂商最有可能脱颖而出?

Agent Beneficiaries —— 超大规模服务商

  • 微软
  • 根据我们于2025 年第一季度进行的 CIO 调研结果,微软被广泛认为是最具潜力的 Agentic AI 战略首选合作伙伴。
  • 微软在安全性与数据隐私方面的专业积累,为其庞大的现有客户群体建立了关键的信任基础,也为其在Agent 系统的开发与部署中提供了高度的可信保障。
  • 微软在办公和企业应用领域的广泛布局,使其能够深度集成企业的工作流与数据体系;同时,强大的开发者生态与平台能力,也为其Agentic AI 产品的企业级采纳提供了顺畅路径。
  • 微软受益于其全面的AI 产品组合及丰富的Agent 专属解决方案,具体包括:GitHub Copilot 的异步编码Agent、 Azure AI Foundry Agent Service、Microsoft 365 Copilot Studio / Agent Build、 Microsoft Teams 的Agent 组件、Visual Studio 的 M365 Agent 工具包、M365 Agent SDK、Microsoft Fabric 中的数据 Agent、SRE Agent 等。
  • 亚马逊AWS
  • 亚马逊在公有云市场中依然保持领先的市场份额,凭借最大规模的客户基础,能够进一步实现生成式AI 能力的交叉销售。AWS 在 AI 领域已实现数十亿美元的收入。
  • 在我们2025年第一季度的 CIO 调研中,亚马逊被评为整体 IT 预算及生成式 AI 工作负载份额增长第二快的厂商。
  • 亚马逊面向企业推出了Amazon Q 服务,该服务可与用户的 AWS 账户、商业智能工具、联络中心以及各类业务应用系统实现集成,提供全面且个性化的问答功能。同时,Amazon Q 还支持代为执行任务。
  • 谷歌云
  • 在我们2025年第一季度的CIO调研中,谷歌云在IT预算增量份额中排名第三,仅次于微软和亚马逊。
  • 谷歌已宣布推出多项 Agentic 产品与方案,并加快推进产品落地进程,具体包括:即将集成至Vertex AI 的 Project Mariner、Gemini Code Assist、Vertex AI Agent Builder,以及面向 Google Workspace 的 Gemini 系列产品。
  • Gemini 2.5 Pro 目前在多个基准测试中处于领先地位。谷歌将 Gemini 深度集成至 GCP 各项服务,有望进一步提升其能力表现并推动企业客户采用。

Agent Beneficiaries —— 模型提供商

  • OpenAI
  • OpenAI 已确立其在Agentic AI 开发领域的领先地位,其多款基础模型成为 Agent 系统的智能核心。公司还发布了一整套用于构建 Agentic 应用的开发生态,包括:1)Agent SDK;2)Responses API;3)内置工具集成功能。
  • 谷歌已突破理论阶段,推出了多款可运行的Agentic 应用,充分展示了其在该领域的潜力,具体包括:1)Operator:一款能够通过网页浏览器交互执行复杂任务的自主型 AI Agent;2)Codex:一款基于网页的 Agentic 编程工具;3)Deep Research:一款能够执行深度网页搜索与分析,并生成综合性报告的 Agent 应用。
  • OpenAI 凭借强大的资本支持,为其持续的技术创新能力提供了有力保障。迄今,公司已累计获得 480 亿美元的私募融资,其中最新一轮融资高达 400 亿美元,创下历史纪录,公司估值达到 3000 亿美元。按该估值计算,OpenAI 将成为全球第四大上市软件公司,仅次于微软(3.4 万亿美元)、甲骨文(5600 亿美元)和 Palantir(3180 亿美元)。
  • Anthropic
  • Anthropic 已成为 OpenAI 的有力竞争对手,凭借差异化的技术能力和战略合作关系,在市场中实现快速发展。此外,其治理框架亦高度契合企业采纳需求。
  • Claude 模型为先进的Agentic 系统提供了关键的认知能力支持。其中,Claude 3.7 Sonnet 引入了具有突破性的“混合推理”框架,支持用户自主调配计算资源,以便根据任务复杂度优化性能表现。该模型家族包括 Haiku、Sonnet 和 Opus,可针对不同使用场景提供灵活配置的解决方案,覆盖从实时客户服务 Agent 到多步骤的长期复杂任务等多类应用需求。
  • 战略合作关系(如与AWS 和埃森哲的合作)以及 Constitutional AI 治理框架,正在加速推动企业用户的采纳,尤其在高度监管行业中表现尤为突出。此外,Anthropic 与 AWS 和 Palantir 的合作,使美国情报及国防机构能够访问 Claude 模型,进一步印证了其在敏感应用场景中的安全性与可信度。

Agent Beneficiaries —— 网络安全

  • SailPoint
  • IGA 解决方案的重点是帮助企业制定和执行有关谁可访问企业中哪些应用和数据的策略。随着 AI Agent 在企业中的大规模部署,其对数据和应用的访问权限需求将不断增长,以支持更复杂任务的完成。凭借 SailPoint 在 IGA 领域的深厚基础,其现有面向人类身份的安全能力有望延伸至非人类身份,从而支持 AI Agent 的权限管理需求。
  • SailPoint 于今年3月宣布推出 Agent 身份安全解决方案,主要功能包括:1)通过自动化治理管理 AI Agent 的全生命周期;2)实施访问认证,防止未授权访问及潜在安全风险。
  • Okta
  • Okta 在身份认证领域处于领先地位,并在身份治理业务方面实现持续增长。其 “Auth for GenAI” 解决方案进一步凸显了公司在多个身份安全增长路径上的拓展能力。
  • 尽管Okta 在 Agentic 市场中的切入策略有所不同,但凭借其在身份认证领域的领导地位,以及在新一代产品周期中的卓越表现,Okta 有望成为企业级 AI Agent 应用加速落地过程中最具潜力的受益者之一。
  • Okta 的 “Auth for GenAI” 解决方案包括以下核心功能: 1)用户身份认证;2)代表用户调用 API;3)异步认证;4)面向检索增强生成(RAG)的细粒度权限控制。
  • Cloudflare
  • Cloudflare 正处于多产品平台货币化的早期阶段,随着企业不断寻求采用 LLM 并进行试验,Cloudflare 已成为生成式AI 领域的潜在赢家。凭借其部署于全球超过330 个接入点(PoPs)的边缘网络,公司完全有能力在边缘 AI 推理需求不断增长的背景下扩大市场份额,尤其在成本控制、延迟优化以及数据安全与数据驻留方面具备显著优势。
  • Cloudflare 的开发者服务平台已吸引超过 300 万名开发者,且在 R2 对象存储、Workers 以及用于训练、推理和监控 AI 工作负载的 AI 网关等服务中的应用持续增长。
  • Cloudflare 的 Workers AI 是一款构建于其全球网络之上的无服务器 GPU 推理平台,提供 AI 推理所需的完整基础设施支持,覆盖全球 190 多个城市。

Agent Beneficiarie —— 数据基础设施

  • Snowflake
  • Snowflake 具备两条主要受益路径,有望从 AI Agent 及 Agentic 架构的部署中获得增长。首先,作为广泛应用的业务数据仓库,且其对半结构化与非结构化数据的支持持续增强,Snowflake 有望成为多种第三方及定制化 AI Agent 的关键上下文数据源。此外,凭借其 Cortex Agent,Snowflake 在 Agentic 架构的商业化进程中亦具备良好市场定位。
  • Cortex Agent 利用了 Snowflake 的两大关键 AI 工具:1)Cortex Analyst;2)Cortex Search。当 Agent 响应基于结构化数据的查询时,将调用 Cortex Analyst,并通过其文本转 SQL 的能力进行处理;而在处理非结构化数据请求(如文档或发票)时,Agent 则调用 Cortex Search,依托其融合语义与关键词的混合搜索能力,支持高效检索。
  • Snowflake 的 Agent 可嵌入各类应用程序,其核心价值在于可在单一平台上同时处理结构化与非结构化查询请求。
  • Palantir
  • 作为面向商业客户的Foundry 平台组成部分,Palantir AIP 使客户能够在组织内部安全部署 LLM,并提供包括数据集成、本体映射、管理服务、工作流自动化、应用部署等在内的全面集成功能,以支持 AI 应用开发。
  • AIP 支持 AI Agent 的构建与部署,这些 Agent 可通过其中的 AIP Agent Studio 模块集成至 AIP 应用中。
  • 通过Agent Studio,客户可以构建不同复杂度的 Agent,包括:简单的临时 Agent、特定任务 Agent、具备状态管理与更新能力的 Agentic 应用,以及能够委派任务并全自动执行复杂工作流的 Agent。

Agent Beneficiaries —— 工作流自动化

  • ServiceNow
  • ServiceNow 持续拓展自动化工作流的覆盖范围,并具备将 AI、数据与工作流自动化深度融合的能力,因而具备成为企业事实上的“AI 操作系统”的潜力。
  • AI Agent 解决复杂应用场景的能力依赖于其所构建的数据基础。ServiceNow 拥有广泛的工作流自动化能力,涵盖 IT、人力资源、客户服务等多个领域。同时,其配置管理数据库(CMDB)作为企业 IT 基础设施的记录系统,掌握着强大的数据资产,覆盖超过 85% 的财富 500 强企业客户。这一坚实的数据基础使公司具备打造具备差异化竞争力的 AI Agent 产品的能力。
  • 基于这一数据优势,ServiceNow 推出的 Workflow Data Fabric 解决方案支持客户将 ServiceNow 以外的数据接入平台,实现数据的统一整合,从而拓展 AI Agent 所能覆盖的应用场景数量。
  • Atlassian
  • Atlassian 的核心产品已深度嵌入企业及团队的日常工作流,为公司提供了独特视角,洞察现代组织在协作、项目管理与知识共享方面的运作方式。凭借这一基础及其高效的创新引擎,Atlassian 具备将 Agentic AI 融入核心工作流的良好条件,从而把握这一新兴技术机遇。
  • Atlassian 已将其 AI 与Agentic AI 功能Rovo 及 Atlassian Intelligence 集成至核心产品(Jira、Confluence 及 Jira Service Management)中。我们认为,这一策略是推动近期Agentic AI 采纳与使用的有效举措,有助于其在长期Agentic AI 机遇中占据更有利的市场地位。
  • 目前,Rovo 和 Atlassian Intelligence 的月活跃用户(MAU)已超过 150 万,较上一季度的 100 万实现了显著增长。

Agent Beneficiaries —— SaaS 平台

  • Salesforce
  • Salesforce 凭借其固有优势,在 AI Agent 应用领域持续发挥关键作用,其差异化竞争力主要体现在以下几个方面: 1)明确角色:Salesforce 能够精准识别组织内部 Agent 所对应的具体岗位职责,从而降低流程设计与用户体验设计的风险与时间成本; 2)数据:Data Cloud 集成了来自 Salesforce 内部及外部(如 Snowflake、Databricks 等)的结构化数据、非结构化数据、元数据和联合数据,为 Agent 提供全面的知识支持; 3)操作:依托多年构建多样化工作流的经验,Salesforce 能够高效支持完成岗位相关任务,并通过其“信任层”(Trust Layer为 Agent 的每一步操作提供伦理与准确性的保障。
  • Salesforce 在 AI Agentic 领域的领先地位,随着旗下 Agentforce 产品的快速增长,正逐步得到巩固。截至 2026 财年第一季度(F1Q26),公司在数据与 AI 领域的年度经常性收入(ARR)同比增长 120%,其中约 1 亿美元来自 Agentforce 产品。与此同时,Agentforce 本季度相关交易数量达约 8000 笔,较上一季度(2025 财年第四季度)的约 5000 笔实现显著增长。
  • HubSpot
  • HubSpot 在把握 AI Agent 所带来的市场机遇方面具备显著优势,主要体现在以下三个方面:1)拥有覆盖结构化与非结构化数据的丰富数据集;2)采用统一平台模式,将数据、用户互动与多样化的应用模块(即 hubs)及 AI 驱动的任务执行紧密关联;3)通过旗下 Agent.ai 网络构建了充满活力的 Agent 生态系统。此外,HubSpot 强调易用性与即装即用特性,平台已全面嵌入 AI 功能,帮助用户快速完成部署,并逐步实现规模化扩展。
  • 在战略层面,HubSpot 坚持优先推动新产品的广泛推广和深度使用,随后再考虑直接变现。这种先推广后变现的模式,将为未来实现稳定且可持续的收入增长奠定坚实基础。
  • 随着产品使用率和用户覆盖率的提升,HubSpot 为其 Customer Agent 产品推出了一种基于积分的定价模式。该模式结合了订阅制与按使用量付费制的优势,有助于实现价格与产品价值之间更精准的对齐。
  • OneStream
  • AI Agent 更容易在以下领域率先落地并实现商业化:1)以成本控制为核心的部门,企业可通过减少人力数量直接实现显著的 ROI;2)人才供应紧缺的行业,企业倾向通过技术手段缓解人力资源压力;3)大量依赖人工处理数据的领域。我们认为,由于企业 CFO 在采购决策中通常更为谨慎,倾向选择风险较低的成熟供应商,因此现有厂商相较新进入者,在 AI Agent 市场中更具竞争优势。
  • OneStream 自2017年起开始开发 AI/ML 工具(SensibleML),近期又推出了一系列 Agent,包括Finance Analyst、Operations Analyst、Search Analyst及Deep Analysis。这些 Agent 因能高效处理大量手工任务和数据密集型工作,已获得客户的积极初步反馈。

Gartner 将该细分领域定义为:“利用 AI 技术用于增强和扩展 IT 服务管理工作流程的工具。”

  • 这些工具能够分析ITSM 数据及元数据,为 IT 服务台及技术支持相关工作提供建议和具体行动方案。
  • 这些工具既可作为独立解决方案,也可作为ITSM 平台的内置功能模块,或以插件形式整合到现有 ITSM 平台中。

尽管上述定义和相关解决方案尚未完全符合严格意义上的 Agentic 标准,但随着该技术的持续发展与逐步普及,由此可初步判断哪些厂商在 ITSM 领域具备更强的竞争优势。

  • ServiceNow 提供数千个预制的 AI Agent,覆盖各类工作流程场景,同时推出名为 AI Agent Studio 的工具,用于支持用户构建高度个性化的 Agent。公司近期还发布了 AI Agent Orchestrator,作为统一的“指挥中心”,用于统筹规划并促进 ServiceNow 自有 Agent 与第三方 Agent 之间的协同运行。
  • Aisera 推出的 Agent Assist 是一款基于 Agentic AI 技术的工具,主要用于提升客服人员的工作效率。其核心功能包括:实时提供基于上下文的解答与案例总结、推荐下一步最优操作方案,以及自动撰写知识库文章。该工具可直接嵌入 ServiceNow、Salesforce、Zendesk、Jira 和 Freshworks 等多种 SaaS 应用中。
  • Moveworks 平台依托其 Agentic 自动化引擎,支持用户构建 AI Agent,以实现组织内各类工作流程的自动化。

Gartner 将该细分领域定义为:旨在帮助开发者生成和分析软件代码与配置的工具。

  • 这些工具基于专为代码理解优化的 LLMs,并集成于代码编辑器、命令行终端及聊天界面等常用开发者工具中。
  • 开发者可通过简单指令,完成代码的生成、分析、调试、修复与重构,同时编写文档,并实现不同编程语言之间的代码转换。

尽管该定义和相关解决方案尚未完全符合严格意义上的“Agentic”标准,但随着技术的持续进步与广泛应用,由此可初步判断哪些厂商在软件开发领域具备更强的竞争优势。

  • GitLab Duo 在软件交付的各个环节提供 AI 功能,涵盖代码生成、补全、解释与重构,安全漏洞识别与根因分析,以及价值流分析。GitLab 目前正在开发 GitLab Duo Workflows,该工具将超越传统代码助手,成为具备自主能力的 AI Agent,能够全天候监控项目,主动识别并解决潜在问题。
  • GitHub Copilot 是由 GitHub 与 OpenAI 联合开发的智能编程辅助工具,能够在软件开发的各个阶段实时提供代码建议、自动补全及相关支持功能。作为市场上首个此类产品,GitHub Copilot 领先于 GitLab,已成为全球使用最广泛的代码助手。
  • Google 推出的 Gemini Code Assist 
  • Amazon 推出的 CodeWhisperer 

Gartner 将该细分领域定义为:“用于构建、协调及管理多类对话自动化应用的软件平台。”

  • 这些平台主要被应用于客户服务与支持、呼叫中心、IT 服务台及人力资源管理等场景的自动化。

尽管上述定义与解决方案尚未完全符合严格意义上的“Agentic”标准,但随着技术的不断进步与逐步普及,基于该定义与方案,我们可以初步判断哪些厂商在对话 Agent 领域具备竞争优势。该领域涵盖客户服务、市场营销及销售等应用场景。

  • Kore.ai 提供 Agent 平台,内置预设型与可定制型 AI Agent,覆盖企业内部支持(如人力资源与 IT 部门)、外部客户服务及业务流程自动化等场景。
  • Cognigy 专注于客户服务领域,推出便于部署于呼叫中心的 AI Agent,涵盖语音及聊天 Agent,以及面向人工客服的智能助理——Agent Copilots,有助于提升服务效率。

争议四:Agent 的定价方式?

许多厂商当前更侧重于推动 AI Agent 的应用普及,而非追求直接收益。尽管已建立基础定价机制,但多数厂商仍在探索多元化的计费模式,包括按使用量计费、按工作流程计费以及按结果付费等方式。

按每个 Agent 计费

  • 固定月度费用:客户无论使用量多少,均支付固定月度费用以使用AI Agent 服务,典型案例包括Devin。
  • 分层定价:依据不同价格等级,客户可获得相应层级的访问权限及功能。
  • 按用户数收费:客户根据拥有AI Agent 访问权限的用户数量支付费用,典型案例包括NOW。

按每次操作或使用量计费

  • API 调用计费:厂商根据 AI Agent API 的调用次数进行收费,典型案例包括 CRM 的 Flex Credits。
  • 计算资源与数据处理量计费:定价依据AI Agent 消耗的计算资源或处理的数据量确定。
  • 基于Token 计费:根据 AI Agent 处理的输入与输出Token 数量计费,典型案例包括 Anthropic 和 OpenAI。

按工作流程计费

  • 按对话计费:客户根据与 AI Agent 的每次交互次数支付费用,典型案例包括某CRM 平台。

按业务成果计费

  • 一种最新的定价模式,客户基于 AI Agent 实际实现的具体业务成果进行付费,包括但不限于成功解决的客户对话、订单取消率的降低及销售额的提升。
  • 尽管具体细节尚未公开,Sierra 表示其客户服务 AI Agent 采用“基于成果的定价”策略。

内嵌型定价 

  • 在较高级别的订阅套餐中,客户可直接获得AI Agent及其相关功能的访问权限。
  • 当前,许多厂商仍将促进客户采纳及提升使用率作为主要工作重点,典型案例包括TEAM 和 HUBS。

绝大多数公司仍采用传统的按用户数计费模式,但越来越多的公司开始逐步引入使用量计费机制。与此同时,按工作流程计费和按结果计费的方式也在逐步流行。

案例分析:基于工作流程的定价模式——Salesforce(Agentforce)

最初,该产品采用按次对话计费的基础定价模式,每次对话收费美元

  • 对话类型包括:
  • ASA 消息:对话窗口自用户首次发送消息起计时,持续 24 小时后结束。
  • 销售教练:用户在角色扮演或现场辅导环节结束后点击“获取反馈”,即计为一次对话消耗。
  • 销售开发代表:首次向潜在客户发送邮件即计为一次对话消耗,且包含该代表随后针对该潜在客户的所有相关活动。
  • 每次对话包含最多200 次 Einstein 请求额度,超出部分将从共享额度中扣减,或产生额外费用。

2025 年 5 月 15 日,推出了三种新增的定价模型,包括:

  • Flex Credits采用细化的按使用量计费模式,每次操作收费 0.10 美元,等同于 20 个弹性积分。弹性积分以 10 万个为一包出售,售价 500 美元,客户仅需为特定Agent活动付费。
  • Flex Agreement允许用户在许可证与弹性积分之间灵活转换,从而灵活调整人员与 AI Agent 之间的预算分配。
  • Agentforce 用户许可证及附加服务:通过传统的按用户每月计费方式,赋予员工对Agent的无限制使用权限。相关定价计划预计于2025 年夏季发布。

案例分析:基于成果的定价模式——Zendesk(AI Agent)

该定价策略反映了企业在 AI 商业化路径上的持续演进,有效融合了传统订阅计费模式与基于成果的计费模式。

  • 现有订阅套餐已集成 AI 功能,高级套餐及附加服务提供更多进阶功能。
  • 基于成果的定价模式于 2024 年 9 月推出,费用将直接与 AI Agent 的实际表现相关联。
  • 每次成功 AI 交互的费用为 1.50 至 2 美元,并可享批量定价优惠。
  • 升级至人工客服的交互不计入计费范围,以确保费用与实际业务成果相关联。

基于成果的定价模型有效解决了客户的核心痛点:

  • 成本可控性:避免因 AI 表现不佳而产生额外费用 
  • 弹性扩展能力:高峰时段无需承担固定人力成本,即可获得无限AI 处理能力 
  • ROI 透明度:可将每个 AI 处理的工单成本与人工成本直接对比

我们发现部分客户对“自动解决”的概念存在疑虑,且部分未完成的对话仍可能被计费。

案例分析:混合定价模式——HubSpot(Breeze)

二元计费模式,融合传统订阅方式与基于使用额度(Credits)的计费机制。

理念解析

  • 鉴于 HubSpot 采取优先推动新产品(包括 Agent)规模化应用,随后实现直接变现的战略,公司于 2024 年 9 月 INBOUND 大会上在全平台上线了 Breeze Agent 的公测版。

直接变现阶段 

  • HubSpot Credits:截至 2025 年 6 月,HubSpot 推出了基于使用量的 HubSpot Credits 计费模式,客户仅就实际使用的功能服务计费。积分在执行相关操作时消耗,例如处理服务工单。

主要考虑因素

  • 积分分配额度是多少?
  • 免费版:不适用 
  • 入门版:不适用 
  • 专业版:每月 3,000 积分 
  • 企业版:每月 5,000 积分
  • 哪些订阅套餐或用户数量符合资格?
  • 适用于全部版本(入门版、专业版、企业版)与所有模块(营销、销售、服务、运营、内容)。
  • 仅限付费用户和合作伙伴账户(不包括免费或只具查看权限的用户)
  • 用户如何购买超出分配额度的额外积分?
  • 小型包:每月 5,000 额外积分,价格为 45 美元/月 
  • 中型包:每月 30,000 额外积分,价格为 270 美元/月 
  • 大型包:每月 100,000 额外积分,价格为 900 美元/月

第二部分:发展历程回顾

什么是 AI Agent?AI Agent 是一种系统(软件程序),具备理解并与环境交互(接收输入)、收集数据、做出决策及执行任务的能力,能够在不依赖预设规则的情况下,实现特定目标。

自主 AI AgentAutonomous AI Agent自主 AI Agent 是指基于 LLM 构建的系统,具备规划并执行任务或流程的能力,基本无需人工干预。与标准的 Gen AI 聊天机器人不同,这类 Agent 能够调用多种工具(如数据库、网站、API,甚至其他 Agent),并结合历史交互记忆,在实现既定目标的过程中自主协调多个推理链条与操作流程。它们能够融合外部信息与模型积累的经验,生成用于完成任务目标的相关输出。

Agentic 架构:Agentic 架构通常指由多个功能模块组成的系统性架构,这些模块分别负责查询理解、策略评估、数据访问与操作执行。在该架构中,LLM 通常作为核心推理引擎,连接各类工具与记忆模块。工具模块用于将 LLM 接入外部数据源或计算资源,并支持执行具体操作(如运行代码、修改文件等)。记忆模块(包括短期与长期记忆)则用于存储并调用 Agent 与人类、其他 Agent 或工具之间的历史交互记录。

发展演变历程

  • 基于规则的系统:AI 领域中的“基于规则的系统”概念可追溯至 20 世纪 70 年代。当时最早的“专家系统”基于逻辑规则构建,其设计灵感源自医学、法律等领域中专家如何利用知识进行决策。最著名的案例之一是斯坦福大学开发的 MYCIN 系统,旨在诊断细菌感染,并根据预设规则提出治疗建议。
  • 自然语言处理20 世纪 80 年代末,自然语言处理(NLP)—— AI 的一个分支,旨在赋予计算机理解和处理人类语言的能力——经历了飞跃性发展。这一发展主要得益于计算能力的稳步提升以及新型机器学习算法的应用,这些算法基于统计模型,区别于传统的决策树模型。进入 20 世纪 90 年代,NLP 领域中基于统计的模型数量显著增加。
  • 智能 Agent20 世纪 90 年代初,AI 研究的重点转向“智能 Agent”,也称作代理体或智能体,广泛应用于新闻检索服务、网上购物及网页浏览等领域。与此同时,机器学习(包括数据驱动方法和神经网络)的兴起,推动了旨在实现自主运行的智能 Agent 的发展。
  • 机器学习:2000 年代,随着大数据技术(如 Apache Hadoop 和 NoSQL 数据库)的广泛应用,以及机器学习和数据挖掘技术在复杂数据集中的信息提取能力不断提升,Agent 逐步演变为数字虚拟助理与聊天机器人。数字虚拟助理最初主要被用于提供天气、新闻和交通报告等信息。聊天机器人虽与数字虚拟助理在多个方面相似,但可与真人进行交互,通常应用于市场营销、销售及客户服务等领域。
  • 现代 AI Agent:自然语言处理(NLP)、机器学习、决策技术以及大规模数据访问能力的持续进展,推动数字虚拟助理和聊天机器人演变为高度实用的工具。现代 AI Agent 融合了多种技术与能力,具体包括:1)由大型语言模型(LLM)提供的自然语言理解与生成能力;2)支持文本、图像、音频及其他数据类型的多模态处理能力; 3)通过整合 LLM 与“思维链”提示等技术,实现推理与规划功能;4)集成外部工具与 API,以支持复杂任务的执行;5)通过短期与长期记忆的结合,实现连续性、自我反思及性能优化。

重要里程碑及最新突破 

RPA 与 AI Agent 

RPA 通过预设规则自动执行处理结构化数据的任务;而 AI Agent 则利用非确定性推理能力和上下文信息,实现任务和流程自动化,并具备适应环境变化的能力。

Agentic 自动化的阶段

AI Agent 正迅速提升完成长时间复杂任务的能力

在过去六年中,基于前沿通用模型的Agent 其自主完成任务所能维持的时长大约每七个月实现一次翻倍增长。

预计在未来十年内,AI Agent 有望独立完成大量当前需人类耗时数天乃至数周才能完成的软件开发任务。

第三部分:Agent 生态格局的构建

SoR AI Agent 与 SoE AI Agent

在构建Agent生态体系时,一种常用的框架是区分 SoR Agent与 SoE Agent。

SoR Agent — 专注于特定角色的自动化 

SoR Agent 主要针对编码、客户服务、销售线索生成、商业智能等特定领域的功能进行自动化。代表产品包括GitHub Copilot、Workday、Salesforce Agentforce 以及 HubSpot 线索 Agent(Prospecting agent)。

  • Agent 角色:SoR Agent 主要承担特定业务职能或应用领域内的自动化任务。
  • Agent Focus它们专注于特定领域中的具体岗位角色,如客户服务人员、软件开发者、业务分析师、研究助理及销售开发代表等。
  • 价值主张:SoR Agent 的核心价值在于替代人工或减少人工成本。
  • 投资回报是否可量化?由于其价值主要体现在人工替代或成本节约方面,SoR Agent 更易直接体现为成本节约效果。
  • 商业化时间由于具备明确且可量化的投资回报,SoR Agent 通常比 SoE Agent 更早实现商业化。

SoE Agent — 面向工作流程和流程的自动化 

SoE Agent与 SoR Agent 不同,SoE Agent 侧重于管理和自动化跨多个系统及应用的工作流程。代表产品包括ServiceNow Now Assist、GitLab Workflows 和 Atlassian Rovo。

  • Agent RoleSoE Agent 更多承担监督与管理职责,负责协调跨多个应用和系统的工作流程。
  • Agent Focus与专注于特定岗位自动化的 SoR Agent 不同,SoE Agent 侧重于整个工作流程或业务流程的自动化。
  • 价值主张:SoE Agent 的核心价值在于提升企业资源与软件解决方案的整体利用效率。
  • 投资回报是否可量化?由于其价值侧重于提升利用效率而非人工替代,SoE Agent 的投资回报通常较难准确衡量。
  • 商业化时间:鉴于投资回报较难量化,SoE Agent 通常较SoR Agent 更晚实现商业化。

基于两个维度的分类体系

在投资者分析竞争格局的过程中,建议从两个维度进行划分,其中一个维度是基于工作流程与岗位角色进行分类,该维度划分与业内对 SoR 与 SoE 的定义基本一致。

SoR  SoE 对比——横向与纵向维度

  • SoR Agent 专注于特定任务或业务流程,负责完成某一环节的自动化工作。
  • 代表案例包括 GitHub Copilot、Workday、Salesforce Agentforce 以及 HubSpot Prospecting agent。
  • SoE Agent 体主要承担监督与管理职责,负责协调跨多个应用及功能系统的工作流程。预计这一角色分工同样适用于Agent领域。
  • 代表案例包括 ServiceNow Now Assist、GitLab Workflows 和 Atlassian Rovo。

在分析竞争格局时,建议从两个维度进行分类:一是基于流程与角色的细分;二是基于横向导向与纵向导向的解决方案划分。

SoR 与工作流程对比 —— 横向与纵向维度

  • 纵向解决方案专注于自动化特定行业的流程,例如 Harvey.ai 主要针对法律相关工作流程的自动化。
  • 横向解决方案则侧重于自动化跨行业通用的流程,如人力资源管理和软件开发。

这些组织原则可能在产品上市速度与市场规模之间存在权衡关系。

  • 来自交易导向型 Agent 的解决方案,明确聚焦特定岗位角色。
  • 部署与实施相对简便。
  • 聚焦成本节约与收入增长,带来明确的投资回报。
  • 显著的行业聚焦进一步强化了上述优势。
  • 面向工作流程的 Agent,应用场景横向广泛
  • 随时间推移,拓展至更大更广的市场机会
  • 构建与部署周期相对较长
  • Microsoft 365 Copilot 解决方案(含 Agent 功能)面向全球超过4 亿商业版 Office 用户
  • ServiceCloud 的 Agentforce 解决方案服务于美国约 300 万呼叫中心员工(根据美国劳工统计局数据),全球用户规模约为 1,200 万至 1,500 万。

基于两个维度的分类体系

按推理范式分类 AI Agent

推理范式(Reasoning Paradigms):另一种组织 AI Agent 的方法是根据其采用的不同推理类别进行划分。目前,较为流行的推理范式主要包括 Chain of Thought(思维链)、ReAct(反应式推理)、Reflexion(反思式推理)以及 Tree of Thought(思维树)。

  • Chain of Thought (CoT):在得出最终答案之前,Agent 通过生成内部推理链,促使其以线性方式逐步思考。该思维链推理过程不依赖任何外部工具。
  • ReAct:该提示方式将 Chain of Thought 推理与行动相结合。不同于 CoT,ReAct Agent 能够与工具和环境进行交互,从而生成答案。
  • Reflexion:通过引入两个关键要素——自我反思与长期记忆,ReAct 式推理得以扩展。借助这些功能,Agent 能够在每次连续运行中持续改进与学习。
  • Tree of Thought (ToT):与 ReAct Agent 采用的线性推理不同,Tree of Thought Agnet 在树状结构上搜索可能的推理路径,并在选择最优路径前对各条路径进行评估。

思维链(Chain of ThoughtAgent

什么是思维链(CoTAgent思维链(Chain of Thought, CoT)Agent 是指在生成最终结果之前,采用线性且逐步推理过程的AI Agent。

  • 逻辑结构示意:思考1 → 思考 2 → 思考 3 → 最终答案。
  • 优势:结构简单,易于实现,适合处理数学、逻辑谜题及一般推理任务。
  • 限制:无法与环境互动,不能调用工具,推理过程中不进行实时观察。

思维树(Tree of Thought)Agent

什么是思维树(ToTAgent思维树(Tree of Thought, ToT)Agent 通过将任务拆分为层级结构的潜在行动或路径,评估多种可能的解决方案,并通过逐层筛选排除较次优路径,以优化决策过程并最终确定最优方案。

  • 逻辑结构示意:生成多条解决路径→ 形成决策树 → 评估各路径 → 每步选择最优路径。
  • 优势:支持有计划的结构化评估,逐步排除不理想方案,适合需要复杂决策和精细规划的任务。
  • 限制:不与环境互动,实现复杂,需依赖高效评估算法,且计算资源消耗较大。

ReAct Agent 

什么是 ReAct AgentReAct Agent是一类将推理与行动有机结合的 AI 系统,能够借助工具与环境进行交互,具备观察能力,并基于观察结果开展更深入的推理。

  • 逻辑结构:思考→ 采取行动 → 观察 → 循环执行 
  • 优势:能够与环境互动,使用多种工具,并根据反馈进行自我调整,特别适合编码、基于检索增强的问答等互动性任务。
  • 限制:缺乏跨交互的持久记忆,且无法从历史经验中进行学习。

Reflexion Agent 

什么是 Reflexion AgentReflexion Agent 与 ReAct Agent 相似,但进一步具备自我反思能力和长期记忆(long-term memory)。在每次执行操作后,Agent 会评估操作结果的成效,保存反馈信息,并基于这些经验持续优化其后续行为表现。

  • 逻辑结构:(思考→ 行动 → 观察)→(自我反思 → 更新长期记忆)→ 未来任务
  • 优势:具备与环境互动和使用多种工具的能力,能根据反馈不断调整,适合编码、基于检索增强的问答等互动性任务。
  • 限制:尽管具备长期记忆,但仍存在跨多个交互过程中的记忆保持和学习能力有限的问题。

新兴的 AI Agent 操作系统

AI Agent 操作系统的核心要素包括:1)大语言模型(LLM);2)各种工具;3)记忆访问能力;4)规划能力。

Agent 操作系统的四大核心组件

  • 基础模型:每个 Agent 均由 AI 或 LLM 驱动,能够接收指令、调用工具、进行推理、执行任务,并组织响应以输出最终结果。
  • 工具:定义了 Agent 可执行的动作范围,涵盖代码解释器、计算器、日历、网络搜索、企业搜索、公共或私有 API 以及各类数据库和数据源。
  • 记忆:指 Agent 获取、存储及调用信息的能力,主要分为两类:1)短期记忆(又称工作记忆),通常通过检索增强生成(Retrieval Augmented Generation,RAG)等技术实现,为 Agent 提供当前任务所需的信息和上下文;2)长期记忆,指 Agent 基于向量化或操作型数据存储,在较长时间内回忆并利用信息的能力。。
  • 规划:指 Agent 将复杂问题拆解为子目标以高效执行任务的能力,同时包括通过自我反思和从错误中学习,不断优化行为的能力。

多 Agent 框架 

什么是 Agent 框架?Agent框架是指一种多 Agent AI 软件开发平台,通过提供高级抽象层和预置组件,简化系统构建过程。这些组件支持任务协调、记忆管理、工具调用和推理等关键功能的实现。

Agent 框架在当前市场上展现出显著的吸引力

  • CrewAI:一个基于 Python 的开源多 Agent 框架,旨在协调协作环境中的 Agent 行为。Agent 通过其角色定义,并通过智能协作共同实现既定目标。
  • LangGraph:LangGraph 由 LangChain 开发,是一个开源框架,允许开发人员利用基于图的架构构建复杂的 Agent 应用程序,以模拟和管理 AI 工作流程中的各种关系。
  • Autogen:Autogen 是微软开发的一个开源编程框架,允许开发人员构建 Agent ,并通过模拟人类团队和组织结构,使 Agent 能够协同完成任务。

Agent 协议 

Agent 协议是为 AI 模型与 Agent 确立的统一标准,旨在连接外部服务,并实现 Agent 之间的通信与协作。

领先的 Agent 协议

  • MAC:模型上下文协议(MCP)由 Anthropic 开发,是一种为 LLM 连接外部工具、服务及数据(如数据库、API 和文件)提供标准接口的协议。通过 MCP,开发人员无需为每个 LLM 单独编写定制化且重复的连接逻辑。
  • A2A:Agent to Agent 协议是谷歌开发的一种基于云的标准,旨在实现 AI Agent 在不同系统间的互联互通。该协议使来自不同供应商的 Agent 能够协同工作,共同执行指定的工作流程。
  • ACP:由 IBM 与 BeeAI 制定的开放式 Agent 协调标准《Agent 通信协议》(ACP)实现了 AI Agent 之间的结构化通信、发现与协调。ACP 与 A2A 协议的区别在于,ACP 侧重于本地运行环境,而非基于云的运行环境。

主要 Agent 协议对比

MCP:引领 Agent 应用开发的新一波浪潮

为保障 AI Agent 的高效运行,必须实现实时响应与操作执行,包括获取相关上下文、连接数据源以及调用多种工具。在 MCP 出现之前,开发者需针对每个部署的 LLM 单独设计集成方案,以连接所需的工具与服务。

  • 解决方案:MCP 确立了统一标准,使 LLM 能够实现无编码连接应用、数据和服务。
  • 类比:类似于个人电脑通过 USB 标准便捷连接存储设备、充电器、耳机及显示器等外设,AI 模型则借助 MCP 协议,实现其知识与功能的标准化扩展。
  • 影响:MCP 的出现显著简化了在真实环境中构建实用且高效 AI Agent 的流程,极大提升了开发效率。由此推动了 Agent 应用的新一轮快速发展浪潮。

第四部分市场格局 

当前市场格局   

最具应用价值的领域

以上内容翻译自 Morgan Stanley 的《AI Agents Knocking at the Door》,如需原文,请与我们联系。图片WF Research 是以第一性原理为基础的专业顾问服务机构,欢迎关注和留言!微信号:Alexqjl

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注