麦肯锡解读AI智能体

AI智能体是我们用来与AI交互的工具。它们可以自动化并执行复杂的任务,例如自然语言处理,这些任务通常需要人类来完成。
AI智能体是一种软件组件,具有代表用户或系统执行任务的能力。 用户可以将代理组织成系统,这些系统可以编排复杂的工作流,协调多个代理之间的活动,将逻辑应用于棘手的问题,并评估对用户查询的回答。
如果你曾经与客户服务聊天机器人互动过,或者让生成式AI模型为你写一首十四行诗,那么你很可能已经熟悉了 AI智能体的初级版本。 如果你注意到自 ChatGPT 引领主流以来,生成式AI的性能有所提升,那你的感觉没错。 虽然各种形式的 AI智能体已经存在多年,但当今生成式AI模型的自然语言处理能力释放了大量新的可能性,使得代理系统能够规划、协作和完成任务——甚至学会改进自身的性能。 随着代理变得越来越准确,公司可以越来越多地使用它们来自动化组织流程,并帮助提高员工的日常工作效率。
麦肯锡高级合伙人 Lari Hämäläinen 表示:“生成式AI的发展速度极快。” “如今,人机结合的成果可以产生高质量和高生产力。” 近期在短期和长期记忆结构方面的发展使这些代理能够更好地个性化与内外部用户的互动,这意味着代理在处理被要求的任何任务时都在迅速变得更好。 展望未来,它们将变得更加出色;简而言之,AI智能体正在从思考转向行动。 在过去的 18 个月里,谷歌、微软、OpenAI 等公司已投资于软件库和框架以支持代理功能。 并且随着诸如微软 Copilot、亚马逊 Q 以及谷歌即将推出的 Project Astra 等由大型语言模型 (LLM) 驱动的应用的出现,代理正在从基于知识的工具转向更基于行动的工具。 在不久的将来,代理可能会像今天的移动应用程序一样普遍。
有哪些不同类型的 AI智能体?
AI智能体可以根据其能力、角色、技能以及被训练来达成的结果进行分类。 以下是当今正在创建的一些代理的不完全列表:
- •个人增强(“副驾驶”代理):这些代理充当个人用户的副驾驶,旨在增强该用户的生产力和能力。 诸如微软的 365 Copilot 和 OpenAI 的 ChatGPT 等副驾驶代理可以协助起草内容、编写代码或检索知识。 在某些情况下,副驾驶代理可以作为针对用户特定工作流程量身定制的“智能”助手。 当然,这类代理的影响取决于每个员工自身的动机和投入程度。
- •工作流自动化平台:这类代理专注于自动化单步或多步任务或较小的工作流,充当现有工作流的AI驱动的流程编排器和执行器。 此类代理的示例包括微软的 Copilot Studio 和 Salesforce 的 Agentforce(目前正在开发中)。 由于这些代理主要应用于现有流程,其成功将依赖于在实施、变更管理和代理管理方面的大量投入。
- •面向领域解决方案的生成式AI原生代理:这些是为特定业务领域或职能构建的专用解决方案。 示例包括AI驱动的客户服务系统或支持AI的软件开发流水线。 生成式AI原生代理以AI为解决方案的核心来重新构想特定领域,而不是像传统 AI智能体那样将AI叠加到现有的角色或工作流上。
- •AI 原生企业和运营模式:这些代理贯穿于整个企业运营模式中,而不是应用于单个工作流或职能。 在这些情况下,公司会进行端到端的AI优先重新设计,其中交互层、流程、组织结构甚至商业模式都会被重新构想。 企业在首次进行数字化转型时经历了这种量级的变革,同样的情况很可能在AI领域发生。
- •AI 虚拟员工:AI 虚拟员工是作为员工或团队成员运作的代理,代表了最具潜在颠覆性的代理类别。 这些虚拟员工可以使公司绕过全面的组织转型,允许AI在公司现有模式内运作,这可能有助于更快地获取价值。
这些 AI智能体并非相互排斥。许多组织将追求混合策略——例如,在推广个人AI副驾驶的同时,自动化选定的工作流并试点一些虚拟员工。
AI智能体是如何工作的?
AI智能体可以支持跨行业和业务职能的高度复杂和模糊的用例。 它们可以使用为人类设计的工具(如网络浏览器),也可以使用为计算机设计的工具(如 API)。 同时具备这两种能力使得 AI智能体能够灵活地跨越组织内外的技术架构进行操作,而无需对这些架构进行重大修改。
AI智能体的工作过程通常遵循四个步骤:
1.用户给代理系统分配任务。 AI智能体自主工作,规划并推导如何完成任务。
2.代理系统规划、分配和执行工作。AI智能体系统将工作流分解为任务和子任务,由一个管理者代理分配给其他专门的子代理。 这些专门的代理利用先前的经验和习得的领域专业知识,相互协调,并使用组织和外部数据来执行任务。
3.代理系统可能迭代改进输出。代理系统可能会请求额外的用户输入以确保准确性和相关性。 一旦交付最终输出,代理系统可能会请求用户反馈。
4.代理执行行动。代理执行任何必要的操作以完全完成任务。
由生成式AI赋能的代理很快就能像超高效的虚拟同事一样工作。
一个代理系统如何执行从提示到输出的工作流的示意图:
开始 -> 用户使用自然语言提示生成式 AI智能体系统完成任务。 -> 代理系统解释提示并制定工作计划。一个管理者代理将项目细分为分配给专家代理的任务; 他们从多个来源收集和分析数据,并相互协作以执行各自的任务。 -> 代理团队与用户分享草稿输出。 -> 代理团队接收用户反馈,然后相应地迭代和完善输出。 -> 结束。
(代理系统包含:管理者代理、分析师代理、检查者代理、规划师代理等专家代理。专家代理与外部系统交互:代理与数据库和系统——包括组织和外部数据——进行交互以完成任务。 )

任何 AI智能体的部署都应包含一系列控制措施。 例如,建设性的反馈循环允许代理审查和完善其工作。 AI智能体也可以被编程为自学解决问题或将其上报给人类管理者。 代理也可以更好地协同工作:一个批评者专家代理可以审查一个创建者代理制定的计划并要求迭代,从而产生更好的输出。 一些 AI智能体甚至可以直接向管理者提问。 组织还可以开发专门的代理,根据道德和偏见问题自动测试和纠正其他代理的输出。
AI智能体与 LLM(大型语言模型)有何关系?
AI智能体与不同的AI模型协同工作以完成任务。 当用于与人类交流时,AI智能体会与配备了自然语言处理能力的 LLM 合作。 以自动驾驶汽车为例,它运行在一系列与各种AI模型协同工作的代理上。 负责理解用户想去哪里的 AI智能体可能会使用 LLM。 但是,负责确保汽车左转安全的代理会使用高度专业化的设计模型,而不是 LLM 来做这种特定类型的决策。
AI代理可能如何影响业务增长?
麦肯锡估计,从长远来看,生成式AI的企业用例每年可能创造高达 4.4 万亿美元的价值。然而,除非组织能够快速实施 AI来重新构想和转变工作方式,否则它们无法将这种潜力转化为业务增长和更高的生产力。AI代理可以比其他旧技术更快、更好、更便宜地挖掘这座价值宝库。
但生成式AI的价值不仅仅在于自动化常见的工作任务。麦肯锡预测,组织可以部署 AI智能体来帮助重新构想流程并实现其 IT 基础设施的现代化。这可能包括从切换到更易于使用的编程语言、过渡到提供更多功能的现代框架,到重构系统使其更具模块化,以及将应用程序迁移到更便宜的云计算环境运行等一切事务。技术领导者可以使用多个专门的 AI智能体,每个代理都具有独特的角色和专业知识,以协作处理复杂任务,并根据人类的反馈进行实时迭代。然而,真正的价值将来自于编排代理以完成离散的任务以及整个软件开发过程。
一些行业已经在定期部署 AI智能体。例如,客户服务机器人在许多面向客户的网站上已成为标配。根据麦肯锡关于生成式AI经济潜力的研究,使用支持生成式AI的客户服务代理的组织,每小时的问题解决率提高了 14%,处理问题所花费的时间减少了9%。麦肯锡高级合伙人 Jorge Amar 表示:“随着时间的推移,我预计生成式 AI智能体将提高客户满意度并创造收入。它们在销售新服务或满足更广泛的需求方面将至关重要。”“这将为公司开辟更广泛的客户体验选择,例如提供更多与人类代理的高接触互动作为增值服务。”
更普遍地说,支持生成式AI的代理可以通过三种重要方式潜在地简化复杂用例的自动化:
- •代理可以更容易地处理不太可预测的情况。基于规则的系统在遇到规则设计者未预料到的情况时往往会失效。相比之下,生成式 AI智能体系统可以处理给定用例的各种场景。因为它们是使用基础模型构建的,这些模型已经在大型、非结构化数据集上进行了训练,所以生成式 AI智能体可以实时适应不同的场景并执行专门的任务。
- •代理系统可以通过自然语言进行指导。自然语言处理可以使用户比以往任何时候都更快、更容易地编码复杂的工作流。用自然语言处理编码的生成式 AI智能体可以使更广泛的员工能够构想和使用AI工具来实现结果,而无需专门编程或编排更大的 IT 项目。
- •代理可以与现有的软件工具和平台协同工作。生成式 AI智能体运行在基础模型上,这使得代理能够使用工具并在更广泛的数字生态系统中进行通信。 如果没有基础模型,这些能力将需要大量的手动工作来集成系统或整理不同系统的输出。 代理可以显著减少跨系统集成所需的工作量和返工量。 此外,根据麦肯锡合伙人 Aaron Bawcom 的说法,“当代理协同工作时,它们的能力可以根据环境发生复合反应。它们可以发展出未被明确编程的意外行为和技能,其效果大于各部分之和。这就是所谓的涌现式 AI。”
有公司使用 AI智能体的真实案例吗?
联想(Lenovo)已在其业务的两个主要领域部署了 AI智能体:软件工程和客户支持。该公司解决方案与服务集团首席技术官 Arthur Hu 表示,公司的软件工程师已经看到了高达 15% 的效率提升。该公司的首席运营官兼战略负责人 Linda Yao 补充说,客户服务方面在通话处理时间上实现了两位数的生产力增长。
迄今为止,联想已将生成式 AI智能体优化为虚拟助手。Yao 设想,未来 AI智能体将作为人类的副手,被部署去独立完成任务。
AI智能体还有哪些其他的企业用例?
以下是三个假设性的用例,让我们得以一窥未来 AI智能体可能实现的功能:
- •贷款审批。一个包含多个专业代理的 AI智能体系统可以处理各种信用风险场景。过去,这通常是一个耗时且高度协作的过程,涉及汇编、分析和审查与借款人、贷款类型和其他变量相关的各种信息。
- •代码文档化和现代化。大型企业的遗留软件应用程序和系统通常存在安全风险,并可能拖慢业务创新的步伐。AI智能体可以帮助简化这些系统的现代化过程。例如,公司可以部署一个专门的代理作为遗留软件专家来分析旧代码,而另一个——质量保证代理——则可以评审文档并迭代地完善AI的输出,以确保准确性并遵守组织标准。
- •在线营销活动。设计、启动和运行在线营销活动可能是一个复杂、多层次的过程,涉及许多不同的人。单个 AI智能体系统可以根据公司营销专业人员的输入来开发、测试和迭代营销活动创意。然后,数字营销代理可以收集洞察以制定策略和文案,而设计代理可以构建定制化的内容。
组织在采用 AI智能体方面面临哪些障碍?
麦肯锡合伙人 Nicolai von Bismarck 表示,建立信任是采用 AI智能体技术的一大障碍:“我们发现,所有年龄段的客户——甚至是 Z 世代——在寻求客户帮助和支持时仍然更喜欢实时的电话交谈。” 他接着说,一家银行通过创建一个架构来解决这个问题,该架构在将答案分享给客户之前检查 AI智能体的错误或“幻觉”,从而减少了不正确响应的数量并建立了信任。
麦肯锡合伙人 Roger Roberts 说:“那些从AI中获得最大价值的公司,将是那些与其客户、员工和利益相关者建立信任的公司。人们必须足够信任 AI,才能将任务交给它。公司的道德决策必须植根于每个组织独特的价值观以及将人类置于AI生态系统中心的社会价值观。”
根据麦肯锡高级合伙人 Amar 的说法,另一个挑战将是组织在扩展 AI智能体过程中的变革管理。“这远比仅仅推出一套新工具要广泛得多,”他说。“公司需要重新连接各职能部门的工作方式,以便从生成式 AI智能体中获得全部价值。”这种重新连接包括采用新技术,以及对现有技术进行调整,使其能更好地与基于机器学习和生成式AI的工具协同工作。组织还应调整其运营模式,以支持迭代开发新服务的小型团队。更重要的是,领导者应创建激励机制,帮助员工学习如何使用——并信任——这些新工具。
最后,“数据保护是领导者在部署 AI智能体时面临的一个主要担忧,”麦肯锡合伙人 Bawcom 说。正在推行 AI智能体计划的公司应谨慎实施适当的安全、运营和数据控制措施。有许多不断发展的现成和定制方法及解决方案。
AI智能体可能如何改变组织的科技架构?
AI智能体的普及可能会改变组织运行其技术项目的方式。麦肯锡预计,IT 架构将从传统的以应用为中心的模式转向新的多代理模型。在这种类型的架构中,技术领导者监管着多达数千个相互通信、并与人类和外部程序通信以实现共同目标的代理。
以下是技术领导者可以在其当前环境中部署代理的三种方式(图表 2):
- •超级平台 (Super platforms)。这些是下一代的第三方业务应用程序,例如协作工具或客户关系管理 (CRM) 程序,它们内置了生成式 AI智能体。例如,用户可以部署一个 CRM 超级平台来运行销售报告,同时自动与公司的分析工具进行通信。过去,这需要针对特定用例进行编程。 117
- •AI 包装器 (AI wrappers)。这些工具允许企业服务通过 API 与第三方服务进行通信和协作,而无需暴露公司的专有数据。例如,一家银行可以围绕内部开发的、AI 驱动的信用风险模型构建一个支持生成式AI的包装器。然后,这个AI包装器可以启动操作,例如要求供应商的 LLM 根据客户数据和信用评分生成风险因素,而无需向供应商甚至 LLM 透露这些数据。
- •自定义 AI智能体 (CustomAIagents)。员工可以通过微调预训练的 LLM 或使用检索增强生成 (RAG) 访问公司的专有数据来开发自定义的生成式AI代理。例如,在客户服务场景中,员工可以用客户数据、呼叫中心记录和公司政策来“喂养”现有模型,以创建一个生成式 AI智能体,协助呼叫中心员工回应客户问题。组织将需要调整其 IT 架构,以更好地服务于这些新的以代理为中心的工作流,并允许持续迭代和改进。
架构可能随着三种AI赋能模式演变。当前赋能模式:SaaS、打包应用、平台化应用、内部定制开发。
AI 赋能模式:
- 1.第三方超级平台:通过第三方平台实现AI赋能。最适合快速部署行业标准能力(如 CRM、ERP)。
- 2.AI 包装器+第三方:企业创建自己的AI包装器,使第三方能够通过API访问与企业平台交互。适用于在保持灵活性和保护专有数据的同时,获取最新的创新。
- 3.自定义 AI智能体:通过塑造先前训练的大型语言模型构建全栈 AI智能体。适用于保护专有数据和创造差异化的知识产权。

组织可以采取哪些步骤来实施 AI智能体?
领导者可以关注三个重要领域:
1.仔细审查任何时间长、需要大量人力的技术提案。 这意味着要审查所有大型提案,以确定生成式AI如何能够降低成本并缩短时间表。 领导者应对那些声称整合了生成式AI能力的提案保持特别警惕,因为这些能力在价值潜力方面可能是有限的或辅助性的。
2.关注最大的问题。小规模的举措通常只会带来小规模的成果。 1因此,公司最好识别出最大、最复杂的技术问题——那些成本高昂、时间跨度长达数年,并造成严重技术债务的问题——并将生成式AI的使用重点放在解决这些问题上。
3.预先考虑人才、技术和运营模式的影响。随着多代理方法的扩展,领导者需要理解并规划其业务影响。 包括重新思考他们的人才战略和再培训计划,相应地调整他们的运营模式,并重新评估他们的运营和资本支出。
AI智能体的演进才刚刚开始,还有许多学习和发现有待进行。 AI智能体领域的许多工作正在从实验室走向全面应用。 AI智能体提供了新的能力,有助于重新构想各种行业和规模的组织中人们的工作方式。