刘知远：大模型到专业Agent的跃迁必须解决的三大核心挑战

在日前举行的2025外滩大会“智能体时代进化论”分论坛上，清华大学长聘副教授、面壁智能首席科学家刘知远系统剖析了AI从大模型向Agent跃迁的必然趋势，并深入探讨了“专业智能体”与“多智能体系统”所面临的核心技术挑战与未来愿景。

刘知远认为，AI发展的下一阶段，必然是让模型走出虚拟世界进入到真实的环境中实现交互，即实现从大模型向智能体的跃迁。而这一过程跃迁的核心在于，AI不再仅仅是一个具备知识的“大脑”，而要成为一个能通过使用工具、自主学习来探索世界的行动者。

刘知远的分享极具启发性，以下是澎湃科技整理后的演讲实录：

人工智能的能力图谱包括四方面的能力

刘知远演讲的PPT

今天主题是智能体，这个智能体应该说在社会上获得广泛的关注，应该是从去年开始。我想从人工智能发展角度，这个智能体它都有什么样的核心问题，关键技术是什么，以及接下来它的发展过程中，我们需要解决的挑战以及一旦这个挑战如果被解决了，然后它可能产生一个怎样的巨大应用，我想通过这样一个引导发言，然后来给各位进行一个分享。

人工智能有一个我们可以定义出来的能力图谱，我们认为它大致包括这四个方面的能力。

之一，它要有基座大模型，像大脑一样来高效思考这个世界。我们也需要有一个非常好的敏锐感官，也就是多模态智能，能够敏锐感知这个世界。第二，从2018年随着大模型的发展，应该说已经形成包括文本基座模型和多模态模型一个非常前瞻式的应用。我们认为人工智能的能力图谱除了这两个部分，接下来还有两个非常重要的组成部分。第三，探索能力，它能够像一个专业的智能体一样，专业探索这个世界、改造这个世界。第四，这些专业的智能体如何能够互相进行协作，形成群体智能，这是我们人工智能第四个非常重要的板块。

从图谱的组成，其实我们就可以非常清晰地看到，人工智能发展非常显著的脉络。2018年一直到2025年，当然随着接下来的这几年，我们肯定还会去见证模型随着预训练的技术，从一个非常小的，只有几千万的参数模型，现在增长到上万亿的规模，其实是一个类似于我们脑容量越来越大的一个过程，它具有更强对这个世界认知方面的能力。

但是我们会认为再进一步，其实我们就不只是把这个模型本身能力进行一个具备。我们其实还需要进一步让这个模型进入到真实的环节、真实的世界，然后来进行交互，这个过程其实就是一个智能体的过程。也就是通过工具的使用、自主学习，能让这个智能体变成在相关专业领域自主探索的专业智能体。它们再进一步能够形成群体智能，我们认为人工智能应该会在最近这几年里面实现从大模型向智能体跃迁的这么一个过程。

这个过程的外在体现就能够让我们看到，从2022年开始，国内外陆续有非常多和智能体相关的探索工作。相当于在这个浪潮里面，应该说我们国内非常多学者和科技工作者所从事的工作站在世界的前沿。这些其实都是表象，我们要深入到人工智能未来发展的趋势，然后来去看待智能体核心挑战是什么。这个角度来讲，我们认为人类社会的发展，我们人类社会本身是人类智能一个非常高度发达的阶段，我们可以想象，人工智能未来发展的这一态势，应该说人类社会的发展会对它有一个非常重要的启示。

AI发展两大方向：个体专业化和协作专业化

过去的这几百年，人类的社会发展有什么重要的特点？在社会学领域有两个非常重要的观点，我们会认为这体现了人类社会从生产力、效能等方面的特点。之一，社会学的奠基人涂尔干曾经提出，“个体的专业化是群体效能提升的基础”。也就是说，在过去的这几百年的时间里面，我们会见证我们人类社会的每一个人都在呈现一个专业化的程度和规模，然后变得非常的壮大的过程，这个会成为我们人工智能要进行发展的非常重要方向，也就是要去构建相关各行各业、各个领域的专业智能体。

另外一个非常重要的特点，马克思在社会学方面提出的一个观点，协作社会化是生产力发展的必然结果，科技革命为这种扩张提供了技术可能。我们会看到过去的这几百年的时间，随着技术的发展，随着互联网的出现，信息社会的出现，我们整个人类社会协作的社会化广度和效率都大为地提升，而从这个角度来讲，我们也可以预期未来人工智能的发展也一定会构建一套更加高效、广泛的多智能体系统，这将构成接下来两个非常重要的组成部分。

专业智能体的三大核心挑战

首先我们来看一下专业智能体这个角度核心技术与主要挑战是什么？我们认为专业智能体将是下一代人工智能非常重要的发展方向。也就是说，要让这个模型进入到一个多样多变复杂的真实世界中进行交互，来完成相关的复杂任务。从这个角度来讲，我们就可以设想，当大模型放到一个真实的环节，它所面临的挑战是什么，挑战就是环境的多样性、环境的多变性，以及任务的复杂性。

针对这些挑战，我们认为我们所需要解决的，其实就是智能体的三个性的问题。

之一个是智能体的泛化性（Generalization）。在真实的世界里面，智能体其实需要能够面对多样化的环境，它就需要具备在那些训练过程中能够接触过的环境中，这个模型能不能做出合理的决策，完成这些复杂的任务。我们可以设想，当我们把大模型放到不同的领域，它有可能是编程领域、数据库领域、系统环境领域，也有可能是物理环境领域，或者是其他各种各样专业。我们预期这个大模型、智能体就能够成为软件开发、数据分析、系统触控、机械控制的各个方面专业智能体，而这件事情体现的就是智能体背后的大模型泛化能力。

泛化性方面，最近国际上这两年的时间，其实是能够看到非常日新月异的发展。刚才我们的主持人，其实提到了其中一个非常重要的关键词，就是要让这个智能体能够使用各种各样专业工具，我们就可以设想各种各样不同领域其实都有相应专业工具的，所以这个是一个非常重要的方面。但是我们也会认为，相关的专业领域也会有它各自的一些知识，也会有它自己的一些所谓SOP（标准化工作流程）。所有的这些专业领域，如何让这个智能体能够掌握使用会成为这个智能体泛化的一个非常重要体现。

在这方面有一个非常重要的特点，要让智能体能够从一个动态环境中具备学习能力，所以我们现在会看到有非常多的科技工作者在提世界模型，其实就是要构建多样化的环境，来为这个智能体提供一个学习泛化能力的过程，这件事情其实是智能体泛化性的一个非常重要体现。

第二个挑战，智能体的自主性（Autonomy）。我们认为智能体要进入到一个动态的环境里面，它就要像人一样在使用中适应环境，主动探索，不断学习。它其实会需要能够实现一个感知自主、决策自主和学习自主，我们认为这是非常重要的一个发展范式。

在过去的一年时间里面，包括DeepSeek的R1和OpenAI的o1，虽然表面上看是深度思考的能力，它更重要的技术，其实是背后的大规模强化学习，这其实体现了大模型或者人工智能学习。从过去大模型里面的模仿学习范式要推广到或者说跃迁到探索式的学习，甚至再进一步它能够进入到完全开放的环境进行自主的探索和学习，我们认为将会在未来2-3年内实现这样一种自主性构建。

如何让大模型或者智能体具备自主探索和自主演化的能力，其实是一个非常值得探索的话题。国内外有非常多的学者在探索这个方面的工作，最近的半年时间有一个非常突飞猛进的发展，如果大家去搜Reverse Learning（反向学习）会有一个非常清晰的感受。

第三个非常核心的挑战，其实是智能体的长程性(Long-Horizon-Capability）。它能不能去解一个越来越复杂的任务，而这个任务的复杂性体现的是完成步骤足够长，甚至可能是一个持续更长，甚至终生的相关任务。刚才主持人也有提到，我们如何保持在环路里（in the loop）。这个环路（loop）是什么？其实就是一个越来越长的解决问题的链条。在这个方面，过去的这两年时间有非常多的探索，其实就是要让这个模型具备更长的上下文感知和经验复用的能力。

而在这个方面核心的技术或者动态，之一在模型内部要能够设计高效架构，让这个模型具备处理更长上下文的能力；第二要在智能体层面设计能更好管理历史信息的记忆架构，突破当前上下文的“窗口”局限，这个突破将会让这个模型能够在更多复杂场景里面具备更强的记忆能力和经验复用的能力。

如何把上下文冗余消除掉？如何能够让计算成本极具下降？如何能让推理效率极具提升？如何实现对历史重要信息的主动记忆，其实是非常重要的核心技术，这是构成第三方面的关键技术。

我们总体来看，专业智能体它还有一个共同的技术基石，就是我们所谓的自主强化学习。刚才提到过去一年的时间，我们其实看到大模型学习范式从模仿学习到探索学习的跃迁，而我们会认为智能体三大核心能力，包括泛化性、自主性和长程性，其实都是高度依赖自主强化学习的提升。从人工智能科技发展来讲，它的一个核心问题。

以上是专业智能体方面，我们认为核心技术与挑战。

多智能体系统：迈向群体智能的“第二次涌现”

接下来就是多智能体系统，当我们在各行各业构建足够专业的智能体之后，我们接下来就需要让这些智能体互相之间能够进行通信和协作。如何实现智能体的自主协作和动态演化，从而形成全球范围内的智能体互联网，其实是实现人机协同群体智能第二次涌现的非常重要基础。这个方面其实有大量的成果，我相信一会儿会有非常多的科技工作者来给大家进行分享，我就不做详细的介绍。

智能体系统面临的非常关键挑战在于，当我们把多个智能体让它有不同的专业背景，让它们合作起来，显然是可以去完成它们每个单个智能体所没有办法完成的更加复杂的任务，但是当你让多个智能体合作的过程，本身会引入非常大的额外计算，所以我们会看到一个非常重要的挑战，这个挑战就是多智能体系统能力提升与资源消耗之间其实是产生非常大的矛盾。我们需要做的事情，就是如何有效发挥群体智能的同时，能够降低群体协作的资源开销，提升协作的效率。也就是我们刚才所提到的，协作的社会化效率问题。

在这个方面非常核心需要解决的三大问题，之一个方面，高效的交互。在国际上来讲，非常重要的动态，我们看到会看到包括Anthropic、Google在内的非常多团队，其实都在尝试着提出面向多智能体的标准化通信协议，不管是A2A（智能体对智能体），还是我们团队提出来的internet of agents（智能体互联网），其实都在尝试着构建一个更加高效的交互协议。这个显然会像历史的互联网协议标准化过程一样，也是争夺话语权非常重要的方面。而在这个方面，一个非常重要值得做的工作，如何研发一个标准化、最小化交流协议和互操作验证平台，能够降低通信开销，提升智能体高效协同。

第二个方面，从国际上来看，各大公司其实都在构建多模态研究团队，并且推出自己的多智能体协作系统框架。这个事情其实就是要用于探索智能体组织化、自动化编排和动态协作，这也是我们国内在这个方面比较有前景的一个地方。这个方面非常核心的一个问题，其实就是如何能够让多智能体进行分布式自主编排，能够让它路由的过程更加的高效，这件事情由于时间关系，我就不再特别多的介绍，应该说国内外已经有非常多的案例。

第三个方面，非常前沿的问题，其实也是对应前面所谓的自主强化学习。我们可以想象，面向专业智能体，我们当然需要它能够具备自主的学习能力。面向一个团队，我们也可以设想，任何一个优秀的团队都是善于向历史去进行学习的。所以我们可以想象，一个多智能体的群体团队，它也应该具备从历史工作经验中总结经验、总结教训，这件事情其实就涉及多智能体的群体演化与学习的能力。目前来讲，这个方面多集中在学术界进行前沿探索，其实我们也能够看到，最近这两年非常重要的特点，学术界与产业界边界没有那么清晰，我们在非常快速地把最前沿技术突破应用到前沿相关应用中去，这是我们特别值得关注的一个非常重要方面。如何实现智能体集群经验共享与知识迁移，会是这个里面非常关键的问题。

下一代群体智能的目标：实现专业Agent的规模化和专业化

我适当d地总结一下，我们会认为下一代群体智能非常重要的目标，是要能够实现这种专业智能体的规模化和专业化，实现群体智能的合作协作社会化的广度和效率，从而能够实现面向人工智能的第二次涌现。

因为我们看到的是过去这5年的时间，大模型越来越大、能力越来越强，它更像是个体智能的涌现，我们接下来想要迎来的就是由众多专业智能体合作的群体智能涌现。面向未来一个非常重要值得探索的底层问题，就是群体智能的涌现激励到底是什么，我们如何能够做到任何一个群体智能团队新加一个智能体，都能让它合作效能比之前更高，我们能够做到寻找到给定一个智能体的团队，我们能够找到一个更优让它通信合作机制，这些都是我们未来值得探索的方面。

展望未来，我们整个人类社会都是由一个又一个人类专家所构成的，我们未来一定会实现通过构建岗位孪生的专业智能体和组织孪生的智能体群，从而形成群体智能的涌现，这就是我们对迈向下一代通用人工智能阶段的关键问题，以及相应的愿景。

最新进展战略协议、意向订单不断具身智能产业化走向实处

最近更新战略协议、意向订单不断具身智能产业化走向实处

百度科普战略协议、意向订单不断具身智能产业化走向实处

讨论：战略协议、意向订单不断具身智能产业化走向实处

学习，战略协议、意向订单不断具身智能产业化走向实处

更新学习，战略协议、意向订单不断具身智能产业化走向实处

更新，战略协议、意向订单不断具身智能产业化走向实处

评论，战略协议、意向订单不断具身智能产业化走向实处

头条，战略协议、意向订单不断具身智能产业化走向实处

汇总，战略协议、意向订单不断具身智能产业化走向实处