支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


一张图讲清楚:AI Agent工程演进趋势

发布日期:2025-05-09 12:42:50 浏览次数: 1672 作者:老张的求知思考世界
推荐语

探索AI Agent技术架构与演进趋势的深度解析。

核心内容:
1. AI Agent的核心能力与技术结构
2. 智能体功能特征与Agent工程迭代演进趋势
3. 基于Manus架构的AI Agent构建与迭代模型

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

在前面的文章中,为大家介绍过Agent的发展史" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">AI Agent的发展史,以及AI Agent的典型代表:Manus的技术架构" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">Manus的技术架构。今天这篇文章,我尝试用通俗易懂的语言,为大家拆解构建AI Agent的技术工程结构以及演进趋势。


1、AI Agent是具备感知环境、做出决策并执行任务能力的AI工具,通过感知、决策和行动实现目标

AI Agent的核心特点包括:

  • 感知能力:获取外部环境信息,如视觉、听觉。
  • 决策能力:基于信息推理规划,选择行动策略。
  • 行动能力:执行具体任务或操作,影响环境。
  • 学习能力:通过与环境的交互不断改进策略。

简单理解:Agent=大模型 + 插件 + 执行流程,分别对应控制端、感知端和执行端。


2、智能体的古老代表Langchain提出了关于智能体的主要功能特征,主要有五点:

  • 智能体Agent:一个包含AI步骤、能自动完成多步任务的智能程序。
  • 步骤/链条Chain:一个有输入有输出,会进行任务处理的步骤链路。
  • 路由Router:路由规则,决定接下来该执行哪个步骤(基于数值或某些条件)。
  • 工具Tool:基本的工具调用箱,比如日期、搜索、计算等基础功能。
  • Run概念:context上下文、status状态等可反映Agent运行过程、状态、结果的环境(容器)。


3、基于上述关于Agent的基本概念,我们可以推导出这样一个逻辑:

  • Agent是执行具体任务的智能程序。
  • 复杂任务需要多个Agent经过WorkFlow才能完成。
  • 多个任务组合就是产品需求,多个需求叠加就形成了一个AI APP。
  • 完成一个符合用户需求的AI APP,需要团队形成工作流程(SOP),并将其拆解为多个单一任务和多个任务执行流程。

对上述逻辑进行逆向反推,则可以得到这样一个AI Agent的工程迭代演进趋势:

  • 梳理流程:将SOP拆解为多个“单一”任务和多个“任务执行流程”。
  • 任务工具化:将每个任务都自动化,形成一系列小工具,基于高内聚低耦合理念,整合工具能力。
  • 建立任务规划:任务管理调度中心,无论串联还是并联,基于Agent框架自定义或让AI bot规划“任务执行流程”。
  • 不断迭代优化:不断完善和优化“执行任务”的工具,以及“任务执行流程”规划,开发应对具体实际场景的Agents。

最后,我们会得到一个这样的AI Agent工程模型:


4、对照Manus的技术实现架构,我们就可以在高度抽象后更通俗易懂地理解AI Agent的构建和迭代演进趋势。







如果喜欢我文章,点赞、关注、在看三连走起。

如果想阅读更多的文章,可以关注我的公众号。


精彩内容推荐

我对AI的几点思考

聊聊突然爆火的Manus

了解AI知识的新手学习路径
我对于AI领域商业模式的思考
一口气讲清楚:AI Agent发展史
一张图讲清楚:Manus的技术架构
MCP、EMB" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">一口气讲清楚:LLM、MCP、EMB
一口气讲清楚:AGI、RAG、AIGC
一张图讲清楚AI大模型技术实现逻辑
一口气讲清楚:向量库、训练集、多模态

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询