微信扫码
添加专属顾问
我要投稿
探索智能体到用户交互协议(AG-UI)的创新解决方案。 核心内容: 1. AG-UI协议的必要性和背景介绍 2. AG-UI协议解决的智能体工具包集成问题 3. AG-UI协议技术细节与SDK支持
1智能体到用户交互(AG-UI)协议
1. MCP 标准化了Agent 到Tool 之间通信。
2. A2A(Agent2Agent )协议标准化了Agent 到Agent 通信。
但仍然缺少一块......
这就是智能体到用户通信的协议:
让我们了解为什么这很重要。
今天,我们可以使用LangGraph、CrewAI、Mastra 、dify、AutoGen、Hiagent(字节)等智能体工具工具包构建强大的多步骤智能体工作流。
但是,当您尝试将该Agent 引入实际应用程序时,事情就崩溃了:
1.您希望逐个Token流式传输LLM 响应,而无需构建自定义WebSocket 服务器。
2.您希望在工具执行进度发生时显示它,暂停以获得人工反馈,而不会阻塞或丢失上下文。
3.您希望同步大型、不断变化的对象(如代码或表格),而无需将所有内容重新发送到UI。
4.您希望让用户在智能体运行中中断、取消或回复,而不会丢失上下文。
这是另一个问题:
每个智能体后端都有自己的工具调用、ReAct 样式规划、状态差异和输出格式机制。
所以如果你使用LangGraph,前端将实现自定义的WebSocket 逻辑、杂乱的JSON 格式和特定于LangGraph 的UI 适配器。
但要迁移到CrewAI/Dify等,一切都必须进行调整。
这不会缩放。
AG-UI(智能体-用户交互协议)是CopilotKit 推出的开源协议,可解决此问题。
它标准化了后端智能体和前端UI 之间的交互层(下面的绿色层)。
可以这样想:
1.就像REST 是客户端到服务器请求的标准一样......
2.AG-UI 是将实时智能体更新流式传输回UI 的标准。
从技术上讲......
它使用服务器发送事件(SSE)将结构化JSON 事件流式传输到前端。
每个事件都有一个显式的有效负载(如Python 字典中的keys),例如:
1.TEXT_MESSAGE_CONTENT用于令牌流式处理。
2.TOOL_CALL_START以显示工具执行情况。
3.STATE_DELTA更新共享状态(代码、数据等)
4.AGENT_HANDOFF在智能体之间顺利传递控制权
并且它带有TypeScript 和Python 的SDK,使这种即插即用适用于任何堆栈,如下所示: |
在上图中,来自Agent 的响应并不特定于任何工具包。这是一个标准化的AG-UI 响应。
这意味着您需要编写一次后端逻辑并将其挂接到AG-UI 中,一切正常:
1.LangGraph、CrewAI、Mastra — 都可以发出AG-UI 事件。
2.可以使用CopilotKit 组件或您自己的React 堆栈构建UI。
3.您可以在本地将GPT-4 交换为Llama-3/DeepSeek V3,而无需更改前端中的任何内容。
这是让您的Agent 应用程序感觉像真实软件的层,而不仅仅是美化的聊天机器人。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-27
Dify工具插件开发和智能体开发全流程实战
2025-05-27
一个让工作效率翻倍的AI神器,Cherry Studio你值得拥有!
2025-05-27
Docext:无需 OCR,本地部署的文档提取神器,企业数据处理新选择
2025-05-26
太猛了,字节把GPT-4o级图像模型开源了!
2025-05-26
Qwen3硬核解析:从36万亿Token到“思考预算”
2025-05-26
蚂蚁集团开源antv的MCP服务:AI智能体与数据可视化的桥梁如何搭建?
2025-05-26
MinerU:高精度纸媒文档解析与数据提取一站式解决方案
2025-05-26
顶级开发者默默换掉了基础大模型
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-12-26
2024-08-13
2025-05-26
2025-05-25
2025-05-23
2025-05-17
2025-05-17
2025-05-17
2025-05-16
2025-05-14