智能体系统设计
本文介绍了智能体V2相关的体系结构,工作流程以及组件
1. 体系结构
2. 工作流
模式一 直接调用
- 通过智能体管理服务直接获取单个智能体,进行业务调用,单个智能体提供一套RESTFUL或GRPC服务。
- 单个智能体根据业务属性选择(当前采用硬编码方式)公共服务,完成业务。
模式二 智能助手
- 在选择单个智能体基础上,只能助手通过查询nacos服务注册表,获取响应智能体使用说明和接口调用说明以及规则
- 根据用户的意图,结合规则共同判断使用哪种插件。
- 完成插件调用,将结果返回给用户。
3. 组件
AI智能体
Plugins 服务/插件/工具
- Plugins 对于系统具备服务属性服务,可由k8s集群统一管理、可灵活进行注册管理在线管理,当前使用开源nacos进行管理。
- Plugins 对于AI智能助手认为是工具,根据用户问题进行灵活调用。同时也可以根据实际需求单独调用。
-
Plugins 在插件是基本的一个RESTFUL或GRPC服务基础上,为进行AI调用进行扩展。包含的插件基本信息,API信息,规则增强,调用用例,以及可以根据实际情况扩展。 基本的插件介绍包含对模型和用户的介绍。 API信息符合标准openapi文档,可直接调用现成工具生成,在此基础上增加响应的调用说明。 规则增强主要通过一些规则匹配快速调用插件,节省性能和资源,增强使用的稳定性。 调用用例主要为模型提供用例参考,提供few-shot提示词。
-
对于传统的服务,包含小模型调用、业务系统查询、数据库访问大部分可以改造成插件
Agent Server: 接受用户请求并执行相关操作,将中间对应步骤和最终结果返回用户,其中包含以下子组件:
公共服务
- AI推理服务 为AI提供各种大模型或小模型推理服务。
- 意图识别 辅助智能助手和个智能体完成文本对话的意图判断。
- 规则匹配 可与意图识别合为一个模块,主要通过传统技术进行意图补充、修复、改写。
- 数据库连接服务 提供统一的数据库管理,与数据访问服务
- 对话缓存与RAG 提供一套检索服务,增强模型效果、私有化知识、减少模型重复调用等功能。
- 历史对话管理 为模型提供长期和短期记录,为用户提供历史记录查询、历史继续文档服务。
- 第三方服务 如现有AI平台、BI系统,大模型将用户问答转化为第三方业务知识,完成业务。