Skip to content

智能体系统设计

本文介绍了智能体V2相关的体系结构,工作流程以及组件

1. 体系结构

system_structure

2. 工作流

模式一 直接调用

  • 通过智能体管理服务直接获取单个智能体,进行业务调用,单个智能体提供一套RESTFUL或GRPC服务。
  • 单个智能体根据业务属性选择(当前采用硬编码方式)公共服务,完成业务。

模式二 智能助手

  • 在选择单个智能体基础上,只能助手通过查询nacos服务注册表,获取响应智能体使用说明和接口调用说明以及规则
  • 根据用户的意图,结合规则共同判断使用哪种插件。
  • 完成插件调用,将结果返回给用户。

3. 组件

AI智能体

Plugins 服务/插件/工具

  • Plugins 对于系统具备服务属性服务,可由k8s集群统一管理、可灵活进行注册管理在线管理,当前使用开源nacos进行管理。
  • Plugins 对于AI智能助手认为是工具,根据用户问题进行灵活调用。同时也可以根据实际需求单独调用。
  • Plugins 在插件是基本的一个RESTFUL或GRPC服务基础上,为进行AI调用进行扩展。包含的插件基本信息,API信息,规则增强,调用用例,以及可以根据实际情况扩展。 基本的插件介绍包含对模型和用户的介绍。 API信息符合标准openapi文档,可直接调用现成工具生成,在此基础上增加响应的调用说明。 规则增强主要通过一些规则匹配快速调用插件,节省性能和资源,增强使用的稳定性。 调用用例主要为模型提供用例参考,提供few-shot提示词。

  • 对于传统的服务,包含小模型调用、业务系统查询、数据库访问大部分可以改造成插件

Agent Server: 接受用户请求并执行相关操作,将中间对应步骤和最终结果返回用户,其中包含以下子组件:

公共服务

  • AI推理服务 为AI提供各种大模型或小模型推理服务。
  • 意图识别 辅助智能助手和个智能体完成文本对话的意图判断。
  • 规则匹配 可与意图识别合为一个模块,主要通过传统技术进行意图补充、修复、改写。
  • 数据库连接服务 提供统一的数据库管理,与数据访问服务
  • 对话缓存与RAG 提供一套检索服务,增强模型效果、私有化知识、减少模型重复调用等功能。
  • 历史对话管理 为模型提供长期和短期记录,为用户提供历史记录查询、历史继续文档服务。
  • 第三方服务 如现有AI平台、BI系统,大模型将用户问答转化为第三方业务知识,完成业务。