Skip to content

大模型工具链体系结构

多模态技术

多模态是人工智能应用技术落地的重要发展方向。它融合了语音、视频、文本及图像等主要AI感知模态,通过多种数据联合分析,打破单一模态局限性,可通过应用场景中的多维感知和全维智能分析,实现科学决策及场景化标准应用。

分层架构

architecture

大模型服务层

文本对话 图像理解 视频理解 知识库问答 数据库问答 文档撰写

大模型应用服务层

大模型应用服务层负责提供基于大模型的最终应用服务,例如自然语言处理、图像识别、语音识别等。它是直接与最终用户或客户端应用程序交互的层面。

大模型应用服务层提供高可用、高性能和可扩展的应用程序服务,满足用户需求。

服务内容

文本对话:

功能:利用大模型进行自然语言理解和生成,实现与用户的文本对话。可以理解和回应各种语境下的文本输入,进行有逻辑的对话。 用途:应用于聊天机器人、智能客服、个人助手等,为用户提供自然、流畅的对话体验。

图像理解:

功能:通过大模型分析图像的内容和上下文,进行图像分类、目标检测、场景识别等任务。 用途:用于图像搜索、智能相册、自动标注等应用,深入理解图像内容,提取关键信息和标签。

视频理解:

功能:通过对视频内容进行分析和理解,提取关键事件、场景、人物等信息,并进行视频分类、摘要生成等任务。 用途:应用于视频监控、视频推荐、视频摘要等场景,高效处理和理解大量视频数据。

知识库问答:

功能:基于大模型和知识库,理解和回答各种领域的知识性问题。通过自然语言处理技术,精准定位知识库中的信息,给出准确回答。 用途:用于智能问答系统、学术搜索、企业知识管理等,提供快速、准确的知识获取和分享。

数据库问答:

功能:结合大模型和数据库技术,理解和解析用户的查询意图,直接在数据库中执行相应的查询操作。 用途:应用于数据查询、数据分析等场景,让用户可以通过自然语言交互方式,高效获取数据库中的信息。

文档撰写:

功能:利用大模型进行文本生成和摘要,辅助用户进行文档撰写、编辑和摘要生成等工作。 用途:用于智能写作助手、文档自动生成、文献摘要等应用,提高文档撰写效率和质量。


大模型应用工具链层

大模型应用工具链包含一系列工具和库,它们是用来开发和部署基于大模型的应用的。这可能包括用于模型集成、模型评估、模型可视化、模型解释性的工具,以及用于部署和管理模型的库和框架。

大模型应用工具链层的提供一个完整的工具集,帮助开发人员和数据科学家在整个应用开发生命周期中管理和使用大模型。

工具类型

对话存储:

功能:用于存储和管理大量的对话数据。它可以记录对话的历史内容,支持对话数据的持久化和备份,以便后续的分析和利用。 用途:对话存储是构建聊天机器人、智能客服等应用的关键工具,提供了对话数据的存储和管理能力,支持对话系统的训练和优化。

提示词管理:

功能:提供对提示词的管理和维护工具。它可以帮助用户定义、编辑和更新提示词,以确保模型能够准确理解和回应不同的提示。 用途:提示词管理对于文本对话、问答等应用非常重要,它可以帮助优化模型的响应准确性和效率,提升用户体验。

模型 I/O:

功能:负责模型的输入和输出管理。它处理模型的输入数据的格式转换、预处理和后处理,确保模型能够正确接收和解析输入,并提供合适的输出形式。 用途:模型 I/O 是模型与应用之间的桥梁,它使得模型能够与应用无缝对接,简化模型的集成和使用流程。

检索:

功能:提供高效、准确的检索能力。它可以在大量的文本数据中快速定位相关信息,返回与查询相关的结果。 用途:检索工具在问答系统、文档搜索等场景中起到关键作用,它能够帮助用户快速找到所需的信息,提高工作和学习效率。

模型记忆:

功能:实现模型的记忆功能,让模型能够学习和记住之前的经验和知识。它可以存储和更新模型的参数,支持模型的持续学习和进化。 用途:模型记忆是增强模型性能和适应能力的重要工具,它使得模型能够在不断使用中优化自身,提供更准确、个性化的服务。

智能体:

功能:智能体是基于大模型的智能代理,它可以理解和执行各种任务,具备自主学习和决策能力。 用途:智能体是实现智能交互和应用的核心工具,它可以为用户提供个性化、智能化的服务,如智能推荐、智能助理等。

知识库管理:

功能:用于构建和管理知识库,包括知识的收集、整理、更新和维护。它支持知识的结构化存储和查询,以及知识的关联和推理。 用途:知识库管理是大模型应用的重要支撑工具,它提供了知识的组织和利用能力,为问答系统、智能决策等应用提供基础支撑。


模型服务层

模型服务层负责模型的部署和运维,包括模型的发布、版本控制、扩展、监控和日志记录等。此外,它还可能包括用于处理模型请求的API和网关。

该层的确保模型在生产环境中的稳定性和可靠性,并提供一种有效的方式来管理和运维模型。

服务内容

语音服务(敬请期待):

功能:提供语音相关的模型功能,包括语音识别(将语音转换为文本)和语音合成(将文本转换为语音)。 用途:用于语音助手、智能客服、语音交互应用等场景,实现语音输入和输出的处理。

会话服务:

功能:提供基于对话模型的会话功能,理解和生成自然语言文本,实现人机对话。 用途:用于智能客服、聊天机器人、问答系统等应用,提供自然、流畅的对话体验。

文本补全服务:

功能:根据用户输入的文本片段,提供自动补全和建议的功能。 用途:用于代码编辑器、搜索引擎、文本编辑器等场景,提高用户输入效率和准确性。

图像服务:

功能:提供图像相关的模型功能,如图像分类、目标检测、图像生成等。 用途:用于图像识别、自动驾驶、智能安防等领域,实现对图像内容的理解和分析。

通用文本向量服务:

功能:将文本转换为高维向量表示,用于文本相似度计算、聚类、分类等任务。 用途:用于推荐系统、文本检索、语义匹配等应用,实现文本的语义理解和处理。

模型管理服务:

功能:提供模型的存储、版本管理、部署、监控等一系列管理功能。 用途:用于模型的整个生命周期管理,确保模型的可用性、稳定性和可重复性,并简化模型的开发和运维流程。

模型训练服务(敬请期待):

功能:提供模型训练的相关功能,包括数据预处理、模型架构定义、训练算法选择、超参数调优等。 用途:用于开发和优化模型,提升模型的性能和准确度。提供灵活的训练配置和高效的训练算法,满足不同模型和任务的需求。

模型SDK

模型SDK是一个为开发者提供的软件包,它封装了与模型服务层交互的复杂细节。通过SDK,开发者可以轻松地调用模型服务层的功能,执行模型的推理、训练等任务。SDK通常提供一系列编程接口,以及必要的库和工具,帮助开发者快速集成模型服务到他们的应用中。

该服务提供一个简单、一致的编程接口,帮助开发者高效地使用模型服务。SDK还可以为开发者提供一些高级功能,如本地缓存、自动模型更新等,进一步提高开发效率和应用程序的性能。

当前提供Python版本SDK uraninsight

模型API

模型API是模型服务层提供的另一种服务方式,它允许开发者通过HTTP/HTTPS请求的方式,访问和使用模型服务层的功能。开发者可以在自己的应用中,通过发送API请求,获取模型的推理结果、管理模型等。

API提供了一种更加灵活、平台无关的访问方式。开发者不需要在本地安装或配置任何SDK,只需要通过网络请求就可以使用模型服务。

细节请参考:模型服务API


模型推理层

模型推理层负责处理来自应用程序或用户的推理请求。它包括将输入数据转换为模型可以理解的格式,调用模型进行推理,然后将推理结果转换回应用程序或用户可以理解的格式。此外,这一层也可能包括用于处理实时推理请求的流式处理功能。

模型推理层的目的是提供一个高效、可扩展且可靠的推理机制,使应用程序或用户能够轻松地使用模型进行预测或推理。

当前已适配各对话、图像、语言、多模型等多个模型


模型训练层 (敬请期待)

模型训练层负责模型的训练和优化。它提供训练和验证数据的处理、模型的训练算法、超参数调整等功能。该层还包括用于提高训练效率和效果的工具和技术。