1.概要
介绍如何使⽤Azure OpenAI Service
的嵌⼊技术,创建知识库;以及创建必要的资源组和资源,包括
Form Recognizer
资源和
Azure
翻译器资源。在创建问答机器⼈服务时,需要使⽤已部署模型的
Azure OpenAI
资源、已存在的表格识别资源和翻译资
源。通过
Azure
⾃定义资源模板创建服务,填写相应的参数即可。参数包括在您的
Azure OpenAI
资源上部署的指令引擎、在
Azure OpenAI
资源上部署的⽂档嵌⼊引擎、在
Azure OpenAI
资源上部署的查询嵌⼊引擎、您的
Azure OpenAI
资源名称、您的
Azure OpenAI API
密钥、
Redis Stack
的
URL
、
Azure Blob
存储连接字符串等。
嵌⼊是⼀种特殊的数据表⽰格式,可由机器学习模型和算法轻松使⽤。 嵌⼊是⼀段⽂本的语义含义的信息密集表⽰。 每个嵌⼊
是浮点数的⼀个向量,向量空间中两个嵌⼊之间的距离与原始格式的两个输⼊之间的语义相似性相关。 例如,如果两个⽂本相
似,则它们的向量表⽰形式也应该相似。
2. 实验步骤
本节主要描述了如何部署知识库问答服务的相关步骤。
2.1 创建必要的资源组和资源
本节主要是准备动作,创建好最终搭建服务所需要的资源。
2.1.1
创建资源组
Azure OpenAI
服务⽬前部署在
Azure
美东、美国中南部、⻄欧三个数据中⼼。因此,为了让相关资源配合运⾏时取得最低的时
延,建议将资源组以及内含的资源也创建在这三个数据中⼼之中。本例选择在美东数据中⼼创建全部资源和资源组。
以下是在
Azure
美东数据中⼼
(East US)
创建资源组的步骤:
登陆
Azure
管理界⾯
https://portal.azure.com
,选择左侧导航栏中的
“
资源组
”
选项
点击
“+
新建
”
按钮,在弹出的新建资源组窗⼝中输⼊相关信息,包括资源组名称、订阅、区域等,区域选择美国东部
单击
“
查看
+
创建
”
以预览并创建资源组
2.1.2
创建
Azure OpenAI
资源
Azure OpenAI
资源是该解决⽅案的核⼼,需要率先创建
Azure OpenAI
资源才能实现对
OpenAI
⼤模型的部署,在
Azure Portal
中创建
Azure OpenAI
资源的步骤如下:
在资源组内,单击
“+
添加
”
按钮,在弹出的菜单中选择
“Marketplace”
选项
在
“Marketplace”
⻚⾯中,搜索
“OpenAI”
并选择
“Azure OpenAI”
服务
点击
“
创建
”
按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区、定价层等,地区选择
East US
点击
“
查看
+
创建
”
以预览并创建
Azure OpenAI
资源
创建完成后,访问
https://oai.azure.com
⻚⾯
在⻚⾯上点击新建部署按钮,创建
text-davinci-003
部署和
text-embedding-ada-002
部署
两个部署创建完成后,即意味着
OpenAI
资源已经准备就绪。
2.1.3
创建
Form Recognizer
资源
Azure Form Recognizer
的作⽤是⽤于从⽂档中提取表格、键值对等结构化数据。在本实验中,我们将使⽤
Form Recognizer
识
别知识库中的⽂本数据。创建
Form Recognizer
资源的步骤如下:
在资源组内,单击
“+
添加
”
按钮,在弹出的菜单中选择
“Marketplace”
选项
在
“Marketplace”
⻚⾯中,搜索
“Form Recognizer”
并选择
“
表单识别器
”
服务
点击
“
创建
”
按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择
East US
点击
“
查看
+
创建
”
以预览并创建表单识别器资源
2.1.4
创建
Azure
翻译器资源
Azure
翻译器资源的作⽤是将⽂本翻译成不同的语⾔。在本实验中,我们将使⽤
Azure
翻译器将知识库中的⽂本翻译成多种语
⾔。创建
Azure
翻译器资源的步骤如下:
在资源组内,单击
“+
添加
”
按钮,在弹出的菜单中选择
“Marketplace”
选项
在
“Marketplace”
⻚⾯中,搜索
“Azure
翻译器
”
并选择该服务
单击
“
创建
”
按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择
East US
单击
“
查看
+
创建
”
以预览并创建
Azure
翻译器资源
2.2 创建知识库问答服务
此存储库使⽤
Azure OpenAI
服务从⽂档创建嵌⼊向量。 为了回答⽤户的问题,它检索最相关的⽂档,然后使⽤
GPT-3
提取问
题的匹配答案。
请注意,您需要:
拥有已部署模型的
Azure OpenAI
资源(例如
text-davinci-003
等指令模型和
text-embedding-ada-002
等嵌⼊模型)
拥有已存在的表格识别资源
拥有已存在的翻译资源
以下是通过
Azure
⾃定义资源模板创建服务的步骤:
在
Azure
管理界⾯中选择左侧导航栏中的
“
创建资源
”
选项
在弹出的
“
创建资源
”
窗⼝中输⼊
“
模板部署
“
,选择
“
模板部署
(
使⽤⾃定义模板部署
)”