1.实时性无法更新,知识容易自相矛盾
2.大模型的缺点有哪些?
3.一个人的能力可以分为两种:
1)大模型:推理能力,聪明,知识;很聪明但是缺少知识
2)知识库:辅助记忆,人类历史积累下来的东西,论知识,可能牛顿都不如你;
推理能力+记忆力=人工智能
4、最常见的embedding模型,bert;向量的相似度代替文本的相似度;
5、检索技术+提示词工程+大模型,RAG的方法论
6、对象数据库怎么设计和实现
7、技术实现细节
文档种类多:doc,ppt,excel,pdf
切分方式:段落、句子、token、知识点;切分原因:大模型输入长度有限制;理想的切分方式,按照知识点来切分,但是不容易操作;按段落分,容易出现一个知识点横跨多段的时候,容易分割成2段或者多段,使用交叉重叠来减缓这个问题,但是不能解决;
8、内部知识的特殊性,这个是比较麻烦的事情,专业术语不容易理解,需要辅助一些外部资料解决;
9、如果大量数来自网络,大部分工作是花在数据清洗上面;
10、检索:用户的问题,找到对应的知识,就是检索的作用;常见的检索技术,会经常被用到,搜、广、推;
相似度检索:欧氏距离、曼哈顿距离、余弦相似度
关键词检索:ti-idf
SQL检索:传统的检索算法
11、向量检索:query和知识可以通过相似度向量比较检索,搜索一些top的结果,可以加一下文本规则的限制,提升精准度,得到召回来的知识;对找回来的知识进行排序,把用户的问题,召回来的知识,给他下个模型,输出0和1,0表示不相关,1表示相关强烈,然后对输出的结果进行排序,输出检索的结果;
13、树检索,把知识整理成树的结构;知识图谱,召回一个知识,也把另外一个知识给召回,知识构建、维护成本很高,好用但是慎用;
14、对用户的问题,进行优化,比如用大模型来扩展问题HyDE,利用大模型来做假答案,取向量平均值;
15、RAG Fusion:主要是在检索的环节做了拓展;用大模型生成类似的话术问题;防止用户的输入过于口语化,导致找回不了;每个quey和原生query,一起召回,排序,rerank,得到最终的结果;
16.问题-知识对,放到向量库->创建索引
17.用户输入问题后,对问题进行一次拓展,使用大模型来拓展,得到3个相似的问题;问了描述的更好,还可以加一下用户的一些特征信息,例如性别等等,辅助检索;
18.召回5个(bert1模型:召回模型的bert),精排3个(排序模型的bert,分类,运算量更大)
下载别人开源的bert,不太适合直接用,因为场景太垂直了,开源的未必匹配的会那么好
19.召回的知识,然后给出问题,告诉大模型,根据上述的治疗方案,给出下面病情的治疗方案;
20.RAG的核心就是相似度计算,相似度计算有很多种方法;
21.SFT和微调并不矛盾,可以融合、组合起来使用;
22.不要以完美主义要求大模型,要不然什么都做不了;
------------------ppt---------------------