(注:本文为小报童精选文章,已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费)
有了这些改进,你可以快速判断 GPT 助手给出的答案是真实还是「幻觉」了。
问题
在《如何用自然语言 5 分钟构建个人知识库应用?我的 GPTs builder 尝试》这篇文章里,我给你分享了如何不用写代码,只靠着对话和上传资料,就新建一个 Article Assistant 。它能从上传的知识库里提取内容,来回答用户问题。
只不过,当时的操作有一些问题,咱们没有展开说。
其中最重要的,就是知识库文件的生成。在之前那篇文章里,我使用的是简单粗暴的叠加方式——把原先一系列的 markdown 文件,直接合并成了一个新的 markdown 文件,然后上传了这个文件。
这样的方式确实很简单,但是也会有问题。就是当你想查询答案出处的时候,就比较麻烦了。你只要试过就会知道,机器人没有办法准确回答内容出处。即便给出了索引链接,也都无法正常点击跳转。这就是因为你只上传了一个文件作为知识库,带来的问题。
你可能会问:
王老师,为什么不把所有的文件都批量直接上传呢?那不就有每一个回答对应的文件名称了吗?
因为大量文件上传,你会看到这样的场景。
原因无它,就是目前 GPTs 的限制,不让你上传过多的文件。
根据 Assistant API 在 Playground 里面的提示,最多上传文件不能超过 20 个。GPT builder 里面并没有这样的提示,我还真上传了超过 20 个。
可惜的是,这样连存储都不让。
所以咱们不能上传过多的文件。
你可能立刻想到了新点子:
王老师,咱们可以把一堆文件打包成 zip 上传啊,一个文件不就搞定了吗?
你说得有道理,我也尝试了。只不过这次你会看到这样的信息提示:
意思就是说,你这样上传文件,ChatGPT 就只能用 Code Interpreter 来处理它。想要使用 Retrieval (文件检索)功能?不行。