大模型多轮问答的两种方式

前言

大模型的多轮问答难点就是在于如何精确识别用户最新的提问的真实意图,而在常见的使用大模型进行多轮对话方式中,我接触到的只有两种方式

  • 一种是简单地直接使用 userassistant 两个角色将一问一答的会话内容喂给大模型,让它能够结合最新的问题靠自己去理解用户的最新的问题的含义。
  • 另外一种方式是在会话过程中将历史的问题进行维护,再使用另外一个大模型结合最新的问题去理解用户当前的意图。

两种方式都可以,但是在我目前的业务上我目前使用的是后者,因为比较容易实现,效果也不错。

第一种方式

这是使用的是 qwen 的多轮问答 api ,要使用这一种方式,需要维护一个相当长的历史会话记录 messages ,而且要保证 messages 中的 user/assistant 消息交替出现,这是一个必须要遵循的条件,如果是碰到异常,必须要对 messages 中最后的无效对话进行清理。这里就是将理解用户意图和解决用户的问题都混在了一块,对于我要做的业务,回答内容的不确定性太高,而且实现成本也高,需要在会话中加入大量业务代码,所以果断放弃了。

这里的代码主要实现了一个简易地关于烹饪的对话,只有两轮,实现逻辑比较简单,写的比较粗糙,理解意思即可。

def multi_round():
    messages = [{'role': 'system', 'content': '你是一个绝佳的烹饪助手'},
                {'role': 'user', 'content': '如何做西红柿炖牛腩?'}]
    response = Generation.call(model="qwen-turbo",  messages=messages, result_format='message')
    if response.status_code == HTTPStatus.OK:
        print(response)
        messages.append({'role': response.output.choices[0]['message']['role'],
                         'content': response.output.choices[0]['message']['content']})   # 将assistant的回复添加到messages列表中
    else:
        print(response.message)
        messages = messages[:-1]  # 如果响应失败,将最后一条user message从messages列表里删除,确保 user/assistant 消息交替出现
    messages.append({'role': 'user', 'content': '不放糖可以吗?'})  # 将新一轮的user问题添加到messages列表中
    
    response = Generation.call(model="qwen-turbo", messages=messages, result_format='message', )
    if response.status_code == HTTPStatus.OK:
        print(response)
        messages.append({'role': response.output.choices[0]['message']['role'],
                         'content': response.output.choices[0]['message']['content']})  # 将第二轮的assistant的回复添加到messages列表中
    else:
        print(response.message)
        messages = messages[:-1]  # 如果响应失败,将最后一条user message从messages列表里删除,确保 user/assistant 消息交替出现

第二种方式

在我所做地业务中,对于 assistant 的回复不关心,主要关心的是用户的问题,所以我只关注 user 的历史提问,在实现的时候只需要维护一个列表 history,始终将最新的用户提问追加即可,为了保证列表信息的有效性,我始终只维护最后 10 个问题。我这里使用 qwen-max 模型对历史提问进行总结,并且按照我要求的方式进行输出。也就是说这个模型只负责总结历史问题,对于业务问题的回答是其他大模型干的事情,任务分工明确就减少了不确定性。

@app.route('/get_last_question', methods=["POST"])
def get_last_question():
    global user_data
    logging.info("-"*20)
    data = request.get_json()
    if 'question' not in data or not data['question'] or 'userId' not in data or not data['userId']:
        return "无法理解或者无法解决,请重新输入问题"
    question = data['question']
    userId = data['userId']
    try:
        user_data = load_data(config)  # 加载用户数据
        if userId not in user_data:
            user_data[userId] = []
        user_data[userId].append(question)  # 获取 userId 对应的历史对话记录
        user_data[userId] = user_data[userId][-10:]  # 只保留历史上 10 个对话记录
        logging.info(f"正在解析用户 【{userId}】 意图,问题历史是 {user_data[userId]}...\n\n")
        history = user_data[userId]
        history_str = ""
        if len(history)>1:
            history_str = "历史上我依次提问了以下问题:\n"
            for i,h in enumerate(history[:-1]):
                history_str += f"时间 10:06:0{i+1} ,问题是: {h}\n"
        else:
            history_str += "目前暂无用户提问历史记录。"
        messages = [
            {'role': 'system',
             'content': '您是一名善于从历史提问中分析用户的最新意图的助手,请根据提问历史记录,分析并总结用户的最新问题的完整意图。'},
            {'role': 'user',
             'content': f"根据提问历史记录,分析并总结用户的最新问题的完整意图。不要做冗余的解释或者赘述。如果用户提出的问题语义模糊不清无法识别,可以直接返回空字符串。答案的模板必循遵循“【{{我的最新的问题描述}}】”,总结出来的问题还必须要满足下面的要求:\n"
                        f"1、如果用户的问题查询的是“杭州市”或者“杭州”范围的数据一律使用“全市”进行替换,因为业务数据范围默认就是全杭州市的数据,所以无需重复再提起,但是我们不对包含“杭州市”或者”杭州“字符串的单位名称进行任何处理,因为单位名称具有独特的含义。\n"
                        f"2、用户的简短问题或者意图模糊的提问(如‘2024年呢’等)通常是对之前历史问题的追问或者补充,请根据历史问题记录推断出完整的问题。\n"
                        f"例子:\n"
                        f"输入的历史问题列表是:\n "
                        f"时间 2024-6-6 ,问题是:升序统计2023年各项目类型下管线项目计划数和计划投资金额\n "
                        f"我最新的问题是:统计杭州市2023年管线和管廊建设计划的执行率\n"
                        f"经过分析历史问题列表发现最新的问题和前面的问题关系不大,所以直接最后总结出来的问题是 “统计杭州市2023年管线和管廊建设计划的执行率”, 从问题中可以看出要查询杭州市范围的数据,按照要求我们知道默认数据范围就是全杭州市,所以要用”全市“进行替换,所以输出结果为“【统计全市2023年管线和管廊建设计划的执行率】”。\n"
                        f"例子:\n"
                        f"输入的历史问题列表是: \n"
                        f"时间 2024-6-6,问题是:升序统计杭州市2023年各项目类型下管线项目计划数和计划投资金额\n"
                        f"我最新的问题是:2024年呢\n"
                        f"经过分析发现列表中最新的问题和前面的问题关系有联系,所以经过分析最后总结出来的问题是 “升序统计杭州市2024年各项目类型下管线项目计划数和计划投资金额”, 从问题中可以看出要查询杭州市范围的数据,按照要求我们知道默认数据范围就是全杭州市,所以要用”全市“进行替换,所以输出结果为“【升序统计全市2024年各项目类型下管线项目计划数和计划投资金额】”。\n"
                        f"例子:\n"
                        f"输入的历史问题列表是: \n"
                        f"时间 2024-6-6,问题是:升序查询杭州市2023年权属单位是杭州市政府的管线信息\n"
                        f"我最新的问题是,问题是:2024年呢\n"
                        f"经过分析发现列表中最新的问题和前面的问题关系有联系,所以经过分析最后总结出来的问题是 “升序查询杭州市2024年权属单位是杭州市政府的管线信息”, 从问题中可以看出要查询杭州市范围的数据,按照要求我们知道默认数据范围就是全杭州市,所以要用”全市“进行替换,所以输出结果为“【升序查询全市2024年权属单位是杭州市政府的管线信息】”,我们不对包含“杭州市”或者”杭州“字符串的单位名称进行任何处理。\n"
                        f"\n{history_str}\n,现在我的最新的问题是 “{history[-1]}” ,请严格遵守上述要求并总结出用户的最新问题并给出完整的意图,并简要介绍思考过程。"}
        ]
        logging.info(f"总结用户最新意图 prompt :{messages}")
        response = Generation.call(model="qwen-max-0428", messages=messages, result_format='message')
        resp = response.output.choices[0]['message']['content']
        logging.info(f"用户最新意图是:{resp}")
        g = re.search(r"【.*】", resp)
        if g:
            resp = g.group().replace("【", "").replace("】", "")
            save_data(user_data, config)
            return resp
        return ""
    except Exception as e:
        logging.info("提取总结最新的问题过程中报错")
        logging.error(e)
        return ""

那么,我们该如何学习大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/690789.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Large-Scale LiDAR Consistent Mapping usingHierarchical LiDAR Bundle Adjustment

1. 代码地址 GitHub - hku-mars/HBA: [RAL 2023] A globally consistent LiDAR map optimization module 2. 摘要 重建精确一致的大规模激光雷达点云地图对于机器人应用至关重要。现有的基于位姿图优化的解决方案,尽管它在时间方面是有效的,但不能直接…

【python】python电影评论数据抓取分析可视化(源码+数据+课程论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

Windows系统问题

Windows系统问题 一、补丁更新提示:0x80070643问题:解决方法:1.以管理员权限运行【cmd】。2.禁用 【Windows RE】,请运行reagentc /disable。3.回收【Windows RE】恢复分区空间。4.准备新的【Windows RE】恢复分区空间。5.配置并启…

如何检测UV胶的均匀性?

如何检测UV胶的均匀性? 检测UV胶的均匀性可以通过以下几种方法来实现: 肉眼目视检查: 这是最简单直接的方法。将UV胶涂在表面上,使用裸眼观察胶层的表面。特别注意是否存在气泡、颜色不均匀、裂纹或其他明显的不均匀性。如凹凸不…

从零开始实现自己的串口调试助手(9)-重置多文本框,保存/载入指令集

重置多文本框 添加多文本控件列表 在构造函数中把我们需要操作的控件归类到对应列表之中 //创建多文本存放数组 - 存放那三列内容 checkBox lineEdi btnfor(int i1;i<9;i){// 添加到按钮数组QString btnName QString("pushButton_t%1").arg(i); //构建对应控件名…

独享IP VS 原生IP,二者的区别与定义详解

原生IP&#xff1a;原生IP是指由Internet服务提供商&#xff08;ISP&#xff09;直接分配给用户的IP地址&#xff0c;这些IP地址通常反映了用户的实际地理位置和网络连接。原生IP是用户在其所在地区或国家使用的真实IP地址&#xff0c;与用户的物理位置直接相关。在跨境电商中&…

汉中门禁系统设备多少钱,门禁系统报价单

汉中门禁系统设备多少钱&#xff0c;门禁系统报价单 门禁系统设备存在普通与智能之分&#xff0c;其价格差异颇大。以下是一些国内品牌的门禁系统价格&#xff1b; 以上只是部分国内品牌门禁机设备的报价&#xff0c;仅供参考&#xff0c;能看出目前市面上&#xff0c;海…

Freetype 介绍和使用

目录 一、矢量字体引入 二、Freetype 介绍 1.给定一个字符&#xff0c;怎么在字体文件中找到它的关键点&#xff1f; 2.文字显示过程 3.如何使用 freetype 库 三、在 LCD 上显示一个矢量字体 1.使用 wchar_t 获得字符的 UNICODE 值 2.使用 freetype 得到位图 3.在屏幕上…

Java——数组排序

一、排序介绍 1、排序的概念 排序是将多个数据按照指定的顺序进行排列的过程。 2、排序的种类 排序可以分为两大类&#xff1a;内部排序和外部排序。 3、内部排序和外部排序 1&#xff09;内部排序 内部排序是指数据在内存中进行排序&#xff0c;适用于数据量较小的情况…

一个 buffer 使用的负反馈实例

端到端拥塞控制其实就是负反馈的实施。典型的做法是识别到一系列标志性事件&#xff0c;比如丢包&#xff0c;时延增加等&#xff0c;然后对这些事件做反应&#xff0c;进而形成负反馈&#xff0c;但 inflight 守恒是一种完全不同的做法&#xff0c;它将负反馈平铺到了整个传输…

pytorch 笔记:pytorch 优化内容(更新中)

1 Tensor创建类 1.1 直接创建Tensor&#xff0c;而不是从Python或Numpy中转换 不要使用原生Python或NumPy创建数据&#xff0c;然后将其转换为torch.Tensor直接用torch.Tensor创建或者直接&#xff1a;torch.empty(), torch.zeros(), torch.full(), torch.ones(), torch.…

嵌入式Linux系统编程 — 3.2 stat、fstat 和 lstat 函数查看文件属性

目录 1 文件有哪些属性 2 stat函数 2.1 stat函数简介 2.2 struct stat 结构体 2.3 struct timespec 结构体 2.4 示例程序 3 fstat 和 lstat 函数 3.1 fstat 函数 3.2 lstat 函数 1 文件有哪些属性 Linux文件属性是对文件和目录的元数据描述&#xff0c;包括文件类型…

代码随想录-算法训练营day61【代码随想录-算法训练营-总结】

代码随想录-035期-算法训练营【博客笔记汇总表】-CSDN博客 算法训练营&#xff0c;60天&#xff0c;包含这些内容&#xff1a; 01、数组 02、链表 03、哈希表 04、字符串 05、双指针法 06、栈与队列 07、二叉树 08、回溯算法 09、贪心算法 10、动态规划 11、单调栈 12、图论 做…

数据库同步软件PanguSync常见错误解决方法

​​​​​​在部署PanguSync数据库同步软件的过程中&#xff0c;常常会遇见一些错误提示&#xff0c;某些老铁可能会一脸懵逼&#xff0c;本文对一些常见的错误信息进行了总结&#xff0c;并提供了解决方法。 1.")"附近有语法错误 该问题是由于源表未设置主键&…

安卓打造安装包(应用打包、规范处理安装包、安全加固)

本章介绍应用安装包的基本制作规范&#xff0c;主要包括&#xff1a;如何导出既美观又精简的APK文件、如何按照上线规范调整App的相关设置、如何对APK文件进行安全加固以防止安装包被破解。 应用打包 本节介绍APK安装包的打包过程&#xff0c;包括&#xff1a;如何利用Androi…

Java Web学习笔记21——前后端分离开发

前后端混合开发&#xff1a; 沟通成本比较高。 分工不明确。 不便管理&#xff0c;不便于后期的维护和拓展。 前后端分离开发&#xff1a; 当前主流的开发模式&#xff1a;前后端分离开发&#xff1a; 接口文档&#xff1a; 接口并不是interface。 接口指的是业务功能。 …

选择排序(直接选择排序与堆排序)----数据结构-排序②

1、选择排序 1.1 基本思想 每一次从待排序的数据元素中选出最小&#xff08;或最大&#xff09;的一个元素&#xff0c;放在序列的起始位置&#xff0c;直到全部待排序的数据元素排完就停止 。 1.2 直接选择排序 排序思想&#xff1a; ①在元素集合array[i]--array[n-1]中选择…

Java项目如何外发告警日志到企业微信

前言 最近领导交代了一个需求,就是有些许客户不单单满足平台告警日志外发到邮箱、短信的形式,还要以消息聊天的形式外发给企业微信。 具体操作 1、注册企业微信。 2、登录企业微信,找到应用管理,创建应用。 3、创建完之后需要记录以下图片中两个值的信息。 4、然后记录下…

stanfordcorenlp+python做中文nlp任务,得到的结果中全是空字符串,而不是中文字符串

问题描述 代码&#xff1a; from stanfordcorenlp import StanfordCoreNLP import logging#中文中的应用&#xff0c;一定记得下载中文jar包&#xff0c;并标志lang‘zh’ nlp_zh StanfordCoreNLP(rD:\stanford-corenlp-full-2016-10-31, port8094, langzh,quietFalse,logg…

【排序算法】总结篇

✨✨这些 排序算法都是指的 需要进行比较的排序算法 ✨✨下面都是略微讲解一下思路&#xff0c;如果需要详细了解哪一个排序&#xff0c;点击&#x1f449;链接即可 ✨✨对于时间、空间复杂度、稳定性&#xff0c;希望你&#x1f9d1;‍&#x1f393;能够理解记忆&#x1f9d1;…