比赛调研资料

视觉文旅

在这里插入图片描述

现有的模型

在这里插入图片描述

数据

在这里插入图片描述
在这里插入图片描述

功能

  • 精准营销
    在这里插入图片描述

  • 基于地理推荐能力
    在这里插入图片描述

  • 乡村圈分析能力
    在这里插入图片描述

  • 都市圈分析能力在这里插入图片描述

产品体系

在这里插入图片描述

三大数据平台

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


携程问道

旅游服务框架:前置(推荐种草),途中(客服),售后(?)

  • 行程规划

在这里插入图片描述

携程问道在训练期间筛选了200亿个高质量非结构性旅游数据,再结合携程现有精确的实时数据进行自研垂练,成为百亿参数规模的行业垂直大模型。

  • 大模型推荐

“携程问道”大模型目前已经具备了“前置推荐”和“智能查询”两项能力:
首先,在用户需求尚未确定时,携程问道能为其提供出行推荐服务;
如若用户已有相对明确的需求,问道也能提供智能查询结果。

“旅游重在体验,任何一个5%的行程规划失误都会造成100%的旅游问题”,携程深知,AI能否给出可靠答案,将直接关乎游客的出行体验。

  • 客服
    当前互联网平台主流的客服回复方式,无外乎线上咨询、电话语音和电子邮件。随着技术升级迭代,携程已将成熟的AI客服系统与客户无缝对接。

据了解,在中文渠道或是涉及多语种对话的场景中,携程AI的自助率已经达到了约75%,50%的电话咨询能够通过AI解决;利用文本抽取和意图识别技术,后台25%的邮件反馈,也已交由AI进行回复。
数据显示,AI客服上线至今,日均可节约10000+小时客服工作时间,邮件回复速度已从小时级降低至分钟级。

  • 显然,凭借公司自身在旅游行业多年深耕积累的旅游数据,训练语义理解、信息抽取、信息摘要等模型,携程正在用AI技术,提升着旅行全程的效率和体验。

中国移动

数据优势:

  • 数据覆盖人们的生活,移动用户基数大
    在这里插入图片描述
  • 尤其是轨迹位置数据

融合多种位置数据,包括信令、话单、MR以及流量解析中的GPS数据等,综合多维模型能力,提供高精准、高保障、高连接、
高响应、低时延的实时精准位置服务能力。

时间和位置数据如何利用?

  1. TimeGPT的方案,Transformer单独训练一个预测大模型,作为一个轨迹预测模块,针对单用户进行时间序列建模

  2. 多模态大模型,将时间和位置加入预训练数据中,作为一个Prefix,拼接到数据中

    • 存在一个问题,训练数据是已知的,推理是未知的,OOD
    • 位置可以直接拼接,时间不行使用相对时间,offset偏移?
      • 针对一个位置使用相对时间?
  3. Diffusion模型,进行预测

    • 扩散模型生成GPS轨迹:https://zhuanlan.zhihu.com/p/660517182
  4. TrafficGPT

    • https://zhuanlan.zhihu.com/p/656801328
    • https://arxiv.org/pdf/2309.06719.pdf
    • 用Tools实现各个功能的调用,
  • 移动目前的核心就是,基于位置的识别模型?

    • 那么我们如何建立一个大一统的识别模型呢?
    • 其实不用,可以使用Tools来唤醒各个专用的小模型
  • 需要精确性和可靠性

    • 精确性:ChatGPT已经可以很好的知道世界的经纬度了,所以可以大胆的加入位置信息进行训练
    • 可靠性:语言模型无法做到实时查询,通过tools来实现实时的查询

TrafficGPT的可靠性解决方案:

数据真实性:指示TrafficGPT避免生成虚假的交通基础模型(TFM)名称、输入和输出数据至关重要。这确保输出可信且可靠,最大程度地减少了误导信息的可能性。

最小化冗余:通过指示TrafficGPT避免重复使用工具,您鼓励了连贯的问题解决,同时减少了错误的机会。这种方法通过防止不必要的重复,增强了系统的可靠性和准确性。

人工干预协议:承认现有信息和TFM的局限性,该协议强调了当TrafficGPT遇到无法准确完成的情况时人工干预的重要性。它指示系统暂停并请求人类提供额外信息,以确保最终输出的准确性和可靠性。

任务精确性和响应及时性:由于TrafficGPT利用多种交通基础模型(TFMs)并能将它们相互关联以完成复杂任务,因此提供精确的提示变得至关重要。这确保系统准确理解任务要求,并能及时地做出响应,有效地利用相互关联的TFMs。

这些策略共同旨在通过关注真实数据生成、避免冗余、在需要时引入人工监督,并通过精确的任务理解和及时的响应来维护TrafficGPT在处理复杂交通相关任务时的可靠性和准确性。

ChatGLM问答(回复生成)

  • https://mp.weixin.qq.com/s/1ODytWmjCkEs8lL5VFo-PA

GPS轨迹(轨迹预测)

  • DiffTraj: 利用扩散模型生成 GPS 轨迹: https://zhuanlan.zhihu.com/p/660517182
  • DYffusion: DYnamics-Informed Diffusion Model: https://neurips.cc/media/neurips-2023/Slides/73469.pdf

在这里插入图片描述

TableGPT(做数据分析)

  • https://zhuanlan.zhihu.com/p/644674989

Global Table Representation 表格全局表达
Chain-of-Command 链式命令
Domain-aware Fine-Tuning 领域感知微调

在这里插入图片描述

Background:目前的大模型逐渐走向多模态,除了文字之外,还可以处理图像、音频等。但就如之前所说,现有的大模型处理表格数据的能力十分有限。要让大模型正确地理解和解释表格是一个难题。之前有人做过各种尝试,比如把表格数据的每一行转换成句子状的文本描述等等。但这些方法都只是从表格里提取了部分信息喂给大模型,而忽略了整体,也没有考虑到数据中隐含的行业相关背景。

那么能不能直接从表格中提取矢量表征呢?这里最大的挑战是,不同于图像、音/视频,表格数据是一种非常抽象的结构化数据。同时表格还具有双置换不变结构,即重新排列行或列不会影响表格中包含的信息,这与图像和音频形成了鲜明的对比,后者在相邻位置或序列中具有归纳偏差。更不用说不同的表格的大小、尺寸、列数都不一样,要用统一的神经网络架构来提取特征是很困难的。

普通的大模型在理解表格的时候往往太拘泥于每一格中的具体信息,而忽略了全局。于是研究团队的解决方法是让他们的模型像人类数据分析师那样去理解表格。具体来说,就是把表格中的信息分成两部分:

  1. 第一部分是表格的元数据表征,即表格的呈现形式、表格内容的行业背景,每一列的栏目名称等。这样可以大模型对表格结构有一个整体的把握。
  2. 而第二部分是学习表格中的数字信息表征,比如每一列中数值的分布和变化趋势。这里他们将表格的行和列视为一组元素,并学习整个集合的整体表征。而表格编码器的主干来自修饰过的集合转换器(modified set transformer)。
  • 编码器通过注意力机制加强之后可以理解不同行和列之间的相互关系

指令链

大模型具有思维链(chain-of-thought),可以把复杂的推理过程分解成一系列中间步骤。而在这里,研究团队提出指令链(chain-of-command),为思维链的这一系列中间步骤提供逐步的指示。

例如当用户提出:“列出 5 部利润最高的电影。” 大模型会先检查列表里面有没有利润这一栏,如果没有这一栏,那么它会生成一套指示来指导自己通过票房和成本数据计算出利润,再根据指示按照利润高低排列电影,找出利润最高的那 5 部。指令链增强了大模型的多跳推理(multi-hop reasoning)能力,使其能够把用户的诉求拆解成一系列指令,这样更易于进行复杂的跨表格操作。此外,当用户的请求太过模糊、宽泛的时候,比如用户说“给我一些数据”,那么指令链还会提醒用户把请求变得具体、明确。

用处: 用自然语言去进行数据分析

另一方面,在同一企业内部,数据分析部门与其它部门之间沟通不畅,数据分析的术语对于其它部门人员来说晦涩难懂,而数据分析师由于不在业务的一线,也很难理解业务的真实需求。

如果有一个工具可以降低数据分析的门槛,让所有人都可以用自然语言与之交互,省去了学习复杂的工具和写代码的麻烦,那么将大有可为。我们希望 TableGPT 会是这样的工具。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/169648.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

多目标应用:基于多目标灰狼优化算法MOGWO求解微电网多目标优化调度(MATLAB代码)

一、微网系统运行优化模型 微电网优化模型介绍: 微电网多目标优化调度模型简介_IT猿手的博客-CSDN博客 二、多目标灰狼优化算法MOGWO 多目标灰狼优化算法MOGWO简介: 三、多目标灰狼优化算法MOGWO求解微电网多目标优化调度 (1&#xff09…

英飞凌TC3xx的LMU SRAM保护机制(二)

目录 1.SRAM保护配置使能 2.测试结果分析 3.小结 我们接着上文继续来梳理如何配置LMU的保护机制 英飞凌TC3xx的LMU SRAM保护机制(一)-CSDN博客 1.SRAM保护配置使能 简单举两个例子,地址下限寄存器如下: 可以看到使用SRI地址的bit31-5用于作为边界&am…

Linux下安装两个版本python

1 python下载: 官网地址:Download Python | Python.org 第一:点击下载如下图: 第二:找到对应的python版本源码包: 点击右键复制下载地址,如下图 例如我的是:https://www.python.org/…

网络运维与网络安全 学习笔记2023.11.20

网络运维与网络安全 学习笔记 第二十一天 今日目标 交换网路径选择、Eth-Trunk原理、动态Eth-Trunk配置 Eth-Trunk案例实践、MUX VLAN原理、MUX VLAN配置 交换网路径选择 STP的作用 在交换网络中提供冗余/备份路径 提供冗余路径的同时,防止环路的产生 影响同网…

越南MIC新规针对ICT和ITE产品电气授权标准变更

从2024年1月1日起,所有ICT和ITE产品(如台式电脑、笔记本电脑、平板电脑、DVB-T2电视/机顶盒、DECT电话等)都需要越南MIC授权的电气安全标准——QCVN132:2022。 目前MIC仍未最终确定要求,因为这与另一个监管机构存在冲突。所以目前他们可以接受ISO 17025的…

电磁场与电磁波part6、7--均匀平面波的反射与透射、导行电磁波

1、分界面上的反射系数 反射波电场振幅 与入射波电场振幅 的比值,即: 2、驻波系数(驻波比) 合成波的电场强度的最大值与最小值之比,即: 3、导波系统中电磁波的传输问题属于电磁场边值问题,即…

可以自己实现的Python小游戏,共十四个可收藏可直接拿走~

文章目录 1、吃金币2、打乒乓3、滑雪4、并夕夕版飞机大战5、打地鼠6、小恐龙7、消消乐8、俄罗斯方块9、贪吃蛇10、24点小游戏11、平衡木12、外星人入侵13、贪心鸟14、井字棋888‘关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四…

轻量封装WebGPU渲染系统示例<35>- HDR环境数据应用到PBR渲染材质

当前示例源码github地址: https://github.com/vilyLei/voxwebgpu/blob/feature/rendering/src/voxgpu/sample/BasePbrMaterialTest.ts 当前示例运行效果: 微调参数之后的效果: 此示例基于此渲染系统实现,当前示例TypeScript源码如下: export class BasePbrMateri…

writev函数的使用测试

writev函数的原型是ssize_t writev(int filedes, const struct iovec *iov, int iovcnt),第一个参数是需要写入的文件描述符,第二个参数是指向某个iovec结构数组的一个指针,其中 iovec 结构定义如下: struct iovec { void *iov_b…

Python loglog()函数

常用坐标下的图像显示 import matplotlib.pyplot as plt import numpy as np import mathplt.figure() x_input np.linspace(1, 10, 50) y_input x_input**2plt.plot(x_input, y_input,r-,linewidth2) plt.show()在loglog函数尺度下的曲线 plt.loglog(x_input, y_input,r-,…

面试题c/c++--语言基础

一 、语言基础 1.1 指针 野指针:指针指向的位置是不可知的 悬空指针:指针最初指向的内存已经被释放了的一种指针 两种指针都指向无效内存空间, 即不安全不可控 。需要在定义指针后且在使用之前完成初始化或者使用 智能指针来避免 智能指针 智…

【算法基础】筛质数

文章目录 问题描述解决方法朴素筛法线性筛法 问题描述 给定一个正整数 n n n,请你求出 1 ∼ n 1∼n 1∼n 中质数的个数。 输入格式 共一行,包含整数 n。 输出格式 共一行,包含一个整数,表示 1∼n 中质数的个数。 数据范围 …

基于梯度算法优化概率神经网络PNN的分类预测 - 附代码

基于梯度算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于梯度算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于梯度优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神经网络的光滑…

卷积神经网络(VGG-19)灵笼人物识别

文章目录 前期工作1. 设置GPU(如果使用的是CPU可以忽略这步)我的环境: 2. 导入数据3. 查看数据 二、数据预处理1. 加载数据2. 可视化数据3. 再次检查数据4. 配置数据集5. 归一化 三、构建VGG-19网络1. 官方模型(已打包好&#xff…

四川天蝶电子商务有限公司服务可靠吗?

作为当今最热门的社交媒体平台之一,抖音已经成为许多消费者和企业的重要销售渠道。然而,对于许多新手来说,如何在这个平台上开展电商服务却是一大难题。在这篇文章中,我们将探讨四川天蝶电子商务有限公司的抖音电商服务是否可靠&a…

我叫:插入排序【JAVA】

1.自我介绍 插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。 2.继承我的思想 插入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包…

使用Python实现几种底层技术的数据结构

使用Python实现几种底层技术的数据结构 数据结构(data structure)是带有结构特性的数据元素的集合,它研究的是数据的逻辑结构和数据的物理结构以及它们之间的相互关系,并对这种结构定义相适应的运算,设计出相应的算法,并确保经过这…

优秀智慧园区案例 - 佛山美的工业城零碳智慧园区,先进智慧园区建设方案经验

一、项目背景 美的工业园区西区最早建于上世纪90年代,到现在已经过去近30年,而这三十年恰恰是信息科技大发展的30年,原有的生产办公条件已不能很好的承载新时期办公和参观接待的需求。所以在21年美的楼宇科技事业部决定对原来的园区进行改造…

传统词嵌入方法的千层套路

诸神缄默不语-个人CSDN博文目录 在自然语言处理(NLP)领域,词嵌入是一种将词语转换为数值形式的方法,使计算机能够理解和处理语言数据。 词嵌入word embedding也叫文本向量化/文本表征。 本文将介绍几种流行的传统词嵌入方法。 文…

OpenHarmony Axios组件使用过程中,Api9不适配问题

大家好,我是【八戒,你又涨价了哎】 以下是我个人在学习OpenHarmony过程中的分享,请大家多多指教 目录 问题描述 解决方法 问题描述 使用axios组件的时候,把应用部署到开发板,提示Api9不适配 解决方法 对这类版本不…