对话即数据分析,网易数帆ChatBI做到了

14de64afa6d13823414651d8b616751b.png

5821e48542b7f938aeb68351186d8f89.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


在当今数字化快速发展的时代,数据已经成为业务经营与管理决策的核心驱要素。无论是跨国大企业还是新兴创业公司,正确、迅速地洞察数据已经变得至关重要。然而,传统的BI工具往往对用户有一定的技术门槛,需要熟练的操作技能和复杂的查询语句,这使得大部分的企业员工难以深入挖掘数据的价值。

那么,如何让数据分析变得更为直观、更为人性化呢?

8月10日,网易数帆举办主题为“精耕数智 为创新加速——网易数帆城市行(北京)”的行业峰会,发布了AIGC结合数据分析、软件开发等领域的的最新进展与成果。

25a965a79550bf9ca4c01728a4d6206e.png
网易副总裁,网易杭州研究院执行院长、网易数帆总经理汪源介绍AIGC应用潜力

其中,在大数据领域,网易数帆发布融合前沿AIGC技术研发而成的对话式BI产品——有数ChatBI。这是数据分析领域的一个全新的解决方案,通过自然语言与BI平台进行交互,实现数据查询和分析。这种方式像是与一位数据专家进行对话,简单、直接,无需复杂的技术背景。这一创新,有望开启数据分析新范式。

网易数帆是如何做到的呢?ChatBI跟以往的BI又有哪些显著不同?如何解决大模型被广为吐槽的“胡说八道”难题,本文将对这些问题进行深入的分析。

AIGC变革人机交互方式,数据分析从此不同

网易数帆大数据产品线总经理余利华认为,人机交互其实是很重要的事情,更好的人机交互往往会带来显著的技术和产业革新,比如电脑图形界面、iPone多点触控的出现,都对产业带来重要的影响。

人类和计算机之间的交互历经数十年的发展,已经从初期的复杂、难用,转化为现今的直观、人性化。简单来说,人机交互经历了三个显著的变革阶段,每一个阶段的变化都为数据分析带来了深远的影响。

72858bdd4b6031cec8e29193cbf96180.png

第一阶段:程序命令行交互

在计算机刚刚诞生的年代,与计算机的交互基本依赖于程序命令行。用户需要精通各种命令,才能让计算机完成特定的任务。这种方式虽然为早期的计算机专家和爱好者提供了强大的灵活性,但显然,对于大多数普通用户来说,它的学习曲线相对陡峭,使用门槛较高。

3a1e1b49d20e620fe9d444f0e9ea4c6a.png

第二阶段:图形界面交互

随着技术的进步,图形用户界面(GUI)开始逐渐流行。用户不再需要记忆复杂的命令,只需通过电脑鼠标或是手机触屏进行操作,即可完成任务。图形界面的出现显著降低了计算机使用的难度,大大扩展了计算机的用户群体。对于数据分析来说,图形化的数据展示和拖拽式的操作界面使得BI平台变得更为直观易用,但仍然需要一定的培训和熟练度,依然有不小的使用门槛。

76e339cf98330a3b177cf02ebadeb3be.png

第三阶段:基于AIGC的自然语言交互

2023年,大模型和AIGC迅速进入人们视野,为我们打开了一个全新的人机交互思路。用户可以直接用自然语言与机器对话,就像与另一个人交谈一样。这意味着,无论用户是否具有专业技能或背景知识,都可以轻松、直接地与计算机互动,进行数据查询和分析。

16758581930791b3fe6925214280b5da.png
网易有数ChatBI产品应用界面

总的来说,AIGC技术彻底改变了数据分析的游戏规则,让数据分析从此走入了一个全新的时代。

以ChatBI,开启数据分析新范式

ChatBI是数据分析领域的一次革命性突破,它将BI与AI技术完美结合,为企业提供了前所未有的便利和效率。具体来看,相对于传统BI,ChatBI具有以下几个显著的优势:

1、对话即分析,显著降低数据分析门槛。

相对于传统BI工具,ChatBI的对话式数据分析为企业和个人带来了独特的便利性。传统BI通常需要深入的培训、编程知识,以及对数据结构的深入理解,这使得非技术背景的员工在数据分析过程中可能会感到手足无措。但ChatBI破除了这种障碍,提供了一个自然且直观的方式来获取数据洞察。

在ChatBI中,问题不再是通过复杂的查询语言或拖放界面提出的,而是通过日常语言。这意味着即使是营销、销售或管理团队的非技术人员,也可以直接询问并获取他们需要的答案。此外,这种直接的交互方式极大地加快了响应时间,使得实时决策成为可能。

此外,对话式的数据分析还增强了数据的可访问性。传统的BI工具可能会在用户界面上有大量的选项和配置,而ChatBI简化了这一过程,使用户可以集中精力在真正的问题上,而不是工具的操作上。这种便捷性不仅提高了效率,也使得数据分析更具吸引力,鼓励更多的人参与其中,进而促进数据消费。

2、报告生成与解释,用业务语言,让数据分析结果更清晰易懂。

ChatBI不仅能够生成数据分析报告,还能够以业务语言、管理语言来解释分析结果。对于非技术背景的决策者而言,这种方式更易于理解和接受。当数据不再是冰冷的数字,而是与我们对话、解释、讨论的“伙伴”时,数据分析和业务决策过程也变得更加高效。

以一个市场营销团队为例,考虑这样一个场景:市场部经理想知道上个月社交媒体广告活动的效果,特别是哪些帖子或广告得到了最多的互动和转化。

在ChatBI中,市场部经理只需输入:“上个月的社交媒体广告活动效果如何,哪些内容的互动和转化率最高?”系统可能会迅速地回应:“上个月,我们在小红书的‘夏日促销’帖子得到了最多的互动,共有5,000次点赞和500条评论。抖音上的‘新品发布’视频广告转化率最高,为3.5%,为我们带来了2000个新用户。”

3、更深入的数据挖掘能力,发现大数据中隐藏的业务关联。

传统的数据分析往往依赖于预设的规则和模型,而ChatBI则利用了先进的AI技术,可以从大数据中自动学习规则,处理更复杂、更深入的分析任务。这意味着,ChatBI可以帮助企业发现之前被忽视的业务关联和潜在机会。

让我们来看一个例子。

假设有一家大型零售公司,该公司有多个销售渠道,包括实体店、网店和移动应用。此外,他们也运营一个会员积分系统,消费者可以在购买后获得积分,并在特定时间或活动中兑换商品或服务。

使用传统的数据分析工具,可能会得到一些粗浅的分析结果:在某些城市的实体店,周五下午3-5点是销售高峰;而网店和移动应用则在周末和节假日的晚上7-10点销售最佳。

但是,使用ChatBI进行深入挖掘,他们更可能发现了一些更复杂、更隐秘的模式,例如:那些在实体店周五下午购买家居或厨房用品的消费者,有超过65%的可能性在接下来的48小时内,通过移动应用购买与烹饪或食品相关的商品。进一步的分析揭示,这可能与一些消费者在周五购买新的厨房用品后,希望在周末尝试新菜谱,因此会通过移动应用购买食材或其他相关产品。为此,这个零售公司可以为在实体店购买厨房用品的消费者提供移动应用内的食材折扣,进一步促进其二次消费。

4、自我进化能力,实现个性化BI。

ChatBI的一个显著特点是其自我进化能力。随着使用的增加,它会持续学习、优化,从而提供更准确的分析结果。更为重要的是,ChatBI能够了解并适应每个用户的习惯,为每位用户提供真正的个性化服务,这使得数据分析过程更加灵活和高效。

5、打通数据应用,推动数据驱动的业务流程自动化。

ChatBI不仅仅是一个数据分析工具,它还可以作为BI数据分析结果与其他应用系统的桥梁。通过将数据分析结果与企业的业务流程相结合,ChatBI可以自动触发相应的业务操作。这种集成方式不仅提高了工作效率,还为企业带来了更高的灵活性和响应速度,从而实现真正的数据驱动决策。

在这个大数据和AI技术飞速发展的时代,ChatBI无疑为企业指明了一条新的、更为高效的数据分析之路。

解决AIGC“胡说八道”的问题,打造可商用的ChatBI

值得指出的是,尽管ChatBI沿用了大模型的设计理念,但这并不意味着我们可以直接用ChatGPT这类通用大模型来进行数据分析和图表生成。

尽管ChatGPT是一个功能强大的模型,它在直接调取数据库或数据平台上的数据方面并不尽如人意。这涉及到在不同平台之间实现数据整合,背后是一系列复杂的技术产品整合挑战。再者,ChatGPT在数据可视化方面的表现也相对较弱,它能做的只是简单的表格展示,而真正的数据分析需要更为复杂和详细的可视化图表。

更重要的是,ChatGPT作为一个通用知识模型,可能在专业领域如数据分析中出现计算和解释上的偏差。例如,当涉及复杂的数学计算或针对特定数据集的统计分析时,ChatGPT可能由于信息不完整、模型的推断限制或其他因素而导致答案的不准确。然而,对于BI产品而言,数据的准确最基本的要求,ChatGPT这种潜在的不准确性在数据分析领域是不可接受的。

余利华认为,可信才是“AIGC+BI”成熟商用的核心关键,通过需求可理解,过程可验证,用户可干预和可调整查询条件,产品可运营可调整等四种手段,网易数帆大大提升了有数ChatBI的结果可信度。

那具体怎么做呢?以网易数帆的创新实践来看,以下方法有助于解决大模型、AIGC存在的“胡说八道”的问题,提升数据分析精确性:

d3835307e8bbb31bc4625bb21a6ecf5d.png网易数帆大数据产品线总经理余利华介绍ChatBI产品

1、借助NL2SQL能力实现双重验证,提升生成内容的精确度,降低错误率。

网易数帆通过引入NL2SQL(Natural Language to SQL)技术,显著增强了用户与数据库的交互体验。在传统的数据库查询方法中,用户需要明确掌握SQL语言和相应的数据库结构来提取所需信息。而通过NL2SQL,用户只需使用自然语言描述需求,由后端系统将其转换为适当的SQL语句,大大简化了查询过程。

余利华在接受媒体采访时指出,之前自然语言处理能力其实比较弱,这导致以往的NL2SQL技术在处理模糊或不清晰的查询、理解复杂的查询意图方面存在挑战,AIGC、大模型为NL2SQL带来了更强大的语境和意图理解能力。这意味着在处理模糊、多义或复杂的用户查询时,系统可以更准确地识别用户的真实需求。例如,用户可能提出“最近三个月销售额最高的产品是什么?”这种涉及时间、数值和排序的复杂查询,大模型的强大自然语言处理能力确保了它可以准确解析这样的需求,并转化为有效的SQL查询。

大模型+NL2SQL,这一机制打通了用户需求、数据获取、数据分析的整个链路,确保数据的准确可靠。目前,网易数帆已经能够处理超过30万种不同的自然语言问法,并且其效果在准确性上已经达到了GPT-3.5的水平。

2、表格粒度的知识增强,根据用户问题将相关表格知识实时“喂养”大模型。

网易数帆的另一个创新是,根据用户问题将相关表格粒度的知识实时“喂养”大模型,让大模型更透彻地理解结构化数据,显著提升生成结果的准确率。

表格,作为结构化数据的核心形式,是数据决策的基石。实时“喂养”大模型表格知识,意味着模型不只基于原始训练响应,而是获取实时表格数据作出回答。这就如同向专家提问,他不仅用旧知识,还立刻查最新资料回答。这方法的优势在于:因为它利用最新数据,可以保证答案的时效性;提升模型的灵活性,使其更针对性地回答,而非只基于训练知识。

3、通过自定义提示向模型灌输企业专有知识,提升个性化场景分析效果。

自定义提示为模型注入企业专有知识,是增强模型个性化和针对性的关键。预训练模型虽然具有广泛知识,但可能缺乏对特定企业文化、业务特性、工作流和术语的理解。通过自定义提示,模型可以更准确地为企业提供答案,确保其输出与企业的业务特性一致。

此外,每家企业的需求都是独特的,通用答案可能不适用于所有场景。因此,为模型灌输专有知识,不仅可以加深其对企业的理解,还可以确保为企业提供量身定制的策略和建议,进而提高决策的准确性。

4、将数据模型和查询条件结构化,用户可干预可调整,随时可切换数据模型或者查询条件。

余利华认为,在数据驱动的决策制定中,用户期望的是准确、有针对性和即时的数据分析结果。但自动化的数据分析系统,尽管高效,可能不总是满足这些要求。有时,系统输出的结果可能与用户的期望或其特定业务情境不完全吻合。

这时,将数据模型和查询条件结构化,并允许用户进行干预和调整变得尤为关键。如果ChatBI给出的结果错了,用户知道错在哪里,并且平台可以辅助用户很便捷的改正错误,这是可信ChatBI的应有之意。例如,一个零售商可能对上个月的销售数据感兴趣,而系统默认提供的是本年度的累计数据。在一个可调整的结构中,这位零售商可以简单地切换查询条件,以获取所需的信息,而不必重新构建整个查询。

此外,业务环境和需求是多变的。今天的分析框架可能在明天不再适用。允许用户干预、调整并切换数据模型或查询条件,不仅确保了数据分析的即时性和准确性,还赋予了用户更大的数据掌控权,使他们能够根据具体需求进行快速反应和决策。

5、构建产品运营反馈机制,通过用户和管理员的数据反馈、知识运营,来持续优化产品表现。

一个创新产品的开发不是一蹴而就的,而是在持续的迭代、优化中变得更好。为此,网易数帆构建了用户和管理员参与的运营反馈机制。

用户通常是第一时间发现并经历数据错误或不一致性的人,他们的反馈往往针对性强,有助于快速定位并修复问题。对于反馈的数据,管理员可以将其标记为“badcase”,并进行相应的优化。这样的标记和整理使得问题的出现不再是孤立的事件,而是被纳入一个持续优化的过程中。这也为后续的数据分析和模型训练提供了宝贵的训练样本,有助于模型的持续迭代和优化。

这种反馈机制不仅增强了数据的可靠性,还增强了用户与产品之间的互动关系,加深了用户与产品之间的连接,从而实现了数据和产品的双向优化。当用户看到他们的反馈被采纳和处理,他们更有可能建立起对产品的信任,并愿意持续使用。

在数据分析和内容生成的领域,准确性不仅仅关乎信誉和用户体验,更是决策支持的关键。错误的数据或分析可能导致企业做出不合理的策略决策,带来不可估量的损失。如果ChatBI进行错误的数据分析和内容生成,甚至“胡说八道”,不仅会降低用户对产品的信心,还可能损害企业的品牌形象。

因此,网易数帆对大模型生成内容的准确性赋予了极高的重视。通过上述方法,网易数帆确保了大模型生成内容的准确性,打造需求可理解、过程可验证、用户可干预、产品可运营的可信ChatBI,为这种全新数据分析方式的商业化应用奠定了坚实的基础。

对于网易数帆而言,此次ChatBI产品的发布,不仅是其构建AIGC+BI商业蓝图的关键一步,更是对现有数智竞争力的重塑。网易数帆对这一创新方向的坚持和深入探索将成为公司未来发展的重要驱动力。未来,通过陆续推出一系列针对不同需求的产品,网易数帆有望塑造一个全新的、更加智能化的商业生态体系,不仅助推自身的快速发展,同时也推动整个行业的创新和转型。

对于企业而言,ChatBI的推出无疑降低了数据分析和使用的门槛,使更多的人能够轻松获取并利用数据。这种开放和便捷的特性,将极大地扩大数据消费群体规模,提升数据消费的广度、深度和频率,进而推动企业在数字化、智能化方向的升级和转型。在全球经济日益依赖数据和智能技术驱动的今天,这一转型对于企业的竞争力提升有着不可忽视的意义。

从更广泛的角度看,ChatBI这类创新产品与中国当前数字经济的发展战略紧密相连。根据中国国家互联网信息办公室日前发布的《数字中国发展报告(2022年)》,2022年我国数字经济规模已达50.2万亿元,总量位居世界第二,占国内生产总值比重提升至41.5%。这一趋势的背后,离不开众多像ChatBI这样的创新产品共同推动。

正如网易数帆总经理汪源在会上指出,数字中国建设的关键驱动力,在于数智生产力与软件供给能力。如果把数字中国建设比作一棵参天大树,那发展数智生产力,可以促进数字创新应用“枝繁叶茂”。未来,随着这类产品的不断完善和推广,它们将进一步促进中国数字经济的快速发展,为国家和社会的繁荣做出更大贡献。从这个角度看,ChatBI不仅是一次成功的产品创新,更是一次对未来商业和社会发展方向的深刻洞察和积极响应。

文:月满西楼 / 数据猿

6664961eab3123aba5d7e85452ea4c87.jpegbccfb89d9e195966d990260d79e10e6f.png

87da9b818df9c49fcba80f7e9c42622d.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/74105.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Destination Host Unreachable

背景:物理机的IP地址是192.168.31.189,虚拟机的IP地址是192.168.194.130 物理机ping得通虚拟机 虚拟机ping得通外网 可是虚拟机ping不通物理机 1、报错信息 Destination Host Unreachable 2、原因 用route -n命令查看路由表发现192.168.194.0没有走网…

读书笔记 |【项目思维与管理】➾ 项目成为一种生存方式

读书笔记 |【项目思维与管理】➾ 项目成为一种生存方式 一、理解项目固有的挑战二、项目对企业的价值三、知识型企业的经营逻辑四、做项目管理的推进者 💖The Begin💖点点关注,收藏不迷路💖 项目无处不在,项目已经成为…

9.3.2.2网络原理(传输层TCP)

TCP全部细节参考RFC标准文档 一.TCP特点: 有连接,可靠传输,面向字节流,全双工. 二.TCP数据报: 1.端口号是传输层的重要概念. 2.TCP的报头是变长的(UDP是固定的8字节),大小存在4位首部长度中,用4个bit位(0~15)表示长度单位是4字节.(TCP报头最大长度是60字节,前面20字节是固定…

Linux 复制进程fork

一、父进程和子进程 当前的一个进程在fork的时候可以复制当前的进程产生一个进程,这时产生出来的这个进程就是子进程,被复制的进程叫做父进程。子进程会将环境变量从父进程继承过来,或者说被拷贝过来。父进程也会有它的父进程,一…

四、Dubbo扩展点加载机制

四、Dubbo扩展点加载机制 4.1 加载机制概述 Dubbo良好的扩展性与框架中针对不同场景使用合适设计模式、加载机制密不可分 Dubbo几乎所有功能组件都是基于扩展机制(SPI)实现的 Dubbo SPI 没有直接使用 Java SPI,在它思想上进行改进&#xff…

【自用】云服务器 使用 docker 搭建 HomeAssistant + MQTT 物联网平台

总览 1.搭建流程概述 2.准备工作 3.开始搭建! 4.总结 如果想看 ESP32 或其他使用 MicroPython 编程的单片机如何连接到该云服务器,实现 HomeAssistant 控制 单片机的内容,请看我这篇博客的下一篇。 一、搭建流程概述 0.总体流程 我们需要…

这四种订货系统不能选(二):不能独立部署

订货系统在传统批发贸易企业数字化转型中扮演着重要的角色。然而,有一种类型的订货系统并不适合选择,那就是无法独立部署的系统。 无法独立部署的订货系统意味着数据必须存放在软件厂商的服务器上。当我们选择这样的系统时,需要确保系统具备强…

如何初始化Git仓库

如何将目录初始化为Git仓库 一级目录二级目录三级目录 一、准备1、安装 gh2、登录 二、初始化 Git 仓库 一级目录 二级目录 三级目录 一、准备 ​ 在这里,我们需要借助一个非常好用的工具,大家也可以参照官方文档进行阅读,下面介绍常用的…

从小白到大神之路之学习运维第79天-------Kubernetes网络组件详解

第四阶段 时 间:2023年8月14日 参加人:全班人员 内 容: Kubernetes网络组件详解 目录 一、Kubernetes网络组件 (一)Flannel网络组件 (二)Calico 网络插件 (1)…

算法与数据结构(二十三)动态规划设计:最长递增子序列

注:此文只在个人总结 labuladong 动态规划框架,仅限于学习交流,版权归原作者所有; 也许有读者看了前文 动态规划详解,学会了动态规划的套路:找到了问题的「状态」,明确了 dp 数组/函数的含义&a…

【RabbitMQ上手——单实例安装5种简单模式实现通讯过程】

【RabbitMQ入门-单实例安装&5种简单模式实现通讯过程】 一、环境说明二、安装RabbitMQ三、用户权限及Virtual Host设置四、5种简单模式实现通讯过程的实现五、小结 一、环境说明 安装环境:虚拟机VMWare Centos7.6 Maven3.6.3 JDK1.8RabbitMQ版本:…

Java面向对象(内部类)(枚举)(泛型)

内部类 内部类是五大成员之一(成员变量、方法、构造方法、代码块、内部类); 一个类定义在另一个类的内部,就叫做内部类; 当一个类的内部,包含一个完整的事物,且这个事务不必单独设计&#xf…

【深入理解ES6】字符串和正则表达式

概念 字符串(String)是JavaScript6大原始数据类型。其他几个分别是Boolean、Null、Undefined、Number、Symbol(es6新增)。 更好的Unicode支持 1. UTF-16码位 字符串里的字符有两种: 前 个码位均以16位的编码单元…

怎么开通Tik Tok海外娱乐公会呢?

TikTok作为全球知名的社交媒体平台,吸引了数亿用户的关注和参与。许多公司和个人渴望通过开通TikTok直播公会进入这一领域,以展示自己的创造力和吸引更多粉丝。然而,成为TikTok直播公会并非易事,需要满足一定的门槛和申请找cmxyci…

YAMLException: java.nio.charset.MalformedInputException: Input length = 1

springboot项目启动的时候提示这个错误:YAMLException: java.nio.charset.MalformedInputException: Input length 1 根据异常信息提示,是YAML文件有问题。 原因是yml配置文件的编码有问题。 需要修改项目的编码格式,一般统一为UTF-8。 或…

Die2Die(D2D)和chip2chip(C2C)之间的高速互联接口

随着chiplet的兴起,Die2Die的高速互联越来越重要,相比于传统的C2C(chip2chip)的互联,D2D的片间距离很近(10mm量级),且这些小的chip(裸片)最终形成一个封装【多芯片模块(MCM)】。所以D2D的互联信道短&#x…

[C++ 网络协议编程] UDP协议

目录 1. UDP和TCP的区别 2. UDP的工作原理 3. UDP存在数据边界 4. UDP的I/O函数 4.1 sendto函数 4.2 recvfrom函数 4. 已连接(connected)UDP套接字和未连接(unconnected)UDP套接字 5. UDP的通信流程 5.1 服务器端通信流程 5.2 客户端通信流程 1. UDP和TCP的区别 主要…

Oracle常用基础知识

整体介绍 SQL语言是一种数据库语言 1、DDL:数据定义语言 create-创建 drop-删除 alter-修改 rename-重命名 truncate-截断 2、DML:数据操作语句 insert-插入 delete-删除 update-更新 select-查询 3、DCL:数据控制语句 grant-授权 rev…

DTC服务(0x14 0x19 0x85)

DTC相关的服务有ReadDTCInformation (19) service,ControlDTCSetting (85) service和ReadDTCInformation (19) service ReadDTCInformation (19) service 该服务允许客户端从车辆内任意一台服务器或一组服务器中读取驻留在服务器中的诊断故障代码( DTC )信息的状态…

c语言——颠倒字符串顺序

//颠倒字符串顺序 //列如&#xff1a;我们将runningman利用递归翻转计算。 #include<stdio.h> void reverseSentence(); int main() {printf("字符串输入:");reverseSentence();return 0; }void reverseSentence() {char c;scanf("%c",&c);if(c!…