【玩转 TableAgent数据智能分析】-数据分析师的大模型

【玩转 TableAgent数据智能分析】-数据分析师的大模型

    • 九章云极DataCanvas介绍
    • TableAgent的新手入门指南:
      • 官网首页
      • 立刻体验
      • 问题测试
        • 问题1:
        • 问题2:
        • 问题3:
        • 问题4:
        • 问题5:
    • 通用大模型对比分析
      • 对csv数据集的支持比较:
        • TableAgent对csv格式支持情况测试:
        • 文心一言对csv格式支持情况测试:
        • Chatglm2对csv格式支持情况测试:
      • 数据分析支持测试:
        • 问题1:
        • 问题2:
        • 问题3:
        • 问题4:
        • 问题5:
    • 个人总结与建议:

本文是笔者关于TableAgent的使用心得,内容涵盖九章云极DataCanvas介绍从零开始使用友商产品评测,对新手友好💯。

九章云极DataCanvas介绍

对人工智能基础软件公司有了解的朋友可能听说九章云极,本文介绍的TableAgent就是九章云极DataCanvas推出的产品。

2023年国际权威机构Forrester发布了“首份中国人工智能/机器学习平台报告”,该报告调研了国内市场14家主流云厂商,包括百度智能云、阿里云、华为云、腾讯云等,从产品能力、战略规划和市场表现三个方面对其进行评测。基于25项细分标准的全面评估,Forrester将这14家主流厂商划分为4个象限:领导者、优秀表现者、竞争者和挑战者。其中九章云极DataCanvas位于竞争者象限。
在这里插入图片描述

据IDC发布的《中国人工智能软件2022年市场份额》报告。其中,2022年机器学习开发平台市场规模达35.4亿元人民币。其中第四范式(32.7%)、华为云(21.6%)、九章云极(7.6%)、创新奇智(7.0%)居中国机器学习开发平台市场前四。
在这里插入图片描述

九章云极DataCanvas在大模型引领的新AI时代到来时,也进行了大模型的相关探索,推出自主研发的 DataCanvas Alaya九章元识大模型。而DataCanvas Alaya九章元识大模型也是TableAgent具有智能的基础。

下面开始介绍对于一个新手,该如何使用TableAgent
在这里插入图片描述

TableAgent的新手入门指南:

TableAgent的公测链接地址为https://tableagent.datacanvas.com/,进入首页后,可以点击立即体验。

在这里插入图片描述

刚了解的朋友们先点击立刻体验,稍等片刻,一般我们使用一个产品,都可以先看看官网的首页介绍,比如

XX比XX快几百倍
比如XX可以存储数十亿行数百万列等。

官网首页

官网首页介绍的是:

TableAgent是新AI时代的数据分析智能体
基于DataCanvas Alaya九章元识大模型,为你打造专属的数据分析师

我们咬文嚼字的说明下这个介绍啊:

第1句:TableAgent是产品的名称,新AI时代表明大模型出现的AI时代,数据分析智能体是TableAgent的功能介绍。初步判断TableAgent是可以自主做数据分析的智能体。
第2句:DataCanvas Alaya九章元识大模型是九章云极 DataCanvas自主研发的大模型,TableAgent数据分析智能体是基于 DataCanvasAlaya九章元识大模型的。所以TableAgent具备大模型的通用智能,这非常合理

大模型出来后被传说最可以替代的几种行业中,就有数据分析师(也就是我的职业),所以我必须深入了解下TableAgent,这也十分合理

立刻体验

现在点击立刻体验

进入注册环节,正常输入手机号就可以,需要注意的是,我用火狐注册会频繁提示:

在这里插入图片描述

这时可以切换edge浏览器,然后就顺利完成了,注册后,会提示有5次提问环节,次数使用完了,可以认证申请增加次数(每天15次)。
在这里插入图片描述

在这里插入图片描述

跳转后进入如下页面:
在这里插入图片描述

我们先从样例数据集进行快速测试,选择右侧的样例数据集,选择”银行客户流失预警数据集”
在这里插入图片描述

在左侧居中的对话区域会给出数据集的一些可能的分析,点击详情会显示数据集信息,内容如下:

数据中有多少客户,流失客户占比多少?
帮我统计流失客户主要集中在哪些年龄段
在持卡年限达8年以上的客户中,信用评分前10%和后10%的哪个群体流失率比较高?能否画图分析
从不同国家平均存款余额来看,第一名和第二名是否拉开较大差距?
帮我找出德国客诉率最高的卡片类型,画图并说说都有什么差异和建议
我想重点分析一下德国大部分客户收入水平如何,包括收入的最大、最小、平均水平以及不同收入水平的人数等方面,也画下图并说说
不考虑存款为0和流失的客户,客户的存款余额是否呈现明显的长尾分布?
从积分点来看,青年客户是否是主力军?帮忙画个饼状图
按照持卡年限,可以统计每年新增客户量,给出每年新增客户量同比
年龄段划分标准:45岁以下为青年,45-59岁为中年,60岁往上是老年,帮我拉一下每个客户的姓名、性别、国家以及年龄段
在这里插入图片描述

问题测试

问题1:

英语不优秀的数据分析师赶紧让TableAgent解释下数据集的相关字段含义:
请介绍下数据集中各个字段的含义,用中文描述,并描述各个字段的数据范围

返回结果如下:

可以查看到TableAgent对各个字段进行了介绍,点击回复中的详情,能看到TableAgent分析思考的步骤(好家伙,写了一段代码,会写程序的数据分析师):
在这里插入图片描述

经过分析,上面提示的部分问题信息可能不存在与数据表中,如客户的教育水平,原始数据集中并没有,但如果你问这个问题,TableAgent会提示你相关列不存在,如下。

问题2:

根据客户的教育水平,分析客户流失率是否有明显的差异。

返回结果如下:
在这里插入图片描述

这点还是比较严谨的,没有大模型的随意发挥现象,比较符合数据分析需求。

接下来问一个数据探索的问题。

问题3:

根据客户的预计薪资,绘制薪资水平分布,并绘制可视化图标

返回结果如下:
在这里插入图片描述

从结果可以看出,薪资分布没有明显的峰值,说明各个阶段的薪资收入都有大量的人。

接下来问一个数据预测的问题。

问题4:

根据客户的预计薪资,预测不同薪资对银行用户流失的影响。

返回结果如下:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

结果符合预期,点击详情,还可以看到明确的代码,用户可以根据代码自行调整。

最后再问一个让TableAgent发挥的问题,这个问题有一个问题就是需要TableAgent了解相关与因果推断的差别。

问题5:

请你自行对数据集进行探索性分析,并给出影响客户流失权重较大的几个因素,进行因果推断。

返回结果如下:

在这里插入图片描述

返回的结果还是有参考意义的。目前进入到第5个问题后,点击右侧的用量标签,会发现当前用户的剩余使用情况,如下:
在这里插入图片描述

目前剩余用量为0,如果再提问,会提示
在这里插入图片描述

这时可以点击右侧上方的申请认证,然后填下如下表单,认证通过后,会从而增加可使用量。
在这里插入图片描述

经过大约1.5243600=12.96w秒,我收到了验证通过的短信:

【九章云极】您的TableAgent用户认证已审核通过!有效期15天,欢迎您继续使用。
在这里插入图片描述

有了库存,开始继续测试

通用大模型对比分析

下面针对类似的数据分析问题,与国产大模型文心一言chatglm进行比较,看看二者在数据分析方向的比较。

这里提供一个数据集–网约车APP数据集.csv,该数据集为某打车APP,一周内,若干城市,每天,每小时内运营数据,一共840条数据。各列字段具有先后顺序,乘客先冒泡(在APP内输入起点、终点),再呼叫,司机看到呼叫信息后,可以选择应答,之后完成订单。司机在线是分小时统计的,一天之内加总的话可能有重复的情况。
在这里插入图片描述

首先看看大模型是否支持csv文件格式:

对csv数据集的支持比较:

TableAgent对csv格式支持情况测试:

在页面右侧的数据集区域,选择 拖拽文件或点击此处 按钮,可以弹出上传文件框,选择 《网约车APP数据集1.csv》,很容易的把数据集加载完成,选择详情,可以查看数据集的基本情况。

在这里插入图片描述

支持!
下面测试下文心一言。

文心一言对csv格式支持情况测试:

进入文心一眼官网,登录后选择上传文档插件,如下:
在这里插入图片描述

选择下载好的telecom_customer_churn_analysis.csv数据进行上传,提示
在这里插入图片描述

不支持csv格式。

再测试下Chatglm2。

Chatglm2对csv格式支持情况测试:

进入chatglm2官网,登录后选择文档,上传文档,如下:
在这里插入图片描述

选择下载好的telecom_customer_churn_analysis.csv数据进行上传,提示
在这里插入图片描述

好的,数据分析结束,不支持csv格式。

稍等,我再试一试!!!

选择左侧的代码。
在这里插入图片描述

可以看到chatglm2是擅长数据分析的,再选择下方中间的文件夹按钮,弹出的窗口可以选择所有文件,如下:

在这里插入图片描述

选择网约车APP数据集.csv成了,如下:
在这里插入图片描述

数据分析支持测试:

下面开始对比测试。

问题1:

你是一个数据分析师,请对上传的"网约车APP数据集.csv"进行分析,该数据集的解释如下:“该数据集为某打车APP,一周内,若干城市,每天,每小时内运营数据,一共840条数据。各列字段具有先后顺序,乘客先冒泡(在APP内输入起点、终点),再呼叫,司机看到呼叫信息后,可以选择应答,之后完成订单。司机在线是分小时统计的,一天之内加总的话可能有重复的情况。”。请说出对这种数据进行分析的一般流程。

TableAgent返回:
在这里插入图片描述

在这里插入图片描述

Chatglm2返回:
在这里插入图片描述
在这里插入图片描述

.
结果说明:

从结果可以看出,TableAgent的更多返回都是基于代码和特定数据集的,Chatglm2可以通过模型生成流程方案等信息。

问题2:

你是一个数据分析师,请对上传的"网约车APP数据集1.csv"进行分析,分析星期一到星期日的完单数分布情况。

TableAgent返回:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Chatglm2返回:
在这里插入图片描述

结果说明:

从结果可以看出,TableAgent的返回还是清晰的,有数据,也有分析,出现问题的地方是分布情况和下面的详细数据存在不一致的情况,Chatglm2可以采用的沙盒机制,每一个问题不可以等待太久。

再继续测试,把数据重新交给chatglm2,这个过程就不再演示。

问题3:

你是一个数据分析师,请对上传的"网约车APP数据集1.csv"进行分析,分析周一到周日的完单数分布情况。

TableAgent返回:
在这里插入图片描述

在这里插入图片描述

Chatglm2返回:
在这里插入图片描述

在这里插入图片描述

结果说明:

从结果可以看出,TableAgent是按照每天进行的计算,没有按照周一到周日进行分组。Chatglm2的输出应该和数据集是相关的,也给出了对应的解释,但中文显示不够友好。
较好的地方是,两者都给出下一步的分析方向。

问题4:

你是一个数据分析师,请对上传的"网约车APP数据集1.csv"进行分析,按照星期字段进行分组,分析星期这一字段分布情况。

TableAgent返回:
在这里插入图片描述

在这里插入图片描述

Chatglm2返回:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

结果说明:

从结果可以看出,TableAgent是按照呼叫,应答,完单数进行了汇总操作,对司机在线进行了求平均,这点应该是考虑了数据集描述的信息。Chatglm2的这一步骤输出应该与数据集无关了,是提供了对应的代码示例,然后让我们带入对应的数据集。

问题5:

查看不同时间段和城市的完单数分布情况

TableAgent返回:
在这里插入图片描述

在这里插入图片描述

Chatglm2返回:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

结果说明:

从结果可以看出,TableAgent的这个计算还是准确的,可视化的效果也说明了不同时间段与完单数的情况。Chatglm2的输出应该和数据集是无关的,再代码出现错误后,可以给出另外一个代码,觉得有点像大学生答辩,出现错误不要紧,再说一个可行的答案。

好的,就这吧。来一套:
神龙摆尾,黑龙偷心,双龙出海,战龙在田,龙飞凤舞,伏虎降龙,缩龙成寸,龙蛇混杂,龙的传人,龙凤呈祥,龙马精神,望夫成龙,评测结束,打完收工!

在这里插入图片描述

没有比较就没有伤害,目前大模型进行数据分析,TableAgent的确是一个很好的选择。

个人总结与建议:

本文主要完成了TableAgent的注册测试与个人认证,并进行初步测试,在测试中有如下体会:

1.对于不存在的字段分析,TableAgent表现实事求是,可以识别出字段不存在,并且给出反馈。
2.对于从数据中无法得出的因果推断,TableAgent也可以进行说明,可以解释相关与因果推断的差别,没有自行生成结论。
3.在常规问题分析中,点击详情可以看到具体的代码以及数据集,这点保证了数据分析的准确性。

在TableAgent与通用大模型框架进行数据分析方向的对比中,有如下感受:

1.对于数据集的上传方面,TableAgent会更为易用些,上传文件过程清晰,便于操作。
2.在数据集会话保持方面,TableAgent可以长期对数据集的读取,这点比较友好,减少频繁上传数据集的重复操作。
3.在中文支持度方面,TableAgent对中文的支持较为友好,可以绘制出较高可用性的图片。
4.在思维逻辑展示方面,TableAgent更符合数据分析的要求,对数据的转换过程清晰,可信度较高。
5.在对特定数据集的分析流程设计方面,如果TableAgent可以把通用的对话能力与特定的数据集结合起来,那么对数据分析师而言,是一个极大的帮助。


TableAgent是基于DataCanvas Alaya九章元识大模型的产品,有着数据分析垂直领域大模型,和多年的机器学习平台技术加持,TableAgent的易用性和可用性还是很高的。尤其是对于数据分析而言,可以看出具体的数据转换步骤(透明化过程),可以保障数据的准确性,也便于本地调试验证对应的分析结果。可以进行实时的交互式分析(会话式分析)。在不存在的字段分析时,TableAgent有一说一,减少了通用大模型信口开河,然后道歉的弊端,是一个很不错的数据分析产品。
作为数据分析师,有些惶恐也有些期待,但这就是技术的发展吧,不会因为个人而停止,我们只能顺势而起,齐头并进。

下面再附上几张官网的宣传截图,希望使用的朋友同行可以关注下,可以看看有没有自己需求的功能点。

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/243874.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【游戏篇】Scratch之小猴子接水果

【作品展示】小猴子接水果 操作:点击小绿旗,按下键盘左右键控制小猴子移动拿到水果,同时也要躲避炸弹。

Windows汇编调用printf

VS2022 汇编 项目右键 生成依赖项 生成自定义 勾选masm 链接器 高级 入口点 main X86 .686 .model flat,stdcall option casemap:none includelib ucrt.lib includelib legacy_stdio_definitions.libEXTERN printf:proc.data szFormat db %s,0 szStr db hello,0.code main…

Python Socket编程

Python Socket编程 文章目录 Python Socket编程1. 弄懂HTTP、Socket、TCP这几个概念五层网络模型 2. client和server实现通信Socket编程模式指南代码实现 3. socket实现聊天和多用户连接4. socket模拟http请求 1. 弄懂HTTP、Socket、TCP这几个概念 整个计算机网络都是有协议组…

leetcode算法题:省份数量

leetcode算法题547 链接:https://leetcode.cn/problems/number-of-provinces 题目 有 n 个城市,其中一些彼此相连,另一些没有相连。如果城市 a 与城市 b 直接相连,且城市 b 与城市 c 直接相连,那么城市 a 与城市 c 间…

c#按照时间进行数据存储(不用数据库)

概要介绍 按照日期生成文件夹,按照时间生成文件名,存储字符串。 可以用于简单数据记录(如果数据存储考虑格式文本,保存为csv格式) 实现效果 调用方法 SaveText.saveStr("测试字符串"DateTime.Now.ToStrin…

6.3 C++11 原子操作与原子类型

一、原子类型 1.多线程下的问题 在C中&#xff0c;一个全局数据在多个线程中被同时使用时&#xff0c;如果不加任何处理&#xff0c;则会出现数据同步的问题。 #include <iostream> #include <thread> #include <chrono> long val 0;void test() {for (i…

C语言算法~BF算法和KMP算法

各位CSDN的各位你们好啊&#xff0c;今天小赵要给大家分享一个算法方面的知识这个算法也是小赵琢磨了好久&#xff0c;才算把它理明白&#xff0c;今天小赵就用一篇博客带你理明白这个算法——KMP算法。当然再介绍这个算法前&#xff0c;小赵还会介绍一个BF算法和一个函数&…

对多个 App 设计工具组件使用一个回调

当要在App 中提供多种方法来执行某个操作时&#xff0c;在组件间共享回调非常有用。例如&#xff0c;当用户点击按钮或在编辑字段中按下 Enter 键时&#xff0c;App 可以用同样的方式响应。 共享回调的示例 此示例说明如何创建一个 App&#xff0c;其中包含共享一个回调的两个…

数字孪生博物馆解决方案

数字孪生技术在博物馆领域的应用&#xff0c;可以为博物馆提供更丰富的数字化体验&#xff0c;促进文物的保护、展示和教育。以下是数字孪生博物馆解决方案的一些关键组成部分&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&…

vue echart实现横向柱状图颜色渐变、标签右对齐

需求&#xff1a;用echart实现柱状图的横向展示&#xff0c;对指定数据的柱状图进行颜色区分&#xff0c;且对应标签值展示在柱状图右侧&#xff0c;实现文字的右对齐。 主要问题点&#xff1a; 1、柱状图的颜色渐变 通过colorStops设置color渐变的起止颜色&#xff0c; color…

在Linux上安装配置Nginx高性能Web服务器

1 前言 Nginx是一个高性能的开源Web服务器&#xff0c;同时也可以作为反向代理服务器、负载均衡器、HTTP缓存以及作为一个邮件代理服务器。它以其出色的性能和灵活性而闻名&#xff0c;被广泛用于处理高流量的网站和应用程序。本文将介绍在Linux环境中安装Nginx的步骤&#xf…

josef约瑟 静态电压继电器 HWY-41B 19-240V 导轨式安装

HWY-40系列无辅源静态电压继电器 HWY-41A无辅源静态电压继电器 HWY-42A无辅源静态电压继电器 HWY-43A无辅源静态电压继电器 HWY-44A无辅源静态电压继电器 HWY-45A无辅源静态电压继电器 HWY-41B无辅源静态电压继电器 HWY-42B无辅源静态电压继电器 HWY-43B无辅源静态电压继电器 …

【项目管理】CMMI对项目管理有哪些个人启发和思考

导读&#xff1a;本人作为项目经理参与公司CMMI5级评审相关材料准备工作&#xff0c;现梳理CMMI有关知识点&#xff0c;并结合项目给出部分示例参考&#xff0c;以及本人对于在整理材料过程中一些启发和体验思考。 目录 1、CMMI定义 2、CMMI-5级 3、CMMI文档清单 4、示例-度…

多表查询、事务、索引

目录 数据准备 分类 内连接 外连接 子查询 事务 四大特性 索引 数据准备 SQL脚本&#xff1a; #建议&#xff1a;创建新的数据库 create database db04; use db04;-- 部门表 create table tb_dept (id int unsigned primary key auto_increment comment 主键…

如何制作安装“易读、易懂、易操作”的电子版说明书

在当今的数字化时代&#xff0c;电子版说明书已经不再是单纯的技术文档。对于大多数用户来说&#xff0c;电子说明书是他们接触产品或服务的第一个触点&#xff0c;它直接影响到用户对产品或服务的初步印象和后续使用体验。那么&#xff0c;如何制作安装一份“易读、易懂、易操…

基于CNN+数据增强+残差网络Resnet50的少样本高准确度猫咪种类识别—深度学习算法应用(含全部工程源码)+数据集+模型(一)

系列文章目录 基于CNN数据增强残差网络Resnet50的少样本高准确度猫咪种类识别—深度学习算法应用(含全部工程源码)数据集模型&#xff08;一&#xff09; 基于CNN数据增强残差网络Resnet50的少样本高准确度猫咪种类识别—深度学习算法应用(含全部工程源码)数据集模型&#xf…

想速成硬件工程师?请先学这50个电路

要说在电子工程师所有分类里&#xff0c;哪个岗位技术含量极高且不易被淘汰&#xff1f;那毫无疑问自然是硬件工程师&#xff0c;虽然工资略低于软件工程师&#xff0c;但技术在手&#xff0c;永远不怕没饭碗&#xff0c;所以越来越多人选择成为硬件工程师&#xff0c;那么想要…

华为交换机——配置策略路由(基于IP地址)示例

一、组网需求&#xff1a; 汇聚层Switch做三层转发设备&#xff0c;接入层设备LSW做用户网关&#xff0c;接入层LSW和汇聚层Switch之间路由可达。汇聚层Switch通过两条链路连接到两个核心路由器上&#xff0c;一条是高速链路&#xff0c;网关为10.1.20.1/24&#xff1b;另外一…

智能部署之巅:Amazon SageMaker引领机器学习革新

本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 亚马逊云科技开发者社区, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道。 &#xff08;全球TMT2023年12月6日讯&#xff09;亚马逊云科技在2023 re:Invent全球大…

动画制作与动画控制器的使用_unity基础开发教程

动画制作与动画控制器的使用 导入素材创建动画控制器制作人物动画 前面我们讲过2D游戏中环境地图的制作&#xff0c;这里教大家使用动画控制器的使用 导入素材 先导入一下素材 选择window&#xff0c;点击Asset Store 点击Search online 搜索栏输入Sunny&#xff0c;然后回车…