对比测评3款BI分析工具

前不久,一位准备入职阿里的学弟问我,他要做电商数据分析,电商有庞杂的标签、模型、数据和业务逻辑,菜鸟应该要具备什么样的分析能力啊?

我看了他的岗位职责,主要是负责经营决策支持、专题分析和数据看板搭建,对代码算法涉及很少,更适合用BI工具来构建业务-数据-洞察的闭环场景。

BI工具是一类专注于数据驱动业务的分析工具,集合了模型开发、可视化、报表设计、实时分析、汇报展示等功能,部分还涉及到数仓、ETL,通俗点说就是数据“变现”的一站式服务。

目前市场上可选择的BI很多,像Tableau、Power BI、FineBI、永洪BI、网易有数、Superset等都是较受欢迎的BI产品。

其中Tableau、Power BI是国外BI,也算家喻户晓了,FineBI等是国内的后起之秀,Superset是Airbnb的开源BI。

如何选一个合适的BI分析工具?考虑到市场普及度和学习性价比,我觉得Tableau、Power BI、FineBI这三款主流BI应用比较值得花心思去学习,工作中用得更多。

结合我之前使用的心得,我又特地花了大半天去评测了这三款BI,通过搭建一个完整的仪表板,来比较易用性、数据源支持、分析建模、可视化搭建、分享汇报、市场普及度等各方面指标。

1、认识和使用BI数据工具

首先简单介绍下出场的三位BI选手。

  • Tableau:

以可视化著称的BI领域老大哥,看板制作非常精美。它诞生于斯坦福大学,后来被saleforce收购,听说现在在国内由阿里代理提供服务。

  • PowerBI:

微软的BI产品,数据处理和建模能力非常强大,当然DAX函数也非常难学。基于Excel生态,PowerBI的打通性比较好,积累了大量用户。

  • FineBI:

能力全面,容易上手,可以在浏览器上进行自助分析。比较了解国内用户使用习惯,更适合国内企业的数据应用环境,听说FineBI的国内市占率排第一。

现在FineBI更新到了6.0版本,有许多新的功能,比如DEF函数、多维智能分析、协同编辑、血缘分析等。总得来说,不管从分析能力、便捷程度、协同合作等都有了很大的进步,对个人自助分析更加友好。

对很多初学者来说,以为BI就像Excel一样,功能就是做做表画画图。

其实不然,使用BI工具有一套完善的流程,目地是构建一套数据看板,就像产品开发一样。

BI和Excel最大的不同在于,Excel是个人的数据处理表格,适用于小规模数据的加载、分析、展示;而BI是基于数据库的一站式数据-业务分析平台,偏向于业务信息挖掘。

我把BI开发过程分为认识数据、连接数据、处理数据、分析数据、可视化表达、看板制作,共6大步。

最终目的是实现对业务的支持、洞察、驱动,这是数据分析的核心,不然前面的工作都是花架子。

比如说我在FineBi上看到的一个例子,基于电商超市业务搭建的配送分析、商品分析、利润分析、退货分析、客户分析全场景看板,可以及时发现经营数据变化,快速制定决策。

作者基于电商超市业务绘制了BI系统架构,然后针对其中每一个业务场景开发数据指标和报表。

我觉得这就是能为业务带来价值的BI分析,上面只是案例之一,大家可以去FineBI文档看详细资料。

2、如何连接数据源

BI工具基本上都支持多维度的数据源,比如Excel、文本数据、数据库、大数据、云平台等。

  • Excel就是大家最常用的xlsx、xls文件,估计也是个人连接数据最多的数据源。

  • 文本数据源包括CSV、TXT、JSON、XML等。

  • 数据库包括MySQL、Oracle、SQLServer、Access、MongoDB等,既有关系型数据库,也有非关系型数据库。

  • 大数据主要是Spark、Hadoop、Presto等。

  • 云平台支持像阿里云、华为云、腾讯云、AWS等各种云数据平台。

针对上述常规的数据源,Tableau、Power BI、FineBI都会支持。

相比较Power BI,Tableau和FineBI支持的数据源更加丰富,比如JDBC驱动(阿里云Maxcomputer)、SAP BW、Essbase等。

FineBI对国内云数据的支持更加到位,还支持一些Java API,可以灵活地进行数据连接。

三个BI产品连接数据源的方法都很简单,且操作数据库方法也类似。

  • Tableau

  • PowerBI

  • FineBI

以FineBI为例连接MySQL


具体的连接方法可以查看相应BI文档

https://help.fanruan.com/finebi/doc-view-94.html
https://learn.microsoft.com/zh-cn/power-bi/connect-data/desktop-quickstart-connect-to-data
https://help.tableau.com/current/guides/get-started-tutorial/zh-cn/get-started-tutorial-connect.htm

3、如何处理数据

数据导入完成后就需要对数据进行处理,虽然BI并不承担ETL功能,也很难进行复杂的数据处理,但是像筛选、过滤、分组、排序、合并、类型转换等基础功能还是要具备的。

数据处理是BI分析的重中之重,需要重视起来。因为建模分析、可视化表达都需要进行数据处理,很少有现成的数据让你用。

Tableau、Power BI、FineBI在基础的数据处理能力上表现都很好,主要差异体现在交互界面的易用性上。

Tableau有专门的Prep工具用对数据进行ETL,也可以在Desktop上进行简单的数据处理。


PowerBI则接近Excel的界面,通过Power Query进行数据调整转换,需要一定的学习成本。

FineBI数据处理是这三者中最容易上手的,通过完善的数据编辑功能,让分析师自己能轻松处理清洗数据。

编辑数据可实现新增列,分组统计,过滤,排序, 上下合并,左右合并、自循环列、行列转换等功能,而且界面比较简洁,一目了然。

比如说实现分组功能,通过菜单的分组按钮可实现自定义分组。

image.png

PowerBI和Tableau很多基础的数据处理都需要DAX和LOD函数实现,但是FineBI提供的编辑数据功能能覆盖大部分需求,更容易入手。

当然FineBI也提供了大量的函数用于复杂的数据处理,能满足各种分析需求。

我对比了下FineBI和Tableau函数,其实FineBI在函数的使用上反而更简洁,而且FineBI最新增加的DEF函数也可以处理更加复杂的分析。

DEF函数的语法是:

def(指标, [维度1,维度2,...], [过滤条件1, 过滤条件2,...])

它以函数中维度作为分组、函数中过滤条件进行过滤,实现对指标的计算,在组件的计算中使用。

比如说针对以下表,设计相应的计算。

该表是分城市不同车型的销售情况。

案例一:计算不同车型A城市的总销售额,不区分月份。

使用FineBI,新建计算字段,DEF公式可以输入:

DEF(SUM_AGG(${销量}*${单价}),[${车型},${城市}],[${城市}="A"])

只需一行代码便可以计算出A城市分车型销售额,非常简单。

因为DEF是定义静态指标,所以只规定计算了城市、车型维度的销售额,不支持去钻取计算分月汇总。

这样的计算在Tableau需要用到if判断函数和FIXED表达式:

if [城市]='A' then { FIXED [城市],[车型]:sum([单价]*[销量])} end

这一点上FineBI和Tableau代码复杂度差不多,但DEF似乎更加简洁,它把判断语句也集成到DEF中。

案例二:计算A城市的销售额,可动态汇总车型、月份等。

这里和案例一的区别在于,案例二不光只汇总城市、车型字段,而且根据视图情况,动态汇总其他类别字段。

在FineBI中需要用DEFADD函数,可以定义动态指标,输入:

DEF_ADD(SUM_AGG(${销量}*${单价}),[${城市}],[${城市}="A"])

对于动态指标,在FineBI中能支持钻取计算,选择区域维度中的±即可实现钻取聚合。

这一点是非常强大的,我们可以通过自定义维度+动态维度的结合,能实现任何逻辑的聚合。

Tableau实现该功能则通过if判断和INCLUDE表达式:

if [城市]='A' then { INCLUDE [城市]:sum([单价]*[销量])} end

除此之外,FineBI中还有个动态函数DEF_SUB,即排除某特定维度的动态聚合。

这个在Tableau对应的表达式是EXCLUDE,使用方法和上面案例一致。

综上对于复杂函数计算,FineBI和Tableau都有相应的解决方案,且使用复杂度相差无几,FineBI把判断语句集成到DEF中则更为简洁易懂。

4、如何分析数据

当数据按照需求处理完成后,就需要进行数据分析来提取关键信息。

BI中的分析能力主要指统计计算、OLAP、趋势判断、预测建模、对外接口等。

统计计算很好理解,就是数据的聚合、同环比、排序、累计等等。

BI工具都会提供基础的统计计算快捷方式,覆盖常用的需求。

  • Tableau

  • FineBI

OLAP是联机处理分析,主要包括钻取、分组、透视、联动、切片、切块等分析操作,是BI的主要功能。

Tableau可以连接到OLAP多维数据集,以便在最深层次上探索数据。向下钻取、数据过滤和自动生成时间序列功能可作为深入了解这些多维数据集以及访问数据洞察所需的工具。

PowerBI 通过SQL服务器连接到OLAP数据集,它提供了要在报告中显示的数据度量列表。在创建报告时,所选维度和可视化选项一起显示。

FineBI也 提供了多种OLAP 功能:数据钻取、跳转、联动、使用过滤组件、Tab组件、文本组件、图片组件、Web组件、参数。

从计算能力来看,Tableau更胜一筹,但PowerBI、FineBI也没什么大的短板,听说FineBI的Spider 引擎很快,OLAP组件也更加多元。

预测建模是针对历史数据的模型分析,比如回归、分类、聚类等,这是BI的一大亮点。

基本上Tableau、PowerBI、FineBI中都有主流的预测函数,比如Tableau中的MODEL_QUANTILE、MODEL_PERCENTILE。

另外还支持连接Python、R进行建模分析,FineBI、PowerBI比较容易实现,Tableau需要安装插件麻烦一些。

除了预测建模,FineBI具备优势的一点在于集成了很多商业模型,可以用数据分析中,比如RFM、AARRR等。

如下是在FineBI中搭建RFM模型:

综上,Tableau、PowerBI、FineBI在分析能力上不相伯仲,可能Tableau、PowerBI对复杂模型支持和软件性能上稍领先,但是FineBI集成了很多拿来即用的模型,而且对现实工作更具指导意义。

5、可视化和看板制作

可视化表达就是将数据变成能说话的图表,让观众一目了然,知道你用数据表达了什么观点。

BI制作看板的步骤是先制作单个图表,然后拼接成看板。

可视化遵循的逻辑层次是:工作表——看板。最基础的单元是工作表,工作表不同于excel的work sheet,而是相当于excel上的一个图,或BI上的一个视觉对象,是最小的可视化单元(文字、图片除外)。

第二级是看板,看板是多个工作表在同一画布上的集合。看板包括图表、表格、组件、文字等,通过钻取/联动/筛选的操作对数据进行主题级别的分析。

前面我们也说过,Tableau可视化能力最强,图表也更美观。其图表配色、结构、渲染非常适合商业分析,小白也能做出高大上的看板。

PowerBI比较微软风,说不上好看,但中规中矩,现在也在慢慢变好。

要说国内大屏,不要错过FineBI,你见过所有的看板、大屏、报告,FineBI都能搞定。


而且FineBI也能轻松搞定分析报告:

从3个BI的可视化组件来看,基本都能完成大多数可视化图表。

  • Tableau

  • PowerBI

  • FineBI

从图表丰富度看,Tableau相对最多,FineBI次之,PowerBI原生图表差一些,但有插件补充。

FineBI和Tableau的图表搭建都相对简易,都是基于图形语法(The Grammar Of Graphics)设计,以“形状“和对应的“颜色“,“大小“,“提示“,“标签“等属性进行图表类型替代。

以FineBI为例 ,用户可在 图形属性、图形组件样式 中设置图表的颜色、标签、图例、网格线、背景等属性。

图表组件存在多个指标字段时,每个指标字段的图形属性是可以单独设置的。

小结

对比Tableau、PowerBI、FineBI三款主流BI工具,有以下几点:

Tableau更加适合对可视化要求较高的专业数据分析师,因为其更灵活,适合做数据探索。但是价格较贵,操作更符合国外用户习惯,一些布局调整不够友好。

PowerBI功能上面还是很强大的。可以连接的数据源比较丰富,数据分析建模能力也很强大。不过界面比较传统,用起来不熟悉的人稍微有点费劲,学习成本会比较高。

FineBI非常适合企业搭建业务报告和看板,轻松制作和分享管理,而且性能速度、建模能力、可视化能力、服务能力都相对较强。

我现在用的最多的是FineBI和Tableau,公司和个人大大小小的看板、报告都是基于FineBI进行搭建,基于其成熟的组件进行BI开发,省了很多事。Tableau则会用来做一些可视化设计的工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/630826.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入剖析Tomcat(八) 载入器与打破双亲委派机制的自定义类加载器

写这篇文章让我头大了好几天,书中描述的内容倒是不多,可能也是那会Tomcat的现状。如今Tomcat发展了好多代,加上springboot的广泛应用,导致现在的类加载的步骤和Tomcat资料中描述的大相径庭。可能也是由于微服务的发展,…

903. 昂贵的聘礼[dijsktra堆优化版]

题目描述 年轻的探险家来到了一个印第安部落里。 在那里他和酋长的女儿相爱了,于是便向酋长去求亲。 酋长要他用 10000 个金币作为聘礼才答应把女儿嫁给他。 探险家拿不出这么多金币,便请求酋长降低要求。 酋长说:”嗯,如果你能够…

【C++】学习笔记——多态_1

文章目录 十二、继承8. 继承和组合 十三、多态1. 多态的概念2. 多态的定义和实现虚函数重写的两个特殊情况override 和 final 3. 多态的原理1. 虚函数表 未完待续 十二、继承 8. 继承和组合 我们已经知道了什么是继承,那组合又是什么?下面这种情况就是…

【开发】模型部署笔记

目录 模型量化 模型量化 1、模型量化优点 低精度模型表示模型权重数值格式为FP16(半精度浮点)或者INT8(8位定点整数),但是目前低精度往往就指代INT8。常规精度模型则一般表示模型权重数值格式为FP32(32位…

从RTTR谈Reflection机制

虽然C11引入了RTTI、Metaprogramming 等技术,但C在Reflection编程方面依旧功能有限。在社区上,RTTR则提供了一套C编写的反射库,补充了C在Reflection方面的缺陷。 零、环境 操作系统Windows 11Visual StudioVisual Studio Community 2022 CMa…

使用JasperReport工具,生成报表模版,及通过JavaBean传参,常见问题及建议

1.下载JasperReport工具 下载地址:社区版 - Jaspersoft 社区 邮箱:lorettepatri.ckoa5434gmail.com 密码:Zx123456. 2.工具使用方法注意 1.一次参数需要在左下角Parameters中新建,直接拖转右上角的TextField不会自动新建参数,到头来还是要在Parameters中新建 2.循环参数需…

实在智能AI+RPA:引领数字化转型的超自动化智能体

引言 在数字化时代,企业面临着前所未有的挑战和机遇。数字化转型不仅是企业生存的需要,更是实现持续增长和创新的关键。AIRPA作为数字化转型的重要驱动力,正帮助企业实现业务流程的自动化和智能化,从而提升效率、降低成本、增强竞…

做抖店的门槛高吗?一个月的时间能入门吗?基础问题解答如下

我是王路飞。 抖店,依旧是普通人做抖音最好的渠道,没有之一,依旧值得我们all in。 这是我对2024年抖音小店的看法和态度, 那么做抖店的门槛高吗?新手用一个月的时间能做到入门吗?投入和回报的数据是多少…

【MySQL数据库开发设计规范】之SQL使用规范

欢迎点开这篇文章,自我介绍一下哈,本人姑苏老陈 ,是一名JAVA开发老兵。 本文收录于 《MySQL数据库开发设计规范》专栏中,该专栏主要分享一些关于MySQL数据库开发设计相关的技术规范文章,定期更新,欢迎关注&…

时间序列预测:探索性数据分析和特征工程的实用指南

时间序列分析是数据科学和机器学习领域最广泛的主题之一:无论是预测金融事件、能源消耗、产品销售还是股票市场趋势,这一领域一直是企业非常感兴趣的领域。 随着机器学习模型的不断进步,使除了传统的统计预测方法(如回归模型、ARIMA模型、指数平滑)外&a…

结合多模态 AI 谷歌展示 AR 眼镜原型机;Meta 被曝开发带摄像头的 AI 耳机丨 RTE 开发者日报 Vol.204

开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「…

(实测验证)【移远EC800M-CN 】TCP 透传

引言 本文章使用自研“超小体积TTL转4GGPS集成模块”进行实测验证; 1、配置移远EC800M-CN TCP 透传 串口助手发送: ATQIOPEN1,0,"TCP","36.137.226.30",39755,0,2 //配置服务器地址和端口号; 4G模组返回…

C++(week3):数据结构与算法

文章目录 (十一) 常用数据结构1.动态数组(1)模型(2).h与.c(3)实现 2.链表(1)模型(2)分类(3)基本操作(API)(4)实现(5)链表常见面试题(6)空间与时间 3.栈(1)模型(2)基本操作(3)实现(4)栈的应用 4.队列(1)模型(2)基本操作(API)(3)实现(4)队列的应用 5.哈希表(1)哈希表的提出原因(2…

Qwen 开源标杆

Qwen的博客 在线体验Qwen开源版本、非常丝滑 不算量化、已经开源的Qwen1.5 版本有9个: 0.5B、1.8B、4B、7B、14B、32B、72B、110B、MoE-A2.7B 闭源已经发展到 Qwen-Max-0428、网页端从2.1升级到2.5 Qwen API详情 一些记录: 1、Qwen1.5 110B&#x…

echart树状图图表

根据后端返回的树状结构&#xff0c;渲染echart树状图&#xff0c;并且默认二级节点后是折叠的 父级引入组件 .tree_chart {width: 100%;height: calc(100% - 30px);}<div class"tree_chart"><EachartTree :treeData"allData.treeData" /><…

conan2 基础入门(02)-安装

conan2 基础入门(02)-安装 文章目录 conan2 基础入门(02)-安装⭐前言⭐安装python安装安装包安装自行操作 ⭐验证配置环境变量命令行验证conan配置文件 END ⭐前言 Conan 2.0: C and C Open Source Package Manager 官方提供三种安装conan的方式。分别为&#xff1a; Recommen…

哈希表的理解和实现

目录 1. 哈希的概念 (是什么) 2. 实现哈希的两种方式 (哈希函数) 2.1. 直接定址法 2.2. 除留余数法 2.2.1. 哈希冲突 3. 补充知识 3.1. 负载因子 3.2. 线性探测和二次探测 4. 闭散列实现哈希表 (开放定址法) 4.1. 开放定址法的实现框架 4.2. Xq::hash_table::insert…

【数组中重复的数据】leetcode,python

和上题一样&#xff0c;【找到所有数组中消失的数字】 换个判断条件就行 class Solution:def findDuplicates(self, nums: List[int]) -> List[int]:nlen(nums)for i in nums:x(i-1)%nnums[x]n#只需要替换条件即可return [i1 for i,num in enumerate(nums) if num>(2*n)…

(1)医疗图像处理:MRI磁共振成像-基本原理--(杨正汉

一、基本原理 1.组成 对应了解 1&#xff09;主磁体&#xff1a; 基本构建&#xff0c;用于产生磁场&#xff0c;主要有两种方式产生磁场永磁&#xff08;磁铁&#xff09;、电磁&#xff08;给线圈通电&#xff09;。MR按主磁场的场强分类主要有四类&#xff0c;分类的原因…

有什么比较方便的裁剪图片软件?7个软件教你轻松裁剪图片

有什么比较方便的裁剪图片软件&#xff1f;7个软件教你轻松裁剪图片 以下是七款比较方便的裁剪图片软件&#xff0c;它们可以帮助您轻松裁剪图片&#xff1a; 图片编辑助手&#xff1a;作为图像处理领域的佼佼者&#xff0c;这款软件提供了多种裁剪工具和功能。您可以使用其…