Zeppelin是一个基于Web的开源数据分析可视化工具,它提供了一个交互式的笔记本界面,用于在大数据环境中进行数据探索、数据分析、数据可视化和协作。Zeppelin的主要特点包括多语言支持、可视化功能、数据共享和协作,以及扩展性。它支持多种编程语言,如Scala、Python、R和SQL,用户可以根据自己的需求选择合适的语言进行分析。同时,Zeppelin提供了丰富的可视化工具和图表库,用户可以通过图表直观地展示和分析数据。此外,Zeppelin还允许用户共享笔记本和运行结果,以便团队成员之间进行协作和交流。
在架构上,Zeppelin采用了一个可插拔的架构,主应用为ZeppelinServer,包含可扩展的模块,如NoteBook存储、解释器以及可视化模块。每个模块都可以根据需求进行扩展,例如,用户可以根据自己的需要为Zeppelin添加数据引擎。
Zeppelin的主要用户包括数据开发者、数据分析师和产品运营人员。数据开发者可以使用Zeppelin与Spark、Hive、SQL等工具进行数据清洗和数据集成的工作;数据分析师则可以使用SQL、PySpark、R等语言进行数据分析探索;产品运营人员则可以通过Zeppelin查看报表。
目前,Zeppelin已成为Apache的顶级开源项目,并在许多企业和项目中得到了广泛应用。其强大的功能、灵活性和易用性使其成为数据科学家、分析师和开发人员进行数据分析和可视化的理想工具。
下载安装包:
这里用的是0.10.0版本官网下载https://dlcdn.apache.org/zeppelin/zeppelin-0.10.0/
阿里云下载https://mirrors.aliyun.com/apache/zeppelin/zeppelin-0.10.0/?spm=a2c6h.25603864.0.0.317915abLU7UUS(推荐阿里云,官网太慢)
解压缩: tar -zxvf zeppelin-0.10.0-bin-all.tgz -C /opt/module/
配置:在conf目录下
sudo cp zeppelin-env.sh.template zeppelin-env.sh
sudo cp zeppelin-site.xml.template zeppelin-site.xml
1、sudo vim zeppelin-env.sh
2、sudo vim zeppelin-site.xml
将zeppelin.server.addr配置项修改为0.0.0.0,这样子其他机器才可以访问该zeppelin界面。
端口号修改为不跟其他端口冲突,自己易记的就行
再启动
浏览器访问控制台
访问开写
更详细可以参考以下链接
Zeppelin安装与使用教程_厦大数据库实验室博客 (xmu.edu.cn)
Zeppelin安装与配置-腾讯云开发者社区-腾讯云 (tencent.com)