一、简介
- 官方地址:https://github.com/alibaba/DataX/blob/master/userGuid.md
二、系统要求
- Linux
- JDK(1.8以上,推荐1.8)
- Centos7.9的java1.8安装命令:yum install java-1.8.0-openjdk.x86_64
- Python(2或3都可以)
- Apache Maven 3.x (Compile DataX)
三、部署
- 下载工具包:https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz
- 我的部署环境:Centos7.9
# 1.下载后,任意文件夹下可以解压,我解压到/data/
tar -zxvf datax.tar.gz -C /data
# 2.运行自检脚本
python /data/datax/bin/datax.py /data/datax/job/job.json
- 解压后文件夹作用:
- bin:包含可执行的命令文件,用于启动和运行 DataX 工具。
- conf:存放配置文件,包括数据源配置、作业配置等,用户可以在这里进行配置以定义数据传输任务的参数和规则。
- job:存放数据传输的作业配置文件,每个作业对应一个 JSON 或者其他格式的配置文件,描述了数据抽取、转换、加载等任务的具体流程和规则。
- lib:存放 DataX 运行所需的依赖库文件,包括一些数据源的驱动程序、插件等。
- plugin:存放数据源相关的插件,例如数据库插件、文件系统插件等,用于支持不同类型数据源的数据传输。
- script:存放 DataX 的执行脚本文件,用于启动 DataX 工具并执行数据传输任务。
- tmp:临时文件夹,可能会用于存放临时生成的数据或者中间结果。