《Kettle保姆级教学-界面介绍》

目录

    • 一、Kettle介绍
    • 二、界面介绍
      • 1.界面构成
      • 2、菜单栏详细介绍
        • 2.1 【文件F】
        • 2.2 【编辑】
        • 2.3 【视图】
        • 2.4 【执行】
        • 2.5 【工具】
        • 2.6 【帮助】
      • 3、转换界面介绍
      • 4、作业界面介绍
      • 5、执行结果

一、Kettle介绍

Kettle 是一个开源的 ETL(Extract, Transform, Load,提取、转换、加载)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment,广泛应用于数据集成、数据清洗、数据迁移等领域。它的名字“Kettle”源自其“装置”功能的含义,即“把各种数据源像水一样提取出来并进行处理”。在2006年被Pentaho公式收购后,重命名为 Pentaho Data Integration(PDI),这个工具能够帮助用户在不同的数据源和目标系统之间进行数据转换、清洗和加载。Kettle 被广泛用于构建数据仓库、数据集成平台等。

二、界面介绍

在这里插入图片描述

1.界面构成

菜单栏:包括【文件(F)】【编辑】【视图】【执行】【工具】【帮助】6个菜单项
在这里插入图片描述

快捷菜单图标栏:从左到右分别为【新建文件】【打开文件】【探索资源库】【保存文件】【使用不同名称保存文件】【视图类型】
在这里插入图片描述

标题栏:显示界面标题名称,欢迎界面的标题为“欢迎!"
在这里插入图片描述

2、菜单栏详细介绍

2.1 【文件F】

在这里插入图片描述

菜单项功能说明
新建 → 转换依次单击【新建】→【转换】菜单项,或使用Ctrl+N快捷键,创建一个转换工程
新建 → 作业(J)依次单击【新建】→【作业(J)】菜单项,或使用Ctrl+Alt+N快捷键,创建一个任务工程
新建 → 数据库连接在转换工程或任务过程中,依次单击【新建】→【数据库连接】菜单项,创建一个数据库连接
打开提供打开现有Kettle文件(如转换、作业等)的功能
打开最近的配置显示最近打开过的文件列表,方便快速重新打开
关闭关闭当前打开的Kettle文件
关闭所有关闭所有打开的Kettle文件
保存保存当前打开的Kettle文件的更改
另存为将当前打开的Kettle文件保存到新的位置或文件名下
打印提供打印当前打开的Kettle文件内容的功能
从XML文件导入从XML格式的文件中导入Kettle对象或配置
导出将当前打开的Kettle文件或对象导出为XML格式或其他指定格式
退出关闭Kettle应用程序
2.2 【编辑】

在这里插入图片描述

菜单项功能说明
撤销撤销上一步对转换或作业所做的更改
新步骤在转换或作业中添加一个新的步骤(具体步骤类型需用户选择)
重做如果之前进行了撤销操作,此选项将允许您重做那一步。但在某些情况下,如果撤销操作不可逆转或没有可重做的步骤,此选项可能不可用
剪切剪切当前选中的步骤或对象,将其移动到剪贴板中,以便在其他位置粘贴
复制所选的步骤到剪贴板将当前选中的步骤或对象复制到剪贴板中,以便在其他位置粘贴相同的步骤或对象
复制文件此功能可能用于复制转换或作业中引用的文件到指定位置,但具体实现可能依赖于Kettle的版本和上下文环境
从剪贴板复制步骤从剪贴板中粘贴之前剪切或复制的步骤或对象到当前位置
复制转换图片到剪贴板将当前转换的图形表示复制到剪贴板中,以便在其他应用程序(如图像编辑器或文档处理器)中粘贴
清除选择取消当前所有选中的步骤或对象的选择状态
选择所有的步骤选择转换或作业中的所有步骤或对象
搜索元数据在转换或作业中搜索特定的元数据,如数据库连接、变量名等
设置环境变量添加或修改环境变量,这些变量可以在转换或作业执行时被引用
显示环境变量显示当前可用的所有环境变量及其值
编辑kettle.properties文件打开并编辑Kettle的配置文件kettle.properties,该文件包含Kettle的全局设置和配置
显示参数(u)显示当前转换或作业中定义的参数及其值。参数可以用于在转换或作业之间传递信息或控制行为
2.3 【视图】

在这里插入图片描述

菜单项功能说明
视图类型选中此菜单项,显示视图类型为Data Integration
放大放大当前转换或作业的图形表示,以便更清楚地查看细节。这通常通过增加图形元素(如步骤和连接线)的大小来实现。
缩小缩小当前转换或作业的图形表示,以便在屏幕上查看更多内容。这通常通过减小图形元素的大小来实现。
等比例将当前转换或作业的图形表示恢复到其原始大小或等比例缩放状态。这有助于在用户进行了放大或缩小操作后恢复到标准视图。
执行结果面板显示或隐藏执行结果面板,该面板用于显示转换或作业执行过程中的输出、错误和日志信息。这对于调试和监控转换或作业的执行非常有用。
2.4 【执行】

在这里插入图片描述

菜单项功能说明
运行执行当前打开的转换或作业。这将启动转换或作业的处理流程,并根据定义的步骤和逻辑执行相应的操作。
Run Options提供运行转换或作业时的附加选项。这可能包括设置并行处理、指定日志级别、定义变量等。用户可以根据需要配置这些选项以影响转换或作业的执行方式。
预览在不实际执行转换或作业的情况下,预览其处理结果。这通常用于查看转换或作业中某个步骤的输出数据,以便在正式运行之前进行验证和调整。
调试(D)进入调试模式,逐步执行转换或作业中的步骤,并查看每个步骤的输入和输出数据。这对于诊断和处理转换或作业中的错误和问题非常有用。用户可以在调试过程中设置断点、单步执行和查看变量值等。
重放®重新执行最近一次成功运行的转换或作业。这通常用于在修改转换或作业后,快速验证其是否按预期工作,而无需从头开始执行整个流程。
校验对转换或作业进行语法和逻辑校验,以确保其没有错误或不一致之处。这有助于在正式运行之前发现并修复潜在的问题。
影响分析分析转换或作业对数据库或其他数据源的影响。这通常用于评估转换或作业执行后可能产生的数据更改、表结构变化等。影响分析有助于用户了解转换或作业的作用范围和潜在后果。
获取SQL对于包含数据库操作的转换或作业步骤,获取其生成的SQL语句。这有助于用户理解步骤如何在数据库级别上执行操作,并进行相应的优化和调整。
显示最近一次的操作显示最近一次执行转换或作业时的操作记录,包括执行时间、状态、日志信息等。这有助于用户跟踪转换或作业的历史执行情况,并快速定位问题所在。
2.5 【工具】

在这里插入图片描述

菜单项功能说明
数据库单击此菜单项,浏览当前工程的数据库连接,或清除缓存
资源库单击此菜单项,探索、导入、导出当前的工程的资源库,或清除共享对象缓东
向导(W)单击此菜单项,在当前工程中,创建数据库连接向导,或复制单表向导,或复制多表向导单击此菜单项
选项打开Kettle的选项对话框,允许用户配置Kettle的全局设置。这些设置包括用户界面偏好、日志记录级别、数据库连接池配置等。
Show plugin information显示有关已安装Kettle插件的信息。
2.6 【帮助】

在这里插入图片描述

菜单项功能说明
显示欢迎屏幕打开Kettle的欢迎屏幕,该屏幕通常包含有关Kettle的简要介绍、最新更新和提示、快速入门指南或教程链接等信息。
Documentation提供对Kettle官方文档的访问。
关于显示有关Kettle版本的信息,包括版本号、发布日期、版权信息、开发者或维护者联系信息等。

3、转换界面介绍

在Kettle欢迎界面中,依次单击【新建】一【转换】菜单项,或使用Ctr+N快捷键,创建【写日志】转换工程。

  • 在【写日志】转换工程中,与欢迎界面不同,在左边的组件区域中,以树形结构的形式,列出了【核心对象】选项卡中所有的类别对象。

  • 例如,单击【输入】对象,系统会列出【输入】对象下所有的组件,选择【CSV文件输入】组件,拖曳至右边的工作区域中,完成【CSV文件输入】组件的创建,如图所示。
    在这里插入图片描述
    在这里插入图片描述
    从左到右分别为

  • 运行工程

  • 暂停运行工程

  • 停止运行工程

  • 预览数据

  • 调试运行的工程

  • 重放转换工程

  • 校验转换

  • 影响分析

  • 获取SQL

  • 选择数据库连接

  • 显示/隐藏执行结果面板

4、作业界面介绍

在Kettle欢迎界面中,依次单击【新建】→【作业(J)】菜单项,或使用Ctrl+Alt+N快捷键,创建【作业1】任务工程。

  • 在【作业1】任务工程中,单击左边的组件区域中的【通用】对象,显示出【通用】对象下所有的组件选择【Start】组件,拖曳至右边的工作区域中,完成【Start】组件的创建,如图所示。【Start】组件创建后即可设置该组件的参数,运行任务。
    在这里插入图片描述
    在这里插入图片描述

从左到右分别为

  • 运行作业
  • 停止运行作业
  • 重放作业工程
  • 获取SQL
  • 选择数据库连接
  • 显示/隐藏执行结果面板

5、执行结果

在这里插入图片描述

转换的【执行结果】面板有【日志】【执行历史】【步骤度量】【性能图】【Metrics】【Preview data】6个选项卡,每个选项卡的具体说明如下。

  • 【日志】选项卡。默认选项,显示转换中的日志信息,这些信息一般包括转换成功、失败、失败的错误提示信息等。

  • 【执行历史】选项卡。显示【转换日志表】【步骤日志表】【日志通道日志表】【Metrics log table】等表的信息。

  • 【步骤度量】选项卡。显示组件一些可以度量的数据信息,如复制的记录行数,读、写记录数等。

  • 【性能图】选项卡。配置转换属性的参数,以便能够有效地重新执行转换。

  • 【Metrics】选项卡。显示有关转换的组件执行时间、读取数据文件时间等指标数据。

  • 【Preview data】选项卡。预览转换的结果数据。

在这里插入图片描述

作业的【执行结果】面板有【日志】【历史】【作业度量】【Metrics】4个选项卡,每个选项卡的具体说明如下。

  • 【日志】选项卡。默认选项,显示执行任务中的日志信息,这些信息一般包括执行任务成功、失败、失败的错误提示信息等。
  • 【历史】选项卡。显示【作业日志表】【作业项日志表】【日志通道日志表】等表的信息。
  • 【作业度量】选项卡。显示组件一些可以度量的数据信息,如执行任务中的结果、原因等信息。
  • 【Metrics】选项卡。显示有关任务的组件执行时间、读取数据文件时间等指标数据。根据实际需求,读者可以查看有关选项的信息,了解任务的执行情况,定位和分析出错的地方,维护和优
    化任务工程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/965188.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot篇

为什么要用Spring Boot Spring Boot 优点非常多,如: 独立运行 Spring Boot 而且内嵌了各种 servlet 容器,Tomcat、Jetty 等,现在不再需要打成 war 包部署到 容器 中,Spring Boot 只要打成一个可执行的 jar 包就能独…

C# 中记录(Record)详解

从C#9.0开始,我们有了一个有趣的语法糖:记录(record)   为什么提供记录? 开发过程中,我们往往会创建一些简单的实体,它们仅仅拥有一些简单的属性,可能还有几个简单的方法,比如DTO等等&#xf…

Page Assist - 本地Deepseek模型 Web UI 的安装和使用

Page Assist Page Assist是一个开源的Chrome扩展程序,为本地AI模型提供一个直观的交互界面。通过它可以在任何网页上打开侧边栏或Web UI,与自己的AI模型进行对话,获取智能辅助。这种设计不仅方便了用户随时调用AI的能力,还保护了…

UE求职Demo开发日志#21 背包-仓库-装备栏移动物品

1 创建一个枚举记录来源位置 UENUM(BlueprintType) enum class EMyItemLocation : uint8 {None0,Bag UMETA(DisplayName "Bag"),Armed UMETA(DisplayName "Armed"),WareHouse UMETA(DisplayName "WareHouse"), }; 2 创建一个BagPad和WarePa…

Django框架丨从零开始的Django入门学习

Django 是一个用于构建 Web 应用程序的高级 Python Web 框架,Django是一个高度模块化的框架,使用 Django,只要很少的代码,Python 的程序开发人员就可以轻松地完成一个正式网站所需要的大部分内容,并进一步开发出全功能…

企业四要素如何用PHP进行调用

一、什么是企业四要素? 企业四要素接口是在企业三要素(企业名称、统一社会信用代码、法定代表人姓名)的基础上,增加了一个关键要素,通常是企业注册号或企业银行账户信息。这种接口主要用于更全面的企业信息验证&#x…

JVM监控和管理工具

基础故障处理工具 jps jps(JVM Process Status Tool):Java虚拟机进程状态工具 功能 1:列出正在运行的虚拟机进程 2:显示虚拟机执行主类(main()方法所在的类) 3:显示进程ID(PID,Process Identifier) 命令格式 jps […

Java 大视界 -- Java 大数据在智慧文旅中的应用与体验优化(74)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

ASP.NET Core中间件Markdown转换器

目录 需求 文本编码检测 Markdown→HTML 注意 实现 需求 Markdown是一种文本格式;不被浏览器支持;编写一个在服务器端把Markdown转换为HTML的中间件。我们开发的中间件是构建在ASP.NET Core内置的StaticFiles中间件之上,并且在它之前运…

2025游戏行业的趋势预测

一、市场现状 从总产值的角度来看,游戏总产值的增长率已经放缓,由增量市场转化为存量市场,整体的竞争强度将会加大,技术水平不强(开发技术弱、产品品质低、开发效率低)的公司将会面临更大的生存的困难。 从…

C++的 I/O 流

本文把复杂的基类和派生类的作用和关系捋出来,具体的接口请参考相关文档 C的 I/O 流相关的类,继承关系如下图所示 https://zh.cppreference.com/w/cpp/io I / O 的概念:内存和外设进行数据交互称为 I / O ,例如:把数…

在https下引用IC卡读卡器web插件

HTTPS (全称:Hypertext Transfer Protocol Secure ),是以安全为目标的 HTTP 通道,在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性 。HTTPS 在HTTP 的基础下加入SSL,HTTPS 的安全基础是 SSL&a…

堆的实现——堆的应用(堆排序)

文章目录 1.堆的实现2.堆的应用--堆排序 大家在学堆的时候,需要有二叉树的基础知识,大家可以看我的二叉树文章:二叉树 1.堆的实现 如果有⼀个关键码的集合 K {k0 , k1 , k2 , …,kn−1 } ,把它的所有元素按完全⼆叉树…

基于单片机的智能安全插座(论文+源码)

1 系统整体方案设计 本课题基于单片机的智能安全插座设计,以STM32嵌入式单片机为主体,将计算机技术和检测技术有机结合,设计一款电量参数采集装置,实现电压、电流信号的数据采集任务,电压、电流和功率在上位机的显示任…

【网络】3.HTTP(讲解HTTP协议和写HTTP服务)

目录 1 认识URL1.1 URI的格式 2 HTTP协议2.1 请求报文2.2 响应报文 3 模拟HTTP3.1 Socket.hpp3.2 HttpServer.hpp3.2.1 start()3.2.2 ThreadRun()3.2.3 HandlerHttp() 总结 1 认识URL 什么是URI? URI 是 Uniform Resource Identifier的缩写&…

导入了fastjson2的依赖,但却无法使用相关API的解决方案

今天遇到了一个特别奇怪的问题&#xff0c;跟着视频敲代码&#xff0c;视频中用到了一个将JSON字符串转为对象的 API&#xff0c;需要引入alibaba的fastjson2相关依赖&#xff0c;我引入的依赖跟视频一样。 <!--视频中给的相关依赖 --> <dependency><groupId&g…

DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求

DeepSeek 的 LLM 推理新方法 DeepSeek 推出了一种创新方法&#xff0c;通过强化学习 (RL) 来提高大型语言模型 (LLM) 的推理能力&#xff0c;其最新论文 DeepSeek-R1 对此进行了详细介绍。这项研究代表了我们如何通过纯强化学习来增强 LLM 解决复杂问题的能力&#xff0c;而无…

Vue Dom截图插件,截图转Base64 html2canvas

安装插件 npm install html2canvas --save插件使用 <template><div style"padding: 10px;"><div ref"imageTofile" class"box">发生什么事了</div><button click"toImage" style"margin: 10px;&quo…

Flink2支持提交StreamGraph到Flink集群

最近研究Flink源码的时候&#xff0c;发现Flink已经支持提交StreamGraph到集群了&#xff0c;替换掉了原来的提交JobGraph。 新增ExecutionPlan接口&#xff0c;将JobGraph和StreamGraph作为实现。 Flink集群Dispatcher也进行了修改&#xff0c;从JobGraph改成了接口Executio…

Unity扩展编辑器使用整理(一)

准备工作 在Unity工程中新建Editor文件夹存放编辑器脚本&#xff0c; Unity中其他的特殊文件夹可以参考官方文档链接&#xff0c;如下&#xff1a; Unity - 手册&#xff1a;保留文件夹名称参考 (unity3d.com) 一、菜单栏扩展 1.增加顶部菜单栏选项 使用MenuItem&#xff…