[Kettle] 字段处理

1.增加常量

常量是指在计算机程序运行过程中其值不能改变的量

常量可以是任何的数据类型,例如,圆周率"3.141159"、中国首都"北京"等都可以是常量

增加常量是指在数据中增加一个字段,并给字段设置一个固定的值

数据源

2018年上学期期末考试成绩(Kettle数据集9).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537342?spm=1001.2014.3001.5501需求:为了方便统计学生考试的平均分数,需要在某年级的"2018年上学期期末考试成绩.xls"文件中,使用增加常量组件,增加"考试课程数"字段,并设置值为"6"

1.1 建立【增加常量】转换工程

使用Ctrl+N快捷键,创建【增加常量】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末考试成绩.xls"文件,预览数据,如下图所示,没有"考试课程数"字段

在【增加常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,在【核心对象】选项卡中,选中【增加常量】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【增加常量】组件,建立节点连接,如下图所示

1.2 设置【增加常量】组件参数

双击【增加常量】组件,弹出创建【增加常量】对话框,如下图所示

【增加常量】组件有关参数说明如下表所示

参数名称说明
步骤名称

表示增加常量组件名称,在单个转换工程中,名称必须唯一

默认值为【增加常量】组件名称

名称表示增加常量的字段名称,默认值为空
类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

格式

表示转换时,原始字段格式的可选掩码。使用公共有效日期和数字格式的信息,请参阅有关公共格式参考书

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
当前的表示是否对当前记录处理,默认值为空
10进制的表示数字类型字段是否为10进制,默认值为空
分组表示数值分组符号,一般使用","英文逗号,默认值为空
表示增加常量字段的值,默认值为空
设为空串表示是否设为空字符串,默认值为空

在【增加常量】对话框中,因为学生考试课程数都是一样的,所以增加"考试课程数"字段,并设置值为"6",操作步骤如下

(1) 确定组件名称,保留【增加常量】默认值为"增加常量"

(2) 设置增加常量的字段参数,对【字段】参数进行设置

此时完成【增加常量】组件参数的设置如下图所示

1.3 预览结果数据

在【增加常量】转换工程中,单击【增加常量】组件,再单击工作区上方的"预览这个转换"图标,预览增加常量后的数据,如下图所示

2.将字段值设置为常量

增加常量是增加字段,并给该字段赋值,与增加常量类似,将字段值设置为常量,是对现有的字段,重新赋一个新的固定值

数据源

2018年上学期期末语数英考试成绩(Kettle数据集10).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537546?spm=1001.2014.3001.5501需求:为了统计课程考试的平均分数,需要在"2018年上学期期末语数英考试成绩.xls"文件中,对其中数据为空的"基础课程数"字段,采用将字段值设置为常量组件,设置"基础课程数"字段的数据为"3",表示语文、数学和英语等3门基础课程数

2.1 建立【将字段值设置为常量】转换工程

使用Ctrl+N快捷键,创建【将字段值设置为常量】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末语数英考试成绩.xls"文件,预览数据,如下图所示,发现"基础课程数"数据为<null>

在【将字段值设置为常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【将字段值设置为常量】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【将字段值设置为常量】组件,建立节点连接,如下图所示

2.2 设置【将字段值设置为常量】组件参数

在【将字段值设置为常量】转换工程中,双击【将字段值设置为常量】组件,弹出创建【将字段值设置为常量】对话框,如下图所示

【将字段值设置为常量】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示将字段值设置为常量组件名称,在单个转换工程中,名称必须唯一

默认值为【将字段值设置为常量】组件名称

在常量中使用变量表示常量是否使用变量的值,默认值为空
名称表示将字段值设置为常量的字段名称,默认值为空
值替换表示替换数据的值,默认值为空

转换掩码(对日期型)

表示转换时,对于日期型字段,采用的可选掩码。有关使用的公共有效日期和数字格式的信息,请参阅有关公共格式参考书

默认值为空

设为空串

表示是否设置为空串,选项为:是、否

默认值为空

在【将字段值设置为常量】对话框中,对于所有的考生,基础课程数都是3门,将"基础课程数"字段设置为"3",步骤如下

(1) 确定组件名称,保留【将字段值设置为常量】参数默认值"将字段值设置为常量"

(2) 设置将字段值设置为常量的字段参数,对【字段】表参数进行设置

此时完成【将字段值设置为常量】组件参数的设置如下图所示

2.3 预览结果数据

在【将字段值设置为常量】转换工程中,单击【将字段值设置为常量】组件,再单击工作区上方的"预览这个转换"图标,预览将字段值设置为常量后的数据,如下图所示

3.剪切字符串

字符串(String)是由数字、字母和下划线等组成、由一对英文双引号或单引号包括起来的用于表示文本的数据类型

剪切字符串,就是在字符串中,去除多余的内容,保留需要的内容,例如在"Hello,World!"字符串中,只保留"Hello",而剪除其余部分

数据源

2018年12月月考成绩(Kettle数据集11).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537857?spm=1001.2014.3001.5501需求:为了简化数据,需要在"2018年12月月考考试成绩.xls"文件中,采用剪切字符串组件,使"考试时间"字段只保留年月的数据

3.1 建立【剪切字符串】转换工程

使用Ctrl+N快捷键,创建【剪切字符串】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年12月月考考试成绩.xls"文件,注意在设置字段参数中,"考试时间"字段由"Date"日期型设置为"String"字符串类型,格式设置为"yyyy-MM-dd HH:mm:ss",以便进行字符串剪切,如下图所示

预览数据,如下图所示,发现当前数据中,"考试时间"字段数据为完整的年月日和具体时间 

在【剪切字符串】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【剪切字符串】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【剪切字符串】组件,建立节点连接,如下图所示

3.2 设置【剪切字符串】组件参数

双击【剪切字符串】组件,弹出创建【剪切字符串】对话框,如下图所示

【剪切字符串】组件的有关参数说明如下表所示

参数名称说明

步骤名称

表示剪切字符串组件名称,在单个转换工程中,名称必须唯一

默认值为【剪切字符串】组件名称

输入流字段要剪切的字段名称,默认值为空
输出流字段剪切后的新字段名称,默认值为空
起始位置表示剪切的起始位置,位置从0开始计算,默认值为空
结束位置表示结束对字符串剪切的位置,默认值为空

在【剪切字符串】对话框中,月考的考试时间只需保留年月即可,步骤如下

(1) 确定组件名称,保留【剪切字符串】参数为默认值"将字段值设置为常量"

(2)  设置要剪切的字符串字段的参数,对【要剪切的字段】参数进行设置

此时完成【剪切字符串】组件参数的设置如下图所示

3.3 预览结果数据

在【剪切字符串】转换工程中,单击【剪切字符串】组件,再单击工作区上方的"预览这个转换"图标,预览剪切字符串后的数据,如下图所示 

4.拆分字段

数据源

系统操作日志(Kettle数据集12).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88538593?spm=1001.2014.3001.5501需求:为了方便浏览日志内容,需要在某软件系统的操作日志"系统操作日志.xls"文件中,采用拆分字段组件,从日志内容中拆分出用户ID、操作时间、操作内容和IP地址字段,并对应到相关的数据

4.1 建立【拆分字段】转换工程

使用Ctrl+N快捷键,创建【拆分字段】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"系统操作日志.xls"文件,预览数据,如下图所示,只有一个"系统日志"字段,内容显得很乱

在【拆分字段】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【拆分字段】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【拆分字段】组件,建立节点连接,如下图所示

4.2 设置【拆分字段】组件参数

双击【拆分字段】组件,弹出创建【拆分字段】对话框,如下图所示

【拆分字段】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示拆分字段组件名称,在单个转换工程中,名称必须唯一

默认值为【拆分字段】组件名称

需要拆分的字段表示要拆分字段的名称,默认值为空
分隔符

表示确定字段的分隔符

特殊字符(如CHAR ASCII HEX01)可以用$[value]格式设置,如$[01]或$[6F,FF,00,1F]

默认值为","英文逗号

Enclosureignore delimiters within paris enclosure(leave blank of none)
字段

表示拆分的新字段名称,使用【字段】表,设置新字段参数。对于新字段,必须定义字段名称、数据类型和其他属性

默认值为空

新的字段表示拆分出的新的字段名称,默认值为空

ID

表示给拆分出新字段的ID编号,方便移除字段时使用,默认值为空

移除ID?

表示是否要移除该编号的的字段,选项有Y、N

默认值为空

类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
格式

表示转换时,原始字段格式的可选掩码

默认值为空

分组符号

表示数值分组符号,一般使用","英文逗号表示

默认值为空

小数符号

表示小数点符号,一般使用"."英文点号

默认值为空

货币符号

表示货币符号,例如"¥","$","€"等货币符号

默认值为空

Nullif

表示Nullif名称,默认值为空
缺省表示缺省值,默认值为空

去除空格类型

表示去除空格的类型,选项有不去掉空格、去掉左空格、去掉右空格、去掉左右两端空格

默认值为不去掉空格

在【拆分字段】对话框中,设置参数,从操作日志数据中分拆出用户ID、操作时间、操作内容和IP地址等字段数据,步骤如下 

(1) 设置【拆分字段】组件名称,【步骤名称】参数保留默认值"拆分字段"

(2) 确定需要拆分的字段名称以及内容分隔符,【需要拆分的字段】参数设置为"系统日志";保留【分隔符】默认值","英文逗号

(3) 设置拆分后新字段参数,对要拆分的字段参数进行设置,【新的字段】【移除ID?】【类型】参数的设置如图所示,【去除空格类型】参数统一设为"不去掉空格"

此时完成【拆分字段】组件参数的设置如下图所示

4.3 预览结果数据

在【拆分字段】转换工程中,单击【拆分字段】组件,再单击工作区上方的"预览这个转换"图标,预览拆分字段后的数据,如下图所示

5.数值范围

数值范围是给定下限和上界数值的区间范围,划分出多个数值范围

数据源

2019年10月月考英语成绩(Kettle数据集5).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88529906?spm=1001.2014.3001.5501需求:为了解学生分数的分布情况,需要在"2019年10月月考英语成绩.xls"文件中,使用数值范围组件,对英语分数划分范围,以便统计各范围区间的人数:小于80分、80~90分、90~100分、100~110分、100~120分、120~130分、130~140、140~150分、150分满分

5.1 建立【数值范围】转换工程

使用Ctrl+N快捷键,创建【数值范围】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2019年10月月考英语成绩.xls"文件,预览数据,如下图所示

在【数值范围】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【数值范围】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【数值范围】组件,建立节点连接,如下图所示 

5.2 设置【数值范围】组件参数

双击【数值范围】组件,弹出【数值范围】对话框,如下图所示

【数值范围】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示数值范围的组件名称,在单个转换工程中,名称必须唯一

默认值为【数值范围】的组件名称

输入字段

表示要对其划分数值范围的输入流数值型字段,在输入流字段列表中选取

默认值为空

输出字段表示划分数值范围的新字段名称,默认值为range
缺省值(如果没有匹配到的范围)

表示要划分数值范围的字段数据,没有在划分的范围内的值

默认值为unknown

范围 (最小<=X<最大)

表示要划分的设置范围区间

使用一个表,分行设置多个范围,范围的参数如下:

① 下限:该范围取值的最小值(<=)
② 上界:该范围取值的最大值(<)
③ 值:该范围的名称

在【数值范围】对话框中,设置参数,对英语分数划分以下范围:小于80分、80~90分、90~100分、100~110分、100~120分、120~130分、130~140、140~150分、150分满分,步骤如下

(1) 设置【数值范围】组件名称,【步骤名称】保留默认值"数值范围"

(2) 确定划分数值范围的字段,【输入字段】设置为"英语"字段

(3) 确定输出的字段,【输出字段】设置为"分数范围"字段

(4) 确定【缺省值(如果没有匹配到的范围)】的内容,【缺省值(如果没有匹配到的范围)】设置为"不在范围内"

(5) 划分数值范围,对【范围 (最小<=X<最大)】表的参数进行设置

此时完成【数值范围】组件参数的设置如下图所示

5.3 预览结果数据

在【数值范围】转换工程中,单击【数值范围】组件,再单击工作区上方的"预览这个转换"图标,预览设置数值范围后的数据,如下图所示 

6.计算器

计算器除了进行加、减、乘和除等简单运算外,还可以进行乘方、开方、指数、对数、三角函数和统计等方面的运算

Kettle软件提供计算器组件,对数值型的字段数据进行运算

数据源

2018年上学期期末考试成绩(Kettle数据集9).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537342?spm=1001.2014.3001.5501需求:为了详细了解学生的基础和全部课程的考试情况,需要在"2018年上学期期末考试成绩.xls"文件中,使用计算器组件,分别计算学生语文、数学和英语3门基础课程的总分数,以及全部6门课程的总分数

6.1 建立【计算器】转换工程

使用Ctrl+N快捷键,创建【计算器】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末考试成绩.xls"文件,预览数据,如下图所示,只有各科课程分数,没有统计分数

在【计算器】转换工程,单击【核心对象】选项卡,展开【转换】对象,选中【计算器】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【计算器】组件,建立节点连接,如下图所示

6.2 设置【计算器】组件参数

双击【计算器】组件,弹出创建【计算器】对话框,如下图所示

【计算器】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示计算器组件名称,在单个转换工程中,名称必须唯一

默认值为【计算器】组件名称

Throw an error on non existing files表示文件不存在是是否抛出一个错误,默认值为√,勾选
字段表示保存计算器运算结果的新字段,使用一个【字段】表,设置新字段参数,默认值为空
新字段表示保存计算器运算结果的新字段名称,默认值为空
计算表示计算公式,从系统提供的计算公式中选择,默认值为空
字段A表示参加计算的第一个字段,从输入流中选取,也可直接键盘设置,默认值为空
字段B表示参加计算的第二字段,从输入流中选取,也可直接键盘设置,默认值为空
字段C表示参加计算的第三字段,从输入流中选取,也可直接键盘设置,默认值为空
值类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
移除表示所在行的新字段只参加运算,不出现在输出流中
Conversion Mask表示所在行的新字段的掩码,默认值为空
小数点表示小数点符号,一般使用"."英文点号,默认值为空
分组表示数值分组符号,一般使用","英文逗号表示,默认值为空
货币符号表示货币符号,例如"¥","$","€"等货币符号,默认值为空

在【计算器】对话框中,设置参数,统计基础课程语数英的总分数和全部6门考试课程的总分数,步骤如下

(1) 设置【计算器】组件名称,【步骤名称】保留默认值"计算器"

(2) 设置统计字段的参数,对【字段】表参数进行设置

此时完成【计算器】组件参数的设置如下图所示

6.3 预览结果数据

在【计算器】计算器工程中,单击【计算器】组件,再单击工作区上方的"预览这个转换"图标,预览使用计算器后的数据,如下图所示

7.增加序列

序列是按照一定规律次序排好的行列,有特定起始值和增量值,是不断变化的整数值行列,例如"1,2,3,4,…. ",以及"1,2,3,1,2,3,……"等都是序列

数据源

2019年11月月考数学成绩(Kettle数据集3).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88521681?spm=1001.2014.3001.5501需求:由于在"2019年11月月考数学成绩.xls"文件中,存在着重复记录,在去除重复记录后,序号不能连贯按顺序排列,需要使用增加序列组件,生成新序号,以便序号能够顺序排列

(1) 建立【增加序列】转换工程

使用Ctrl+N快捷键,创建【增加序列】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2019年11月月考数学成绩.xls"文件,接着创建【排序记录】组件,并由【Excel输入】组件指向【排序记录】组件,建立节点连接,双击【排序记录】组件,对"学号"字段按照升序进行排序后预览数据

创建【去除重复记录】组件,由【排序记录】组件指向【去除重复记录】组件,建立节点连接,设置去除重复记录参数,去除数据中的重复记录后预览数据

浏览去除重复记录后的数据如下图所示,序号数据不连续了,出现序号数据从"23"跳到"25"、从"29"跳到"31"等的情况

在【增加序列】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【增加序列】组件,并拖曳到右边工作区中,由【去除重复记录】组件指向【增加序列】组件,这时弹出包括【主输出步骤】和【错误处理步骤】选项的选项框,选择【主输出步骤】选项建立节点连接,如下图所示

(2) 设置【增加序列】组件参数

双击【增加序列】组件,弹出创建【增加序列】对话框,如下图所示

【增加序列】组件有关参数说明如下表所示

参数名称说明
步骤名称

表示增加序列组件名称,在单个转换工程中,名称必须唯一

默认值为【增加序列】组件名称

值的名称

表示增加序列的字段名称

默认值为valuename

使用DB来获取sequence表示是否使用DB来获取序列,默认值为空
数据库连接表示数据库的连接名称。默认值为空或当前工程中已经存在的数据库连接名称。也可以单击【编辑】【新建】和【Wizard】按钮编辑数据库连接
模式名称表示数据库模式名称,默认值为空
Sequence 名称表示序列名称,默认值为SEQ_
使用计数器来计算sequence表示是否使用计数器来获取序列,默认值为√
计数器名称(可选)表示计数器的名称,默认值为空
起始值表示序列起始值,默认值为1
增长根据表示序列增加或减少的步长,默认值为1
最大值表示序列的最大值,默认值为999999999

在增加序列】对话框中,使用转换计数器来生成序列,增加一个名称为"新序号"字段,表示是新增加的序列号,步骤如下

(1) 确定【增加序列】组件名称,【增加序列】采用默认值"增加序列"

(2) 设置新系列的名称,设置【值的名称】为"新序号"

(3) 使用转换计数器来生成序列数据

① 【起始值】设置为"1"

② 【增长根据】设置为"1"

③ 【最大值】采用默认值

此时完成【增加序列】组件参数设置如下图所示

(3) 预览结果数据

在【增加序列】转换工程中,单击【增加序列】组件,再单击工作区上方的"预览这个转换"图标,预览增加序列后的数据,如下图所示

8.字段选择

数据文件中有些字段全是数字,如电话号码字段会被系统当成浮点型处理,有些字段在某个场景里用不上,也有个别字段使用了不恰当或错误的名称,对于这些问题,都需要对相对应的字段进行改变类型、去除字段和改变名称等字段处理

数据源

2018年4月月考成绩(Kettle数据集13).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88550080?spm=1001.2014.3001.5501需求:为了统计语文、数学和英语3门基础学科的分数,需要对某年级的"2018年4月月考成绩.xls"文件,使用【字段选择操作】组件,选择语文、数学和英语字段,并且把创建时间改为考试时间

8.1 建立【字段选择】转换工程

使用Ctrl+N快捷键,创建【字段选择】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年4月月考成绩.xls"文件,预览数据,如下图所示,"序号","学号"字段出现小数,有"创建时间"而没有"考试时间"

在【字段选择】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【字段选择】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【字段选择】组件,建立节点连接,如下图所示

8.2 设置【字段选择】组件参数

双击【字段选择】组件,弹出创建【选择/改名值】对话框,如下图所示

【字段选择】组件的参数包含组件的基础参数和【选择和修改】【移除】【元数据】3个选项卡参数 

在组件的基础参数中,【步骤名称】参数表示字段选择组件的名称,在单个转换工程中,名称必须唯一,采用默认值"字段选择"

【选择和修改】选项卡参数

在【选择和修改】选项卡中,使用一个【字段】参数表设置字段参数,有关参数的说明如下表所示

参数名称说明
字段

表示要选择和修改字段,使用一个字段表设置有关字段参数,字段参数如下
① 字段名称:要选择和修改的字段名称,可以单击【获取选择的字段】按钮,获取输入流字段名称,默认值为空
② 改名成:字段改名后的目标名称,如果不希望改名,那么为空,默认值为空
③ 长度:字段的长度,默认值为空
④ 精度:数字类型字段的浮点数的精确位数,默认值为空

包含未指定列,按名称排序是否包含输入流中未在字段表中显式选择的字段

在【选择和修改】选项卡中,对导入的"2018年4月月考成绩.xls"文件中的字段进行选择和修改,步骤如下

(1) 确定选择和修改的字段,单击【获取选择的字段】按钮,获取导入文件的所有字段,添加到【字段】表中

(2) 修改字段名称,"创建时间"字段所在行的【改名成】设置为"考试时间",需要注意的是,输入流"创建时间"字段名称已经被改名为"考试时间",该字段的【长度】【精度】参数暂时不进行设置

【移除】选项卡参数

单击【移除】选项卡,展示【移除的字段】参数表,如下图所示

在【移除的字段】参数表中设置参数,移除不需要的字段

因为只需选择3门基础课程语文、数学和英语的考试分数,所以需要设置参数移除物理、化学和生物3门课程,操作步骤如下

(1) 添加输入流字段,单击【获取移除的字段】按钮,添加输入流的字段名称到【移除的字段】参数表中

(2) 确定要移除的字段,在【移除的字段】参数表中,单击字段名称所在的行号数,右键单击选中的行,单击快捷菜单的【删除选中的行】选项,删除非移除的字段,保留要移除的字段,输入流中"物理","化学","生物"字段将被移除

【元数据】选项卡参数

单击【元数据】选项卡,展示【需要改变元数据的字段】参数表,如下图所示

在【元数据】参数选项卡中,使用【需要改变元数据的字段】参数表设置字段参数,有关参数的说明如下表所示

参数名称说明
字段名称表示需要改变元数据的字段的名称。可以通过【获取改变的字段】或直接使用键盘设置,默认值为空
改名成表示字段改名后的目标名称,如果不希望改名,那么为空,默认值为空
类型

表示字段的数据类型,类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
Binary to Normal?

表示是否将字符串转换为数字数据类型,选项有是、否

默认值为空

格式表示转换时,原始字段格式的可选掩码。有关公共有效日期和数字格式的信息,请参阅有关公共格式参考书。默认值为空
Date Format Lenient?

表示日期格式解析器是否是严格还是宽松的

选项有是、否

设置为"是"时,只接受严格有效的日期值;设置为"否"时,解析器会尝试把错误日期纠正为正确的日期默认值为空

Date Locale

表示日期地区区域。为空时,以系统上默认日期区域编码设置,默认值为空

Date Time Zone表示日期时区。为空时,以系统上默认日期日期编码设置,默认值为空
Lenient number conversion?表示数字转换是否是宽松的。选项有是、否。设置为"是"时,将解析数字,直到找到一个非数字值,如破折号或斜杠,解析然后停止,不报告错误。当设置为"否"时,如果输入的数字无效,解析器将报告错误,默认值为空

Encoding

表示文本文件编码。为空时,以在系统上使用默认编码。从系统上提供的编码列表中选择,默认值为空
分组表示数值分组符号,一般使用","英文逗号,默认值为空
货币符号表示货币符号,例如"¥","$","€"等货币符号,默认值为空

在【需要改变元数据的字段】参数表中,设置需要改变元数据的字段参数,步骤如下

(1) 获取源数据字段,单击【获取改变的字段】按钮,添加输入流的字段到【需要改变元数据的字段】表中

(2) 设置字段的参数

此时完成【字段选择】组件参数的设置,如下图所示

8.3 预览结果数据

在【字段选择】转换工程中,单击【字段选择】组件,再单击工作区上方的"预览这个转换"图标,预览字段选择后的数据,如图所示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/162003.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

java源码-工程讲解

1、 工程目录 源码工程目录讲解部分&#xff0c;讲解过程会让大家对后端源码工程有一个大致的了解&#xff0c;能让大家在此改造&#xff0c;就可以衍生出一些新的功能&#xff0c;需要对java技术深入了解&#xff0c;需要看后续java技术讲解部分 整个架构是一个spring-boot…

​软考-高级-系统架构设计师教程(清华第2版)【第16章 嵌入式系统架构设计理论与实践(P555~613)-思维导图】​

软考-高级-系统架构设计师教程&#xff08;清华第2版&#xff09;【第16章 嵌入式系统架构设计理论与实践&#xff08;P555~613&#xff09;-思维导图】 课本里章节里所有蓝色字体的思维导图

Redis 9 数据库

4 设置键的生存时间或过期时间 通过EXPIRE命令或者PEXPIRE命令&#xff0c;客户端可以以秒或者毫秒精度为数据库中的某个键设置生存时间&#xff08;TimeToLive&#xff0c;TTL&#xff09;&#xff0c;在经过指定的秒数或者毫秒数之后&#xff0c;服务器就会自动删除生存时间…

Python的数据分析包Pandas?示例文章完成版来啦~

文章目录 前言一、Pandas简介二、Python Pandas的使用 总结 前言 pandas 是基于NumPy 的一种工具&#xff0c;该工具是为了解决数据分析任务而创建的。 Pandas 是python的一个数据分析包&#xff0c;最初由AQR Capital Management于2008年4月开发&#xff0c;并于2009年底开源…

【机器学习Python实战】logistic回归

&#x1f680;个人主页&#xff1a;为梦而生~ 关注我一起学习吧&#xff01; &#x1f4a1;专栏&#xff1a;机器学习python实战 欢迎订阅&#xff01;后面的内容会越来越有意思~ ⭐内容说明&#xff1a;本专栏主要针对机器学习专栏的基础内容进行python的实现&#xff0c;部分…

机器学习第8天:SVM分类

文章目录 机器学习专栏 介绍 特征缩放 示例代码 硬间隔与软间隔分类 主要代码 代码解释 非线性SVM分类 结语 机器学习专栏 机器学习_Nowl的博客-CSDN博客 介绍 作用&#xff1a;判别种类 原理&#xff1a;找出一个决策边界&#xff0c;判断数据所处区域来识别种类 简单…

Consistency Models 阅读笔记

Diffusion models需要多步迭代采样才能生成一张图片&#xff0c;这导致生成速度很慢。Consistency models的提出是为了加速生成过程。 Consistency models可以直接一步采样就生成图片&#xff0c;但是也允许进行多步采样来提高生成的质量。 Consistency models可以从预训练的扩…

单元测试实战(四)MyBatis-Plus 的测试

为鼓励单元测试&#xff0c;特分门别类示例各种组件的测试代码并进行解说&#xff0c;供开发人员参考。 本文中的测试均基于JUnit5。 单元测试实战&#xff08;一&#xff09;Controller 的测试 单元测试实战&#xff08;二&#xff09;Service 的测试 单元测试实战&am…

【电路笔记】-最大功率传输

最大功率传输 文章目录 最大功率传输1、概述2、最大功率传输定理 (MPTT)3、示例4、阻抗匹配5、总结 当工程师设计电子电路时&#xff0c;他们会跟踪许多不同的参数&#xff0c;但最重要的参数之一是功率。 在现代电路中&#xff0c;功率在多个阶段中不断变化&#xff0c;有时由…

最常用的结构体初始化方式

结构体最常用的初始化方式就是用memset把这块区域清0 注意不能这么写 STU stu[5]; stu (STU*)malloc(sizeof(stu)); 数组名不允许被赋值&#xff0c;它只是个表达式

AI Navigation导航系统_unity基础开发教程

AI Navigation导航系统 安装插件烘焙导航系统障碍物创建人物的AI导航动态障碍物 在unity编辑器中&#xff0c;有一个灰常好用的插件&#xff1a;Navigation。有了它1&#xff0c;你就可以实现人物自动走到你鼠标点击的位置&#xff0c;而且还会自动避开障碍物&#xff0c;下面就…

微信小程序会议OA首页-开发说明创建项目关于flex布局关于尺寸单位(rpx)关于WXS轮播图会议信息

目录 1. 创建项目 2. 关于flex布局 3. 关于尺寸单位&#xff08;rpx&#xff09; 4. 关于WXS 4. 轮播图 5. 会议信息 1. 创建项目 基于微信原生开发工具&#xff0c;稳定版 Stable Build (1.06.22010310) 创建项目前&#xff0c;请确定有小程序测试账号 使用向导创建一个…

【Linux】进程间通信 -- 共享内存

共享内存 共享内存是SystemV标准进程间通信的一种&#xff0c;该标准还有消息队列和信号量&#xff0c;但下文主要介绍共享内存&#xff0c;然后在谈一下信号量的内容。SystemV标准的进程间通信可以看做单机版的进程间通信。 // 1. log.hpp #pragma once#include <iostrea…

网站优化工具Google Optimize

Google Optimize 是一款由Google提供的网站优化工具。Google Optimize旨在帮助网站管理员通过对网页内容、设计和布局进行测试和优化&#xff0c;来提升用户体验和网站的转化率。 Google Optimize 提供了 A/B 测试和多变量测试功能&#xff0c;使网站管理员能够比较和评估不同…

LeetCode算法题解(动态规划)|LeetCoed62. 不同路径、LeetCode63. 不同路径 II

一、LeetCoed62. 不同路径 题目链接&#xff1a;62. 不同路径 题目描述&#xff1a; 一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为 “Start” &#xff09;。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角&#xff08;在下…

【LeetCode刷题-滑动窗口】--345.反转字符串中的元音字母

345.反转字符串中的元音字母 class Solution {public String reverseVowels(String s) {int len s.length();if(len < 2){return s;}char[] charArray s.toCharArray();int left 0,right len - 1;while(true){while(left < len && checkVowels(charArray[lef…

Selenium自动化测试框架

一.Selenium概述 1.1 什么是框架? 框架&#xff08;framework&#xff09;是一个框子——指其约束性&#xff0c;也是一个架子——指其支撑性。是一个基本概念上的 结构用于去解决或者处理复杂的问题。 框架是整个或部分系统的可重用设计&#xff0c;表现为一组抽象构件及…

2023腾讯云轻量应用服务器购买优惠活动,轻量服务器优惠链接

双11优惠活动即将到来&#xff0c;各大电商平台纷纷推出超值优惠&#xff0c;腾讯云也不例外。今天&#xff0c;我将向大家介绍一款在双11活动中备受瞩目的服务器套餐——腾讯云的3年轻量应用服务器配置为2核2G4M带宽、50GB SSD系统盘。这款服务器不仅配置强大&#xff0c;而且…

ubuntu下载conda

系统&#xff1a;Ubuntu18.04 &#xff08;1&#xff09;下载安装包 wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.11-Linux-x86_64.sh 报错错误 403&#xff1a;Forbidden 解决方法 wget -U NoSuchBrowser/1.0 https://mirrors.tuna.tsingh…

【LeetCode刷题-双指针】--259.较小的三数之和

259.较小的三数之和 方法&#xff1a;排序双指针 class Solution {public int threeSumSmaller(int[] nums, int target) {Arrays.sort(nums);int k 0;for(int i 0;i<nums.length;i){int start i 1,end nums.length - 1;while(start < end){int sum nums[start] …