Job那块的断点代码截图省略,直接进入切片逻辑
参考:Hadoop3:MapReduce源码解读之Mapper阶段的Job任务提交流程(1)
5、TextInputFormat源码解析
类的继承关系
它的内容比较少
重写了两个父类的方法
这里关心一下泛型参数,发现是LongWritable, Text
,这就是为什么之前我们开发WC
案例的时候,固定传入LongWritable和Text类型
的原因
说明
TextInputFormat
是默认的FileInputFormat
实现类。按行读取每条记录。键是存储该行在整个文件中的起始字节偏移量, LongWritable
类型。值是这行的内容,不包括任何行终止符(换行符和回车符),Text
类型。
例如