作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO
联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬
1. Stream 的 distinct()
方法
distinct()
是Java 8 中 Stream
提供的方法,返回的是由该流中不同元素组成的流,distinct()
通过 hashCode()
和 eqauls()
方法来判断重复元素,因此,我们可以通过重写 hashCode()
和 equals()
方法来达到某些特殊需求的去重。
Stream<T> distinct();
1.1 对于 String
列表的去重
因为 String
类已经覆写了 equals()
和 hashCode()
方法,所以可以去重成功。
// 1. 对于 String 列表去重
List<String> stringList = new ArrayList<String>() {{
add("A");
add("A");
add("B");
add("B");
add("C");
}};
logger.info("去重前:{}", stringList);
stringList = stringList.stream().distinct().collect(Collectors.toList());
logger.info("去重后:{}", stringList);
结果如下:
去重前:AABBC
去重后:ABC
1.2 对于实体类列表的去重
注:代码中我们使用了 Lombok
插件的 @Data
注解,可自动覆写 equals
和 hashCode
方法。
/**
* 定义一个实体类
*/
@Data
public class Student {
private String stuNo;
private String name;
}
// 1. 对于 Student 列表去重
List<Student> studentList = getStudentList();
logger.info("去重前:{}", JSON.toJSONString(studentList));
studentList = studentList.stream().distinct().collect(Collectors.toList());
logger.info("去重后:{}", JSON.toJSONString(studentList));
结果如下:
去重前:[{"stuNo":"001","name":"Tom"},{"stuNo":"002","name":"Mike"},{"stuNo":"001","name":"Tom"}]
去重后:[{"stuNo":"001","name":"Tom"},{"stuNo":"002","name":"Mike"}]
2. 根据 List<Object>
中 Object
某个属性去重
2.1 利用 TreeSet
通过 comparing
指定某个属性来去重
List<Student> studentList = studentList.stream().collect(
collectingAndThen(
toCollection(() -> new TreeSet<>(Comparator.comparing(Student::getName))), ArrayList::new)
);
2.2 通过 filter() 方法
我们首先创建一个方法作为 Stream.filter()
的参数,其返回类型为 Predicate
,原理就是判断一个元素能否加入到 Set
中去,代码如下:
private static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {
Set<Object> seen = ConcurrentHashMap.newKeySet();
return t -> seen.add(keyExtractor.apply(t));
}
使用如下
List<Student> studentList = studentList.stream().filter(distinctByKey(Student::getName)).collect(Collectors.toList());
作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO
进群,大家一起学习,一起进步,一起对抗互联网寒冬