有关泛型的基本概念,参见我的前一篇博客 JAVA 学习·泛型(一)。
协变性
泛型不具备协变性
在介绍通配泛型之前,先来看一下下面的例子。我们定义了一个泛型栈:
import java.util.ArrayList;
class GenericStack<E> {
private ArrayList<E> list = new ArrayList<E>();
public boolean isEmpty() {
return list.isEmpty();
}
public int getSize() {
return list.size();
}
public E peek() {
return list.get(getSize() - 1);//取值不出栈
}
public E pop() {
E o = list.get(getSize() - 1) ;
list.remove(getSize() - 1);
return o;
}
public void push(E o) {
list.add(o);
}
public String toString() {
return "stack: " + list.toString();
}
}
现在,我们写了一个方法max
,用来求一个GenericStack
容器中元素的最大值。如下面的代码所示:
public class WildCardNeedDemo {
public static double max(GenericStack<Number> stack){
double max = stack.pop().doubleValue();
while (! stack.isEmpty()){
double value = stack.pop().doubleValue();
if(value > max)
max = value;
}
return max;
}
public static void main(String[] args){
GenericStack<Integer> intStack = new GenericStack<>();
intStack.push(1);intStack.push(2);intStack.push(3);
System.out.println("Th max value is " + max(intStack));
}
}
上面的main
函数,意图在于借助WildCardNeedDemo.max
方法,找出intStack
中的最大值3
。但是实际运行时,程序报错,说GenericStack<Integer>
无法转换为GenericStack<Number>
类型。这是因为泛型不具备协变性。
所谓的协变性在泛型中是指:有泛型类Generic<T>
如果B
是A
的子类,那么Generic<B>
也是Generic<A>
的子类。
数组具备协变性
协变性在数组中是指:如果类A
是类B
的父类,那么A[]
就是B[]
的父类。数组具有协变性。
数组的协变性是 Java 开发者和使用者所公认的一个瑕疵,因为它会导致编译通过的地方运行时出错的问题。比如下面这个例子:
class Fruit{}
class Apple extends Fruit{}
class Jonathan extends Apple{} //一种苹果
class Orange extends Fruit{}
//由于数组的协变性,可以把Apple[]类型的引用赋值给Friut[]类型的引用
Fruit[] fruits = new Apple[10];
fruits[0] = new Apple();
fruits[1] = new Jonathan(); // Jonathan是Apple的子类
try{
//下面语句fruits的声明类型是Fruit[]因此编译通过,但运行时将Fruit转型为Apple错误
//数组是在运行时才去判断数组元素的类型约束
fruits[2] = new Fruit();//运行时抛出异常 java.lang.ArrayStoreException,这是数组协变性导致的问题
}catch(Exception e){
System.out.println(e);
}
在前一篇博客中提到过,泛型的设计就是为了防止编译通过的地方运行时出错问题的发生。如果泛型也和数组一样具备协变性,那这个问题就无法防止,所以 Java 的开发者规定泛型不具有协变性。
通配泛型
但是,规定泛型不具备协变性,又会带来很多不方便。为了让泛型具有更好的性能, Java 开发者设计出了通配泛型。通配泛型具有三种形式:上界通配、下界通配和非受限通配。
上界通配
形式为<? extends T>
,表示只要是T
的子类即可,T
定义了类型的上限(父类为上,子类为下)。
在上面WildCarNeedDemo
中,只需要将max
的形参列表改为(GenericStack<? extends Number> stack)
就能够正常运行。因为Integer
是Number
的子类,所以GenericStack<? extends Number>
是GenericStack<Integer>
的父类。
以上界通配符声明的泛型容器是不能添加除null
之外的元素的。如:
ArrayList<? extends Fruit> list = new ArrayList<Apple>();
list.add(new Apple()); list.add(new Fruit()); //编译都报错
//可加入null
list.add(null);
这是因为,编译器在编译时根本看不到运行时类型ArrayList<Apple>
,它只认list
的声明类型ArrayList<? extends Fruit>
。编译器无法知道list
指向的容器的元素的类型下界,自然无法判断加进来的元素是否与容器相容。所以编译器就干脆什么不让加进来。
然而,不管list
究竟指向什么类型的容器,容器的元素一定是Fruit
的子类。所以可以从容器里取元素,并用Fruit
类型的引用变量指向它。
所以,上界通配的泛型容器相当于一个只读不存(注意不能存但是能删,所以是可写的)的容器。只读不写的特性,让上界通配泛型容器具有特殊的意义:作为方法参数。例如,定义一个方法handle(ArrayList<? extends Fruit> list)
,方法中可以对传进来的list
中的元素(引用为Fruit
)进行处理,但是不能添加新的元素。
非受限通配的形式为
<?>
,它是一种特殊的上界通配,等价于<? extends Object>
。因此非受限通配的所有性质都可以参照上界通配。
下界通配
形式为<? super T>
,表示只要是T
的父类即可,T
定义了类型的下限。
以下界通配符声明的泛型容器只能添加T
和T
的子类对象。
ArrayList<? super Fruit> list = new ArrayList<Object>();
list.add(new Fruit()); //OK
list.add(new Apple()); //OK
list.add(new Jonathan()); //OK
list.add(new Orange()); //OK
list.add(new Object()); //添加Fruit父类则编译器禁止,报错
道理和上界通配是一样的,编译器只知道list
指向的容器的元素的类型下界是Fruit
,看不到运行时类型ArrayList<Object>
。所以,编译器知道加入Fruit
和Fruit
子类对象时安全的,至于Fruit
的父类就无法保证了。
从这种容器中取元素都解释为Object
类,也可以强制类型转换为其他类,但是调用方法就行不通了,因为不知道取出来的对象是否有我们调用的方法。
PECS 原则
Producer Extends,Consumer Super. 如果需要一个只读泛型类,用来Produce T
,那么用 ? extends T
。如果需要一个只写泛型类,用来Consume T
,那么用 ? super T
。如果一个泛型容器需要同时读取和写入,那么就不能用通配符。
实际上,
<? extends T>
也可以写(删除元素),所以说它只读是不准确的,意思是想表达不能往里面加东西。<? super T>
也可以读(作为Object
读出来),说它只写也是不准确的,但是想表达的意思是:从里面取出来的对象,也不知道有没有我们想要的数据成员或方法,所以一般不读。
泛型容器中元素的转移——PECS的一个应用实例
泛型类GenericStack<E>
的定义仍然沿用上文的定义。下面的代码实现了GenericStack
的两个实例泛型:
GenericStack<String> strStack= new GenericStack<>();
GenericStack<Object> objStack = new GenericStack<>();
objStack.push("Java");
objStack.push(2); //装箱
strStack.push("Sun");
现在我想写一个方法add
,通过调用add(strStack,objStack)
,将strStack
中的元素全部加入objStack
中。可以定义下面的方法:
public static <T> void add(GenericStack<T> stack1,GenericStack<? super T> stack2){
while(!stack1.isEmpty())
stack2.push(stack1.pop());
}
实际编译add(strStack,objStack)
时,编译器自动推断T
应该是String
,并推断这条语句运行时不会出错。也可以显式地使用<String>add(strStack,objStack)
,但是不建议,一旦编译器推断出的实际类型和你给出的实际类型不一致,就会报错。
当然,add
的函数头还可以是:
public static <T> void add(GenericStack<? extends T> stack1,GenericStack<T> stack2);
这时编译add(strStack,objStack)
,编译器推断出T
应是Object
。
Java泛型变量推论机制浅讨论
上面的这个实例中,都是编译器推断出T
时什么类型。这是因为我们在形参列表中使用了普通泛型<T>
,编译器直接根据传入对象的引用类型来推断。
形参列表中的普通泛型给了编译器可乘之机,编译器直接通过普通泛型得到T
的实际类型,然后依次检查形参列表中其他的泛型是否合法。那我如果不给编译器可乘之机呢?比如下面这样:
public static <T> void add(GenericStack<? extends T> stack1,GenericStack<? super T> stack2);
编译器依然可以解释T
,虽然这个时候编译器只能得到T
的一个范围。比如,对于add(strStack,objStack)
语句,编译器能得到的信息是:String
是T
的子类,而Object
是T
的父类。显然这样的T
是存在的,编译器就不会报错。那么编译器到底将T
解释称什么呢?
这种情况下,T
被解释为它所能够达到的下限。下面是解释:
栈还是上面定义的GenericStack
,现在我写下面一个入口类:
public class SuperWildCarDemo {
public static void main(String[] args) {
GenericStack<Integer> intStack= new GenericStack<>();
GenericStack<Object> objStack = new GenericStack<>();
GenericStack<Object> tempStack = SuperWildCarDemo.<Number>add(intStack, objStack);
}
public static <T> T add(GenericStack<? extends T> stack1, GenericStack<? super T> stack2){
return (T) new Object();
}
}
上述代码的第
5
5
5 行报错。报错内容如下:
由于我们显示提供了T
是Number
,那么自然返回的stack1
也被强制类型转化为Number
类型了。现在我们不显式提供类型参数,看看会是怎么报错:
我们没有告诉编译器T
应该是什么类型,但是编译器说这个add
函数返回的是Interger
类型的对象。这说明编译器自行推断出T
是Integer
。
这个例子中换成了心的泛型实例GenericStack<Integer>
,是因为Object
和Integer
之间还有一个中间类Number
。我想说的是,在不显式提供类型实参,且编译器根据传入对象无法确定类型形参的具体类型时,编译器会把类型形参解释为它能够到达的下限。不会解释为上限,更不会解释为其他的中间类型。
当然,如果编译器发现,根据你传入的对象推断出的T
的范围是空集,那就直接报错。