在我们使用Python编译过程中,yield
关键字用于定义生成器函数,它的作用是将函数变成一个生成器,可以迭代产生值。yield
的行为在不同的情况下会有不同的效果和用途。
1、问题背景
在 Python 中,“yield” 是一种生成器(generator)的实现方式。生成器是一种特殊类型的迭代器(iterator),它可以在运行时动态产生值。然而,在某些情况下,使用生成器可能会遇到令人困惑的行为。
比如,下面有一个函数 x()
,它产生一个生成器,该生成器每次调用 next()
方法时都会递减全局变量 a
的值并产生一个 yield
语句:
a = 5
def x():
global a
if a == 3:
raise Exception("Stop")
a = a - 1
yield a
现在,让我们在 Python shell 中调用这个函数并打印出生成的值:
>>> print(x().next())
4
>>> print(x().next())
3
到目前为止,一切正常。但是,如果我们把生成器函数的调用结果赋值给一个变量,然后使用这个变量来产生值,就会出现不同的行为:
>>> a = 5
>>> b = x()
>>> print(b.next())
4
>>> b.next()
StopIteration
这次,在第二次调用 b.next()
时,它没有产生值,而是引发了一个 StopIteration
异常。这是为什么呢?
2、解决方案
要理解这种行为,我们需要了解生成器的工作原理。
当我们调用一个生成器函数时,它并不会立即执行函数体,而是返回一个生成器对象(generator object)。这个生成器对象包含了函数体中的代码,但它不会在调用时执行。当我们使用 next()
方法来产生值时,生成器对象才会开始执行函数体。
在第一次调用 x()
时,我们创建了一个新的生成器对象。这个对象在执行函数体时遇到了 a == 3
这个条件,并引发了一个异常。然后,我们在 Python shell 中打印出了这个异常。
在第二次调用 x()
时,我们又创建了一个新的生成器对象。这个对象在执行函数体时仍然遇到了 a == 3
这个条件,并引发了异常。
但是,当我们把生成器函数的调用结果赋值给变量 b
时,情况发生了变化。这使得我们可以多次调用 b.next()
来产生值。当我们第一次调用 b.next()
时,生成器对象从上次中断的地方继续执行,并产生了值 4
。
然而,当我们第二次调用 b.next()
时,生成器对象已经执行到了函数体的末尾,没有更多的值可以产生了。因此,它引发了一个 StopIteration
异常。
为了更好地理解这种行为,我们可以使用一个 for
循环来遍历生成器:
def looping(stop):
for i in looping(stop):
yield i
>>> looping(3).next()
0
>>> looping(3).next()
0
注意,每次我们创建一个新的生成器,循环都会从头开始。然而,如果我们存储一个生成器的引用,那么循环会继续从上次中断的地方继续执行:
>>> stored = looping(3)
>>> stored.next()
0
>>> stored.next()
1
>>> stored.next()
2
>>> stored.next()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
在循环期间,每次执行 yield
语句时,代码都会暂停;调用 .next()
继续从上一时间中断的地方继续执行函数。
StopIteration
异常是完全正常的;这是生成器传达它们已经完成的方式。一个 for
循环寻找这个异常来结束循环:
>>> for i in looping(3):
... print(i)
...
0
1
2
通过上述总结我们得知,yield
在不同的上下文中有不同的行为,但都涉及到生成器的创建或者协程的定义。所以说最终选择哪种模式还得更加自身情况来选择。