第4章基础知识进阶第4.1节 Python基础概念之迭代、可迭代对象、迭代器-白红宇

第4章基础知识进阶第4.1节 Python基础概念之迭代、可迭代对象、迭代器

阅读量：111 次

发布时间：2019-02-26

本文共 3145 字，大约阅读时间需要 10 分钟。

第四章基础知识进阶

第十七节迭代、可迭代对象、迭代器

一、引言

本来计划讲完元组和字典后就讲列表解析和字典解析，但要理解列表解析和字典解析，就需要掌握Python的高级的类型迭代器，因此本节将迭代器的概念先进行介绍。

二、概念

1. 迭代：是通过重复执行的代码处理相似的数据集的过程，并且本次迭代的处理数据要依赖上一次的结果继续往下做，上一次产生的结果为下一次产生结果的初始状态，如果中途有任何停顿，都不能算是迭代。例如：

1) 非迭代例子

loop = 0

while loop < 3:

print("Hello world!")

loop += 1

2) 迭代例子

loop = 0

while loop < 3:

print(loop)

loop += 1

例1仅是循环3次输出" Hello world!"，输出的数据不依赖上一次的数据，因此不是跌代。

2. 容器：容器是一种把多个元素组织在一起的数据结构，容器中的元素可以逐个地迭代获取，可以用in, not in关键字判断元素是否包含在容器中。

1) 这个定义与在列表中定义的容器“可以包含其他类型对象（如列表、元组、字典等）作为元素的对象，在 Python中称为容器（container）”从字面上看是不同的，但本质上是一样的，因为基本上所有有元素的数据类型（字符串除外）都能包含其他类型的对象；

2) 容器仅仅只是用来存放数据的，我们平常看到的 l = [1,2,3,4]等等，好像我们可以直接从列表这个容器中取出元素，但事实上容器并不提供这种能力，而是可迭代对象赋予了容器这种能力。

3. 可迭代对象(Iterable)：可迭代对象并不是指某种具体的数据类型，它是指存储了元素的一个容器对象，且容器中的元素可以通过__iter__( )方法或__getitem__( )方法访问。

1) __iter__方法的作用是让对象可以用for ... in循环遍历，__getitem__( )方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。老猿认为这两个方法的目的是Python实现一个通用的外部可以访问可迭代对象内部数据的接口。

2) 一个可迭代对象是不能独立进行迭代的，Python中，迭代是通过for ... in来完成的。凡是可迭代对象都可以直接用for… in…循环访问，这个语句其实做了两件事：第一件事是调用__iter__()获得一个可迭代器，第二件事是循环调用__next__()。

3) 常见的可迭代对象包括：

a) 集合数据类型，如list、tuple、dict、set、str等；

b) 生成器(generator)，包括生成器和带yield的生成器函数(generator function)，下节专门介绍。

4) 如何判断一个对象是可迭代对象呢？可以通过collections模块的Iterable类型判断，具体判断方法如下：

from collections import Iterable

isinstance('', Iterable) #返回True，表明字符串也是可迭代对象

关于collections后续再介绍。

5) 在迭代可变对象如列表对象时候，一个序列的迭代器只是记录当前到达了序列中的第几个元素，所以如果在迭代过程中改变了序列的元素。更新会立即反应到所迭代的条目上。比如一个列表用for…in方法迭代访问时，删除了当前索引n对应的元素，则下一个循环时，访问的数据索引为n+1，但实际访问元素的索引是上一轮循环中列表的索引n+2对应元素。

4. 迭代器（Iterator）：迭代器可以看作是一个特殊的对象，每次调用该对象时会返回自身的下一个元素，从实现上来看，一个迭代器对象必须是定义了__iter__()方法和next()方法的对象。

1) Python的Iterator对象表示的是一个数据流，可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算；

2) Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误；

3) 所有的Iterable可迭代对象均可以通过内置函数iter()来转变为迭代器Iterator。老猿认为__iter__( )方法是让对象可以用for ... in循环遍历时找到数据对象的位置，__next__( )方法是让对象可以通过next(实例名)访问下一个元素。除了通过内置函数next调用可以判断是否为迭代器外，还可以通过collection中的Iterator类型判断。如： isinstance('', Iterator)可以判断字符串类型是否迭代器。注意： list、dict、str虽然是Iterable，却不是Iterator。

4) 迭代器优点：节约内存（循环过程中，数据不用一次读入，在处理文件对象时特别有用，因为文件也是迭代器对象）、不依赖索引取值、实现惰性计算(需要时再取值计算)；

举例：用迭代器的方式访问文件

for line in open("test.txt"):print(line)

这样每次读取一行就输出一行，而不是一次性将整个文件读入，节约内存。

5) 迭代器使用上存在限制：只能向前一个个地访问数据，已访问数据无法再次访问、遍历访问一次后再访问无数据

举例：

l = [1,2,3,4]

i=iter(l) #从list列表生成迭代器i

list(i) #将迭代器内容转换成列表，输出[1,2,3,4]

list(i) #将迭代器内容再次转换成列表，输出[]

用for循环访问：

i=iter(l)