Python三大神器之迭代器详解

Stella981
• 阅读 757

我们将要来学习python的重要概念迭代和迭代器,通过简单实用的例子如列表迭代器和xrange。

可迭代

一个对象,物理或者虚拟存储的序列。list,tuple,strins,dicttionary,set以及生成器对象都是可迭代的,整型数是不可迭代的。如果你不确定哪个可迭代哪个不可以,你需要用python内建的iter()来帮忙。

>>> iter([1,2,3])
<listiterator object at 0x026C8970>

>>> iter({1:2, 2:4})
<dictionary-keyiterator object at 0x026CC1B0>

>>> iter(1234)
Traceback (most recent call last):
  File "<pyshell#145>", line 1, in <module>
    iter(1234)
TypeError: 'int' object is not iterable

iter()为list返回了listiterator对象,为dictionary返回了dictionary-keyiterator对象。类似对其他可迭代类型也会返回迭代器对象。

iter()用在自定义的类型会怎样呢?我们先自己定义一个String类:

class String(object):
  def __init__(self, val):
    self.val = val
  def __str__(self):
    return self.val

st = String('sample string')

那么,st是可迭代的吗?

>>> iter(st)

TypeError: 'String' object is not iterable

你可能会有几个问题要问:

  • 怎么让自定义的类型可迭代?
  • iter()究竟做了些什么?

让我们补充String类来找找答案

class String(object):
    def __init__(self, val):
        self.val = val
    def __str__(self):
        return self.val
    def __iter__(self):
        print "This is __iter__ method of String class"
        return iter(self.val)  #self.val is python string so iter() will return it's iterator

>>> st = String('Sample String')
>>> iter(st)
This is __iter__ method of String class
<iterator object at 0x026C8150>

在String类中需要一个’__iter__’方法把String类型变成可迭代的,这就是说’iter’内部调用了’iterable.__iter__()’

别急,不是只有增加’__iter()’方法这一种途径

class String(object):
    def __init__(self, val):
        self.val = val
    def __str__(self):
        return self.val
    def __getitem__(self, index):
        return self.val[index]

>>> st = String('Sample String')
>>> iter(st)
<iterator object at 0x0273AC10>

‘itr’也会调用’iterable.__getitem__()’,所以我们用’__getitem__’方法让String类型可迭代。

如果在String类中同时使用’__iter__()’和’__getitem__()’,就只有’__iter__’会起作用。

自动迭代

for循环会自动迭代

for x in iterable:
    print x

我们可以不用for循环来实现吗?

def iterate_while(iterable):
    index = 0
    while(i< len(iterable)):
        print iterable[i]
        i +=1

这样做对list和string是管用的,但对dictionary不会奏效,所以这绝对不是python式的迭代,也肯定不能模拟for循环的功能。我们先看迭代器,等下回再过头来。

迭代器

关于迭代器先说几条………..

  • 1. 迭代器对象在迭代过程中会会产生可迭代的值,`next()`或者`__next()__`是迭代器用来产生下一个值的方法。
  • 2. 它会在迭代结束后发出StopIteration异常。
  • 3. `iter()`函数返回迭代器对象
  • 4. 如果`iter()`函数被用在迭代器对象,它会返回对象本身

我们试一试模仿for循环

def simulate_for_loop(iterable):
    it = iter(iterable)
    while(True):
    try:
        print next(it)
    except StopIteration:
        break

>>> simulate_for_loop([23,12,34,56])
23
12
34
56

前面我们看过了iterable类,我们知道iter会返回迭代器对象。

现在我们试着理解迭代器类的设计。

class Iterator:
    def __init__(self, iterable)
        self.iterable = iterable
    .
    .
    def __iter__(self):  #iter should return self if called on iterator
        return self
    def next(self):  #Use __next__() in python 3.x
        if condition: #it should raise StopIteration exception if no next element is left to return
            raise StopIteration

我们学了够多的迭代和迭代器,在python程序中不会用到比这更深的了。

但是为了学习的目的我们就到这儿。。。。

欢迎加入我的QQ群`923414804`与我一起学习,群里有我学习过程中整理的大量学习资料。加群即可免费获取

列表迭代器

你可能会在面试中写这个,所以打起精神来注意了

class list_iter(object):
    def __init__(self, list_data):
        self.list_data = list_data
        self.index = 0
    def __iter__(self):
        return self
    def next(self):   #Use __next__ in python 3.x
        if self.index < len(self.list_data):
            val = self.list_data[self.index]
            self.index += 1 
            return val
        else:
            raise StopIteration()

我们来用`list_iter`自己定义一个列表迭代器

class List(object):
    def __init__(self, val):
        self.val = val
    def __iter__(self):
        return list_iter(self.val)

>>> ls = List([1,2,34])
>>> it = iter(ls)
>>> next(it)
1
>>> next(it)
2
>>> next(it)
34
>>> next(it)

Traceback (most recent call last):
  File "<pyshell#254>", line 1, in <module>
    next(it)
  File "<pyshell#228>", line 13, in next
    raise StopIteration()
StopIteration

xrange

从一个问题开始——xrange是迭代还是迭代器?

我们来看看

>>> x = xrange(10)
>>> type(x)
<type 'xrange'>

几个关键点:

  • 1. `iter(xrange(num))`应该被支持

  • 2. 如果`iter(xrange(num))`返回同样的对象(xrange类型)那xrange就是迭代器

  • 3. 如果`iter(xrange(num))`返回一个迭代器对象那xrange就是迭代

    iter(xrange(10)) <rangeiterator object at 0x0264EFE0>

它返回了rangeiterator,所以我们完全可以叫它迭代器。

让我们用最少的xrange函数实现自己的xrange

xrange_iterator

class xrange_iter(object):
    def __init__(self, num):
        self.num = num
        self.start = 0
    def __iter__(self):
        return self
    def next(self):
        if self.start < self.num:
            val = self.start
            self.start += 1
            return val
        else:
            raise StopIteration()

my xrange

class my_xrange(object):
    def __init__(self, num):
        self.num = num
    def __iter__(self):
        return xrange_iter(self.num)

>>> for x in my_xrange(10):
    print x,

0 1 2 3 4 5 6 7 8 9

我喜欢在这里总结这篇文章,欢迎发表评论和疑问。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4天前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Stella981 Stella981
2年前
Python之time模块的时间戳、时间字符串格式化与转换
Python处理时间和时间戳的内置模块就有time,和datetime两个,本文先说time模块。关于时间戳的几个概念时间戳,根据1970年1月1日00:00:00开始按秒计算的偏移量。时间元组(struct_time),包含9个元素。 time.struct_time(tm_y
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Stella981 Stella981
2年前
OpenCV访问像素点
三种方法迭代器创建一个Mat::Iterator对象it,通过itMat::begin()来的到迭代首地址,递增迭代器知道itMat::end()结束迭代;while(it!Scr.end<Vec3b()){//(it)00;//蓝色通道置零;
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
5个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这