精读《迭代器 Iterable》

楼玄
• 阅读 1186

本周精读的文章是 IterablesIteration protocols,按照为什么需要迭代器、迭代器是如何设计的,我们还能怎么利用迭代器展开来讲。

概述

为什么需要迭代器

因为用 for ... of 循环数组非常方便,但如果仅数组才支持这个语法就太过于麻烦了,比如我们自然会希望 for ... of 可以遍历字符串的每个字符,希望 new Set([1, 2, 3]) 可以快速初始化一个新的 Set

以上提到的能力 JS 都支持,那么为什么 JS 引擎知道字符串该如何遍历?如何知道数组 [1, 2, 3]Set 类型每一个 Key 之间的对应关系?实现这些功能背后的原理就是迭代器(Iterables)

因为 ArraySet 都是可迭代的,所以他们都可以被 for ... of 遍历,JS 引擎也自然知道他们之间相互转换的关系。

迭代器是如何设计的

有两种定义迭代器的方法,分别是独立定义与合并在对象里定义。

独立定义

为对象拓展 [Symbol.iterator] 属性即可。之所以规范采用 [Symbol.iterator] 是为了防止普通的字面量 Key 与对象自身的 OwnProperties 冲突:

const obj = {}
obj[Symbol.iterator] = function() {
  return {
    someValue: 1,

    next() {
      // 可通过 this.someValue 访问与修改该值,可定义任意数量的变量作为迭代过程中的辅助变量
      if (...) {
        return { done: false, value: this.current++ } // 表示迭代还没完,当前值为 value
      }
      return { done: true } // 表示迭代完毕
    }
  };
};

for ... of 时,只要没有读到 done: true 就会一直循环。

合并在对象里定义

简化一点可以将迭代定义在对象里:

let range = {
  from: 1,
  to: 5,

  [Symbol.iterator]() {
    this.current = this.from;
    return this;
  },

  next() {
    if (this.current <= this.to) {
      return { done: false, value: this.current++ };
    } else {
      return { done: true };
    }
  },
};

这么定义的缺点是并行迭代对象时可能触发 BUG,因为每个迭代间共享了同一份状态变量。

手动控制迭代

迭代器也可以自定义触发,方法如下:

const myObj = iterable[Symbol.iterator]();
myObj.next(); // { value: 1, done: false }
myObj.next(); // { value: 2, done: false }
myObj.next(); // { value: 3, done: false }
myObj.next(); // { done: true }

donetrue 时你就知道迭代停止了。手动控制迭代的好处是,你可以自由控制 next() 触发的时机与频率,甚至提前终止,带来了更大的自由度。

可迭代与 ArrayLike 的区别

如果不了解迭代器,可能会以为 for of 是通过下标访问的,也就会把一个对象能否用 obj[index] 访问与是否可迭代弄混。

读过上面的介绍,你应该理解到可迭代的原因是实现了 [Symbol.iterator],而与对象是否是数组,或者 ArrayLike 没有关系。

// 该对象可迭代,不是 ArrayLike
const range = {
  from: 1,
  to: 5,
};

range[Symbol.iterator] = function () {
  // ...
};
// 该对象不可迭代,是 ArrayLike
const range = {
  "0": "a",
  "1": "b",
  length: 2,
};
// 该对象可迭代,是 ArrayLike
const range = {
  "0": "a",
  "1": "b",
  length: 2,
};

range[Symbol.iterator] = function () {
  // ...
};

顺带一提,js 的数组类型就是典型既可迭代,又属于 ArrayLike 的类型。

精读

可迭代的内置类型

StringArrayTypedArrayMapSet 都支持迭代,其表现为:

const myString = "abc";
for (let val of myString) {
  console.log(val);
} // 'a', 'b', 'c'

const myArr = ["a", "b", "c"];
for (let val of myArr) {
  console.log(val);
} // 'a', 'b', 'c'

const myMap = [
  ["1", "a"],
  ["2", "b"],
  ["3", "c"],
];
for (let val of myMap) {
  console.log(val);
} // ['1', 'a'], ['2', 'b'], ['3', 'c']

const mySet = new Set(["a", "b", "c"]);
for (let val of mySet) {
  console.log(val);
} // 'a', 'b', 'c'

可迭代对象可以适用哪些 API

可迭代对象首先支持上文提到的 for ... offor ... in 语法。

另外就是许多内置函数的入参支持传入可迭代对象:Map() WeakMap() Set() WeakSet() Promise.all() Promise.allSettled() Promise.race() Promise.any() Array.from()

Array.from 语法,可以将可迭代对象变成真正的数组,该数组的下标就是执行 next() 的次数,值就是 next().value

Array.from(new Set(["1", "2", "3"])); // ['1', '2', '3']

generator 也是迭代器的一种,属于异步迭代器,所以你甚至可以将 yield 一个 generator 函数作为上面这些内置函数的参数:

new Set(
  (function* () {
    yield 1;
    yield 2;
    yield 3;
  })()
);

最后一种就是上周精读提到的 精读《Rest vs Spread 语法》,解构本质也是用迭代器进行运算的:

const range = {
  from: 1,
  to: 5,

  [Symbol.iterator]() {
    this.current = this.from;
    return this;
  },

  next() {
    if (this.current <= this.to) {
      return { done: false, value: this.current++ };
    } else {
      return { done: true };
    }
  },
};

[...range]; // [1, 2, 3, 4, 5]

总结

生活中,我们可以数苹果的数量,数大楼的窗户,数杂乱的衣物有多少个,其实不同的场景这些对象的排列形式都不同,甚至老师在黑板写的 0~10,我们按照这 4 个字符也能从 1 数到 10,这背后的原理抽象到程序里就是迭代器。

一个对象黑盒,不论内部怎么实现,如果我们能按照顺序数出内部结构,那么这个对象就是可迭代的,这就是 [Symbol.iterator] 定义要解决的问题。

生活中与程序中都有一些默认的迭代器,可以仔细领悟一下它们之间的关系。

讨论地址是:精读《迭代器 Iterable》· Issue #448 · dt-fe/weekly

如果你想参与讨论,请 点击这里,每周都有新的主题,周末或周一发布。前端精读 - 帮你筛选靠谱的内容。

关注 前端精读微信公众号

<img width=200 src="https://img.alicdn.com/tfs/TB165W0MCzqK1RjSZFLXXcn2XXa-258-258.jpg">

版权声明:自由转载-非商用-非衍生-保持署名(创意共享 3.0 许可证
点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
1年前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Wesley13 Wesley13
4年前
PPDB:今晚老齐直播
【今晚老齐直播】今晚(本周三晚)20:0021:00小白开始“用”飞桨(https://www.oschina.net/action/visit/ad?id1185)由PPDE(飞桨(https://www.oschina.net/action/visit/ad?id1185)开发者专家计划)成员老齐,为深度学习小白指点迷津。
Wesley13 Wesley13
4年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Wesley13 Wesley13
4年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
4年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
4年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Python进阶者 Python进阶者
2年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
楼玄
楼玄
Lv1
放下屠刀,立地成佛、救人一命,胜造七级浮屠。
文章
4
粉丝
0
获赞
0