8. ㊙ Python 集合三板斧,滚雪球学 Python

梦想橡皮擦
• 阅读 1013

学编程要简单、粗暴。更要有效,很多时候学的越多,忘得越快。但编程总有那么一天顿悟的时候,而顿悟的契机目前就是建立在你跟橡皮擦坚持打卡 100 天,在评论区坚持跟橡皮擦卡学习的朋友,在 100 天之后,橡皮擦将送出 神秘大奖

八、Python 中一个无序且元素唯一的数据类型,它是集合。

8.1 集合是啥

集合是一个数据类型,它其中的每个元素的顺序不固定,但唯一。多么绕的一句话,回味,一定要好好回味。

集合中的元素内容必须是不可变类型,例如整数、浮点数、字符串、元组等内容,可变的列表、字典、集合不可以。

集合本身是可变的,跟列表一样可以增删元素。

8.1.1 集合的声明

截止到现在,小括号用来声明元组,中括号用来声明列表,大括号用来声明字典,那集合怎么办?Python 中也是用大括号来声明集合。当然你也可以通过 set 函数建立集合。

集合定义的语法格式如下:

my_set = {元素1,元素2,...}

简单的代码示例如下:

my_set = {1, 2, 3, 3, 10, 4, 5, 6}

print(my_set)

数据输出之后,会发现重复的整数 3 只剩下一个了。还是因为集合的元素是唯一的,出现重复多的部分将会舍去。

如果在集合中使用了可变类型作为元素,会报错。

my_set = {1, 2, 3, [3, 10, 4, 5, 6]}
# 错误提示:TypeError: unhashable type: 'list'
print(my_set)

这里需要注意下,空集合的声明不能使用 {},只用一个大括号表示的是空字典。声明一个空集合需要用到 set 函数。

8.1.2 set 函数定义集合

使用 set 函数可以定义集合,并且可以定义空集合。set 函数参数可以为字符串、列表、元组。

通过 set 定义空集合

my_dict = {}
my_set = set()

# 空字典
print(type(my_dict))
# 空集合
print(type(my_set))

set 将字符串转换成集合

set 函数类似一个强制转换,可以将其它类型的转换成集合。

my_set = set("my name is xiangpica")
print(my_set)

该内容会过滤重复字母,并且输出的顺序不定,因为集合是无序的。

集合可以对元组去重

借助集合元素的不允许重复,可以实现一些特定的效果,例如去重。

my_tuple = ("apple", "orange", "orange", "pear", "banana", "food")
my_set = set(my_tuple)
print(my_set)

8.2 集合的操作

在学集合相关操作前,需要在学习一些符号。

符号 含义
& 交集
| 并集
- 差集
^ 对称差集

接下来的内容就非常类似高中线代里面的概念了,求集合的交并差集。

8.2.1 交集(intersection)

交集就是求两个集合共有的元素。

my_set1 = {"apple", "orange", "pear", "banana", "food"}
my_set2 = {"apple", "orange", "pear"}

both = my_set1 & my_set2
print(both)

除了通过 & 符号以外,还可以通过集合的 intersection 方法完成。

my_set1 = {"apple", "orange", "pear", "banana", "food"}
my_set2 = {"apple", "orange", "pear"}

both = my_set1.intersection(my_set2)
print(both)

8.2.2 并集(union)

并集就是取所有集合的所有元素,如果出现重复的保留一个。使用符号 | 或者 union 方法完成。

my_set1 = {"apple", "orange", "pear", "banana", "food"}
my_set2 = {"apple", "orange", "pear"}

both = my_set1 | my_set2
print(both)

使用 union 完成。

my_set1 = {"apple", "orange", "pear", "banana", "food"}
my_set2 = {"apple", "orange", "pear"}

both = my_set1.union(my_set2)
print(both)

8.2.3 差集(difference)

对于求集合的差集与交并集不同,有个先后顺序问题,例如属于 A 但不属于 B 表示为 A-B,同理属于 B 但不属于 A,表示为 B-A。

差集的符号是 -,可以使用 difference 方法进行运算。

my_set1 = {"apple", "orange", "pear", "banana", "food"}
my_set2 = {"apple", "orange", "pear", "grape"}
# 求解属于 A,但不属于 B 的元素
dif1 = my_set1 - my_set2
print(dif1)
# 求解属于 B,但不属于 A 的元素
dif2 = my_set2 - my_set1
print(dif2)

接下来如何使用 difference 方法去求差集就交给你自己完成啦。

8.2.4 对称差集(symmetric difference)

A 与 B 两个集合,如果想要获得属于 A 或者 B 集合的元素,但又不要属于 A 且属于 B 的元素,这时就是对称差集的应用场景了。

对称差集的符号是 ^,方法名是 symmetric_difference

my_set1 = {"apple", "orange", "pear", "banana", "food"}
my_set2 = {"apple", "orange", "pear", "grape"}

dif = my_set1 ^ my_set2
print(dif)

上述代码就会输出既不属于 A 也不属于 B 的元素,即对称差集。

8.3 集合的方法

8.3.1 集合的增删

add 方法可以在集合中增加元素,语法格式如下:

my_set.add(新增元素)

第一个需要注意的新的元素如果已经存在集合中,不会新增进去,第二个需要注意的是集合是无序的,新增加元素的位置将不确定。

my_set = {"apple", "orange", "pear", "grape"}
my_set.add("new")
my_set.add("new")
print(my_set)

remove 方法可以删除集合中元素,前提是该元素在集合中,如果删除不存在的元素报错。

my_set = {"apple", "orange", "pear", "grape"}

my_set.remove("apple")

print(my_set)
# 第二次删除报错 因为 apple 已经不在集合中
my_set.remove("apple")
print(my_set)

discard 方法可以删除集合元素,如果元素不存在不会报错。

my_set = {"apple", "orange", "pear", "grape"}

my_set.discard("apple")
print(my_set)

my_set.discard("apple")
print(my_set)

pop 方法为随机删除一个元素,被删除的元素会被返回,即可以用一个变量接收被删除的元素,如果集合为空使用 pop 会报错。

my_set1 = {"apple", "orange", "pear", "grape"}

# pop 方法随机删除一个元素,将被删除的元素返回
var = my_set1.pop()
print(var)

# 空集合使用 pop 方法报错
my_set2 = set()
var = my_set2.pop()
print(var)

clear 方法删除集合内的所有元素

my_set1 = {"apple", "orange", "pear", "grape"}

my_set1.clear()
print(my_set1)

8.3.1 集合的其它方法

isdisjoint 方法用于判断两个集合是否存在相同元素,没有返回 True,否则返回 False。

my_set1 = {"apple", "orange", "pear", "grape"}
my_set2 = {"banana", "watermelon"}

# 两个集合没有相同元素
ret_bool = my_set1.isdisjoint(my_set2)
print(ret_bool) # 返回 True

my_set1 = {"apple", "orange", "pear", "grape"}
my_set2 = {"banana", "watermelon","apple"}

# 两个集合有相同元素
ret_bool = my_set1.isdisjoint(my_set2)
print(ret_bool)

issubset 该方法用于判断一个集合是否是另一个集合的子集,确定是返回 True,否则返回 False。

my_set1 = {"apple", "orange", "pear", "grape"}
my_set2 = {"banana", "watermelon"}

# 第二个集合不是第一个集合的子集
ret_bool = my_set2.issubset(my_set1)
print(ret_bool) # 返回 False

# 第二个集合是第一个集合的子集
my_set1 = {"apple", "orange", "pear", "grape"}
my_set2 = {"orange","apple"}

ret_bool = my_set2.issubset(my_set1)
print(ret_bool) # 返回 True

注意判断 A 是 B 的子集,格式是 A.issubset(B),顺序别搞错。

issuperset 方法用于判断一个集合是否是另一个集合的父集,与 issubset 恰好相反,具体实现由大家自行完成。

update 方法用于将一个集合的元素添加到另一个集合内,语法格式如下:

被添加的集合A.update(待添加的集合B)

该方法谁在前就是给谁添加。

my_set1 = {"apple", "orange", "pear", "grape"}
my_set2 = {"banana", "watermelon"}

my_set1.update(my_set2)
print(my_set1)

其它一些方法,本轮滚雪球阶段只做了解。

  • intersection_update 此方法用于求多个集合的交集
  • difference_update 删除集合内与另一集合重复的元素
  • symmetric_difference_update 类似对称差集的用法

8.4 集合可用的内置函数

8.4.1 max、min、sum

以上内置函数作用域集合与列表使用规则一致,自行测试即可。

8.4.2 len

获取集合元素的数量。

8.4.3 sorted

使用该函数可以对集合进行排序。

8.5 冻结集合 frozenset

集合中的元素可以添加与删除,与列表可以对应。 还存在一种不可进行添加与删除元素的集合,叫做冻结集合,与元组可以对应学习。

冻结集合不做展开讲解,有兴趣的可以检索一些,不过我觉得这节课内容已经非常多啦。

8.6 这篇博客的总结

集合,一个无序且元素必须唯一的容器型数据类型,在橡皮擦的编程生涯中,集合经常用来去重,效率高、编写简单,值得掌握。

下篇博客开始,我们将进入 Python 函数的世界,难度要来了哦~

最后一碗毒鸡汤

当你学会破罐破摔 你会发现这世界豁然开朗 O(∩_∩)O 哈哈~

🍂🍂🍂🍂🍂🍂🍂


8. ㊙ Python 集合三板斧,滚雪球学 Python

点赞
收藏
评论区
推荐文章
浅梦一笑 浅梦一笑
6天前
初学 Python 需要安装哪些软件?超级实用,小白必看!
编程这个东西是真的奇妙。对于懂得的人来说,会觉得这个工具是多么的好用、有趣,而对于小白来说,就如同大山一样。其实这个都可以理解,大家都是这样过来的。那么接下来就说一下python相关的东西吧,并说一下我对编程的理解。本人也是小白一名,如有不对的地方,还请各位大神指出01名词解释:如果在编程方面接触的比较少,那么对于软件这一块,有几个名词一定要了解,比如开发环
blmius blmius
1年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录 问题 用navicat导入数据时,报错: 原因这是因为当前的MySQL不支持datetime为0的情况。 解决修改sql\mode: sql\mode:SQL Mode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。 全局s
梦想橡皮擦 梦想橡皮擦
1年前
7. ✎会查新华字典不?会。Python字典已经掌握了
学编程要简单、粗暴。更要有效,很多时候学的越多,忘得越快。但编程总有那么一天顿悟的时候,而顿悟的契机目前就是建立在你跟橡皮擦坚持打卡 100 天,在评论区坚持跟橡皮擦卡学习的朋友,在 100 天之后,橡皮擦将送出 神秘大奖。 七、查字典怎么查,Python 字典就怎么用 已经学完了列表与元组,那这两个都是按照顺序排列的,所以可以用索引取到值,本篇博
梦想橡皮擦 梦想橡皮擦
1年前
6. Python 元组,不可变的列表,滚雪球学 Python
希望看到文章的 Python 学习爱好者可以坚持打卡,在评论区坚持跟橡皮擦卡学习的朋友,在 100 天之后,橡皮擦将送出神秘大奖。 六、Python 元组,不可变的列表 今天新学习的概念叫做元组,其实学元组还是离不开列表,第一个知识点是元组的英文 tuple 要牢牢记住,第一个知识点是元组与列表的区别,列表的元素可以修改,元组的元素不可以修改,所以
Stella981 Stella981
11个月前
Python之time模块的时间戳、时间字符串格式化与转换
Python处理时间和时间戳的内置模块就有`time`,和`datetime`两个,本文先说`time`模块。 ### 关于时间戳的几个概念 * 时间戳,根据1970年1月1日00:00:00开始按秒计算的偏移量。 * 时间元组(`struct_time`),包含9个元素。  `time.struct_time(tm_y
Easter79 Easter79
11个月前
Twitter的分布式自增ID算法snowflake (Java版)
概述 == 分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。 有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。 而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
11个月前
MySQL查询按照指定规则排序
1.按照指定(单个)字段排序 select * from table_name order id desc; 2.按照指定(多个)字段排序 select * from table_name order id desc,status desc; 3.按照指定字段和规则排序 selec
Stella981 Stella981
11个月前
Angular material mat
Icon Icon Name mat-icon code _add\_comment_ add comment icon <mat-icon> add\_comment</mat-icon> _attach\_file_ attach file icon <mat-icon> attach\_file</mat-icon> _attach\
Wesley13 Wesley13
11个月前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
#### 背景描述 # Time: 2019-01-24T00:08:14.705724+08:00 # User@Host: **[**] @ [**] Id: ** # Schema: sentrymeta Last_errno: 0 Killed: 0 # Query_time: 0.315758 Lock_
helloworld_34035044 helloworld_34035044
2个月前
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。 uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid() 或 uuid(sep)参数说明:sep 布尔值,生成的uuid中是否包含分隔符'',缺省为