# 集合

{guilabel}`视频`

<iframe id="Python"
    title="Python 集合"
    width="100%"
    height="600"
    src="https://developer.hs.net/thread/1865">
</iframe>

集合的元素必须是不可变对象，且元素间有互异性。分为两类：

- {class}`set`()：可变集合
- {class}`frozenset`()：不可变集合

它们的区别主要在于是否可变，以及写法上面。

{class}`set` 的定义可以为：

In [1]:
set('Hello') # 写法 1

{'H', 'e', 'l', 'o'}

In [2]:
{'H', 'e', 'l', 'o'} # 写法 2

{'H', 'e', 'l', 'o'}

{class}`frozenset` 的定义：

In [5]:
frozenset('Hello')

frozenset({'H', 'e', 'l', 'o'})

下面先以 {class}`set` 为例 Python 如何操作集合的。

## 基本操作

- 支持 {meth}`add` 方法，添加元素

In [8]:
s = set(['Python','is','a','magic','language'])
s

{'Python', 'a', 'is', 'language', 'magic'}

In [9]:
s.add('!')
s

{'!', 'Python', 'a', 'is', 'language', 'magic'}

- 支持 函数 {func}`len`、{func}`min`、{func}`max` 运算

In [17]:
s = {5, 7, 3, 2, 9, 35, 5, 34, 5, 7}
s # 自动去重

{2, 3, 5, 7, 9, 34, 35}

In [18]:
min(s)

2

In [19]:
max(s)

35

In [20]:
len(s)

7

- 支持更新（{meth}`update`）

In [21]:
a = set([1, 2, 3, 4])
b = set([3, 4, 5, 6])
a.update(b)
a

{1, 2, 3, 4, 5, 6}

- 方法 {meth}`remove` 删除集合中元素

In [22]:
s = set('hello')
s

{'e', 'h', 'l', 'o'}

In [23]:
s.remove('h')

In [24]:
s

{'e', 'l', 'o'}

- 若 {meth}`remove` 元素不存在，则会引发错误；而 {meth}`discard` 则不会。

In [25]:
s.remove('om')

KeyError: 'om'

In [26]:
s.discard('om')

In [27]:
s

{'e', 'l', 'o'}

## 相等与不相等

In [28]:
set('Python') == set('python')

False

In [29]:
set('Python') != set('python')

True

## 子集 与 超集

`<`、`<=`、`>`、`>=` 用来判断前面一个集合是否是后面一个集合的严格子集，子集，严格超集，超集。

In [30]:
set('Hello') < set('HelloWorld')

True

In [31]:
set('Hello') <= set('Hello')

True

In [32]:
set('Hello') < set('Hello')

False

## 并集（$\bigcup$）使用  `|`

In [33]:
set('Hello') | set('world')

{'H', 'd', 'e', 'l', 'o', 'r', 'w'}

## 交集（$\bigcap$）使用 `&`

In [34]:
set('Hello') & set('world')

{'l', 'o'}

## 差集（$-$）使用 `-`

In [35]:
set('Hello') - set('world')

{'H', 'e'}

## 对称差使用 ` ^ `

In [36]:
set([1,2,3,4]) ^ set([3,4,5,6])

{1, 2, 5, 6}

## 可变与不可变

In [44]:
a = set((2, 3))

a.remove(2)
a

{3}

In [45]:
a = frozenset((2, 3))

a.remove(2)
a

AttributeError: 'frozenset' object has no attribute 'remove'

## 集合的特性

- 如是可变集合（`set`）与不可变集合（`frozenset`）进行运算，得到的新集合的类型与左操作数相同。        
- 对于可变集合（`set`）可以进行就地修改，支持操作符：`|=`、`&=`、`-=`、`^=`。
- 集合只能包含不可变的（即可散列的）对象类型。

In [37]:
a = set('Hello')
a |= set('Python')
a

{'H', 'P', 'e', 'h', 'l', 'n', 'o', 't', 'y'}

In [38]:
a = set('Hello')
a &= set('Python')
a

{'o'}

In [39]:
a = set('Hello')
a -= set('Python')
a

{'H', 'e', 'l'}

In [40]:
a = set('Hello')
a ^= set('Python')
a

{'H', 'P', 'e', 'h', 'l', 'n', 't', 'y'}

In [41]:
b = set('Hello') | frozenset('Python')
b

{'H', 'P', 'e', 'h', 'l', 'n', 'o', 't', 'y'}

In [42]:
c = frozenset('Python') | set('Hello')
c

frozenset({'H', 'P', 'e', 'h', 'l', 'n', 'o', 't', 'y'})