## Python Collection

### list

#### 基本用法

In [8]:
l = [1, 2, 3]
print(l)

[1, 2, 3]


In [9]:
for _ in l:
    print(_)

1
2
3


#### 增删新元素

In [13]:
l = [1, 2, 3]

l.append(4)
print(l)

l.remove(4)
print(l)

[1, 2, 3, 4]
[1, 2, 3]


In [17]:
l = [1, 2, 3]

l.append(4)
l.append(5)
l.append(4)
print(l)

# 移除第一个等于 4 的元素
l.remove(4)
print(l)

[1, 2, 3, 4, 5, 4]
[1, 2, 3, 5, 4]


In [19]:
l = [1, 2, 3]
l.clear()
print(l)

[]


In [26]:
# 插入新元素到指定下标到位置
l = [1, 2, 3]
l.insert(2, 4)
print(l)

[1, 2, 4, 3]


#### 合并 list

In [28]:
l = [1, 2, 3]
l2 = [4, 5, 6]
print(l + l2)

[1, 2, 3, 4, 5, 6]


In [29]:
l = [1, 2, 3]
l += l
print(l)

[1, 2, 3, 1, 2, 3]


In [30]:
l = [1, 2, 3]
l *= 3
print(l)

[1, 2, 3, 1, 2, 3, 1, 2, 3]


#### 单层 list

In [1]:
# range(start, stop, step)
# 参数三 如果是负数，则是倒序遍历
# 注意 [start, stop) 是前闭后开的
[ _ for _ in range(3, 0, -1)]

[3, 2, 1]

#### 双层 list

In [4]:
[[_ for _ in "宇宙湾"] for _ in range(2)]

[['宇', '宙', '湾'], ['宇', '宙', '湾']]

#### Join 双层 list

In [5]:
'.'.join(str(x) for inner_arr in ['yuzhouwan', 'com'] for x in inner_arr)

'y.u.z.h.o.u.w.a.n.c.o.m'

### set

In [None]:
{1, 2, 3}

### tuple

In [None]:
(1, 2, 3)

### dict

In [None]:
dict(github='asdf2014', blog='yuzhouwan.com', name='宇宙湾')

### 高级用法

In [1]:
{'1', '2', '3'}

{'1', '2', '3'}

In [2]:
print(hash('1'))
print(hash('2'))
print(hash('3'))

156844085362250908
-2550780257849425624
-4433892665662431183


In [3]:
set1 = {'1', '2', '3'}
set1.remove('1')
print(set1)
set1.remove('2')
print(set1)
set1.remove('3')
print(set1)

set1.add('1')
print(set1)
set1.add('2')
print(set1)
set1.add('3')
print(set1)

{'2', '3'}
{'3'}
set()
{'1'}
{'2', '1'}
{'3', '2', '1'}


In [4]:
{'1'} | {'2'} | {'3'}

{'1', '2', '3'}

In [5]:
{'1', '2', '3'} & {'2', '3', '4'}

{'2', '3'}

In [6]:
{'1', '2', '3'} and {'2', '3', '4'}

{'2', '3', '4'}

In [7]:
{'2', '3', '4'} and {'1', '2', '3'}

{'1', '2', '3'}

In [8]:
{} and {'2', '3', '4'}

{}

In [9]:
bool({})

False

In [10]:
bool({'1', '2', '3'})

True

In [8]:
s = {1}
id(s.union({2}))

140531211101792

In [7]:
id(s.union({3}))

140531211100224

In [5]:
id(s.union({2, 3}))

140531211100224

In [6]:
id(s.union({2, 4}))

140531211100224

## 思考

In [9]:
s2 = s.union({2, 3})
s3 = s.union({2, 4})
print(id(s2))
print(id(s3))

140531211101792
140531211100224


使用 set 的 union 函数之后，再次时候 id 函数

如果是将 union 函数的结果保存在变量中，那么 id 计算出来的 hash 值是不一样的

但是，如果不额外使用变量进行存储，直接采用 id(set1.union(set2)) 的方式计算，得出来的 hash 值是一样的

首先，当执行了以下操作：

```python
s2 = s.union({2, 3})
s3 = s.union({2, 4})
```

实际上，会创建两个新的集合，因此它们的内存位置（由 `id()` 返回）是不同的

但是，如果执行以下操作：

```python
id(s.union({2, 3}))
id(s.union({2, 4}))
```

由于 Python 的内存管理机制，当这些临时创建的集合没有被分配给任何变量时，Python 可能会在完成第一个 `id()` 调用后立即回收那个集合的内存，然后在执行第二个 `union` 时重新使用相同的内存位置。这意味着两个 `id()` 调用可以返回相同的值

但是，这种行为不是 Python 的标准或确定的行为。这完全取决于 Python 的内存管理和垃圾收集机制，而这些机制在不同的 Python 实现或版本中可能会有所不同。因此，不应该基于这种行为，来实现业务逻辑

总的来说，当涉及到内存地址和对象 ID 时，我们应该避免对 Python 的行为做过多的假设。除非有明确的理由，否则最好不要依赖对象的 ID 或它们在内存中的位置

### links

- [Python set doc](https://docs.python.org/3/library/stdtypes.html?highlight=set#set)
- [Python collections](https://docs.python.org/3/library/collections.html)