In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

## 列表（list）

列表也是Python中的基础数据结构，是一个有序的集合，表现形式为方括号内用逗号分割的各个数据项集合，列表中的数据项可以是不同的数据类型。

In [2]:
list1 = ['Google', 'Baidu', '1854', '2000']
list1

['Google', 'Baidu', '1854', '2000']

列表中的每个值都有对应的位置索引，索引从0开始，索引范围为0~len(list)-1，当超出范围时会报IndexError错误，取最后一个元素时可以用-1做索引。

### 列表函数

- 列表数据项个数

In [3]:
len(list1)

4

- 列表数据项中的最大值(列表所有数据项类型相同时)

In [4]:
max(list1)

'Google'

- 列表数据项中的最小值(列表所有数据项类型相同时)

In [5]:
min(list1)

'1854'

- 列表末尾追加数据项

In [6]:
list1.append('1994')
list1

['Google', 'Baidu', '1854', '2000', '1994']

- 指定位置插入数据项

In [7]:
list1.insert(1,'Henry-chr')
list1

['Google', 'Henry-chr', 'Baidu', '1854', '2000', '1994']

- 删除末尾数据项

In [8]:
list1.pop()
list1

'1994'

['Google', 'Henry-chr', 'Baidu', '1854', '2000']

- 删除指定位置数据项

In [9]:
list1.pop(1)
list1

'Henry-chr'

['Google', 'Baidu', '1854', '2000']

- 更新指定位置数据项

In [10]:
list1[0]='Google Chrom'
list1

['Google Chrom', 'Baidu', '1854', '2000']

- 元素在列表中出现的次数

In [11]:
list1.count('1854')

1

- 移除列表中的第一个匹配项

In [12]:
list1.remove('2000')
list1

['Google Chrom', 'Baidu', '1854']

- 反向列表

In [13]:
list1.reverse()
list1

['1854', 'Baidu', 'Google Chrom']

- 列表排序

In [14]:
list1.sort()
list1

['1854', 'Baidu', 'Google Chrom']

## 元组（tuple）

tuple同list类似，但是tuple一旦初始化就不能修改。
tuple使用小括号()，list使用方括号[]

当tuple只有一个数据项时定义方法如下：

In [15]:
t = (1,)
t

(1,)

## 字典（dict）

字典使用键-值(key-value)存储,具有极快的查询速度

字典的每个键值对(key=>value)用冒号(：)分割，每个键值对之间用逗号(,)分割，整个字典包括在花括号 {} 中 

字典的值可以取任何数据类型，但字典的键必须是唯一不可变的

In [16]:
dict1 = {"name":"Henry-chr","age":27}
dict1

{'name': 'Henry-chr', 'age': 27}

### 字典函数

- 返回指定键的值

In [17]:
dict1.get('name')

'Henry-chr'

- 判断是否在字典中存在

In [18]:
'name' in dict1

True

- 以列表返回视图对象(动态视图:随字典的改变而改变)

In [19]:
dict1.items()
dict1.keys()
dict1.values()

dict_items([('name', 'Henry-chr'), ('age', 27)])

dict_keys(['name', 'age'])

dict_values(['Henry-chr', 27])

- 删除指定key

In [20]:
dict1.pop('age')
dict1

27

{'name': 'Henry-chr'}

### 字典VS列表

字典

    1. 查找和插入的速度极快，不会随着key的增加而变慢；
    2. 需要占用大量的内存，内存浪费多。
列表

    1. 查找和插入的时间随着元素的增加而增加；
    2. 占用空间小，浪费内存很少。

## 集合（set）

集合是一个无序的不重复元素序列。
可以使用大括号 { } 或者 set() 函数创建集合。

In [21]:
set1 = set(("Google", "Baidu", "Taobao"))
set1

{'Baidu', 'Google', 'Taobao'}

### 集合函数

- 添加元素

In [22]:
set1.add('Jingdong')
set1

{'Baidu', 'Google', 'Jingdong', 'Taobao'}

- 移除元素

In [23]:
set1.remove('Taobao')
set1
set1.discard('Taobao')
set1
set1.pop()
set1

{'Baidu', 'Google', 'Jingdong'}

{'Baidu', 'Google', 'Jingdong'}

'Google'

{'Baidu', 'Jingdong'}

remove和discard的区别在于，remove的元素集合中不存在时会报错而discard不会

pop是随机的

- 计算集合元素个数

In [24]:
len(set1)

2

- 判断元素是否在集合中存在

In [25]:
'Didi' in set1

False

- 返回集合的差集

In [26]:
x = {"a", "b", "c"}
y = {"g", "m", "a"}
x.difference(y)
x
x.difference_update(y) 
x

{'b', 'c'}

{'a', 'b', 'c'}

{'b', 'c'}

difference返回一个移除相同元素的新集合，difference_update直接在原来的集合中移除元素，没有返回值。

- 返回集合的交集

In [27]:
x = {"a", "b", "c"}
y = {"q", "w", "c"}
x.intersection(y)
x
x.intersection_update(y)
x

{'c'}

{'a', 'b', 'c'}

{'c'}

intersection()返回一个新的集合，intersection_update()在原始的集合上移除不重叠的元素。

- 判断两个集合是否包含相同的元素

In [28]:
x = {"a", "b", "c"}
y = {"g", "m", "a"}
 
x.isdisjoint(y) # y中是否有集合x的元素

False

没有返回TRUE，否则返回FALSE

- 判断集合的所有元素是否都包含在指定集合中

In [29]:
x = {"a", "b", "c"}
y = {"g", "m", "a"}
 
x.issubset(y) # 判断集合 x 的所有元素是否都包含在集合 y 中
x.issuperset(y) # 判断集合 y 的所有元素是否都包含在集合 x 中

False

False

- 返回两个集合中不重复的元素集合

In [30]:
x = {"a", "b", "c"}
y = {"g", "m", "a"}
x.symmetric_difference(y) # 移除两个集合的重复元素返回两个集合中不重复的元素集合
x.symmetric_difference_update(y) # 移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中
x
y

{'b', 'c', 'g', 'm'}

{'b', 'c', 'g', 'm'}

{'a', 'g', 'm'}

- 返回两个集合的并集

In [31]:
x = {"a", "b", "c"}
y = {"g", "m", "a"}
x.union(y) # 重复的元素只会出现一次

{'a', 'b', 'c', 'g', 'm'}