# 内置数据结构（变量类型）
- list：一组有顺序，可重复，可修改的数据组合
- set：一组无顺序，无重复，不可修改的数据组合
- dict：一组无顺序的键值对的数据组合，数据的键（key）不可重复，不可修改
- tuple：一组有顺序，可重复，不可修改的数据组合
- python与Java等不同，不要求以上数据结构中的元素的类型一致

# list
- 特点
    - 有顺序：list中每个元素都有对应的下标（索引）
    - 可修改：可以随意修改某个下标对应的值
    - 可重复：不同下标对应的值可以相同
    - 列表中元素不需要具有相同类型
    
## list的创建
- 普通创建方式
    - [a1, a2, a3]
    - list(param)，注意param必须是可迭代的，比如字符串、列表、元组等
- 迭代创建方式：使用for关键字

In [40]:
# 普通创建
# 创建空列表
a1 = []
a2 = list()
print(a1, '\t', a2)

# 创建有元素的列表
# list() 方法可以接受一个可迭代（list或者tuple）的参数，将参数中的每一个元素当成该list的元素
b1 = [1, 'a']
b2 = list([1, 'a'])
b3 = list((1, 'a'))
print(b1, '\t', b2, '\t', b3)

[] 	 []
[1, 'a'] 	 [1, 'a'] 	 [1, 'a']


In [46]:
# 迭代创建方式
# for
a = [2, 5, 1, 7, 8, 4, 9]
# 下面代码的含义是，对于所有a中的元素，逐个放入新列表b中
b = [i for i in a]
print(b)

# 可以同时使用if关键字进行条件过滤
# 只需要列表中为偶数的元素
c = [i for i in a if i %2 == 0]
print(c)

# 使用内置函数range()
d = [i for i in range(1, 5)]
print(d)

[2, 5, 1, 7, 8, 4, 9]
[2, 8, 4]
[1, 2, 3, 4]


In [50]:
# 列表生成是可以嵌套,此时等于两个for循环嵌套
e = [m+n for m in c for n in d]
print(e)

# 上面代码跟下面代码等价
f = []
for m in c:
    for n in d:
        f.append(m+n)
print(f)

# 嵌套的列表生城市也可以用条件表达式
c = [  m+n for m in c for n in d if m+n < 6]
print(c)

[6, 7, 8, 9, 5, 6, 7, 8, 6, 7, 8, 9, 5, 6, 7, 8, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, 7, 8, 6, 7, 8, 9]
[6, 7, 8, 9, 5, 6, 7, 8, 6, 7, 8, 9, 5, 6, 7, 8, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, 7, 8, 6, 7, 8, 9]
[5, 5, 4, 5, 5]


## list常用操作：访问和分片
- 访问
    - 使用下标（索引）定位元素
    - 正数索引，从左到右，下标从0开始，步长为1递增
    - 负数索引，从右到左，下标从-1开始，步长为1递减
- 分片操作
    - 对列表进行任意一段的截取
    - l[b:e:s] 
        - b表示起始索引，e表示结束索引（不含），s表示步长（默认为1）
        - b、e、s是非必需的
        - l[::]、l[:]也是可以的
    - list的分片操作产生的是一个新的list
        - 可以同内置函数id()来判断

In [14]:
# 访问
# 列表a的索引
# 正数索引：  0 ， 1，  2，3
# 负数索引：-4，-3，-2，-1
a  = [1, 2 ,3, 4]
print(a[0], a[3], sep='\t')
print(a[-4], a[-1], sep='\t')

1	4
1	4


In [23]:
# 分片-正数索引
# 分片操作同样遵循左闭右开原则
l  = [1, 2 ,3, 4]

# 区间参数和步长参数都是可以省略，分片结果就是列表本身
print(l[:], l[::], sep = '\t')

# l[2:]表示截取从下标1开始，一直到结束的元素
# l[:2]表示截取从0开始，一直到下标2以前（即不含下标2的元素）的元素
print(l[2:], l[:2], sep = '\t')

# 指定开始和结束索引
print(l[1:2])

[1, 2, 3, 4]	[1, 2, 3, 4]
[3, 4]	[1, 2]
[2]


In [24]:
# 分片-负数索引

# 只指定一个区间参数
print(l[-2:], l[:-2], sep = '\t')

# 指定开始和结束索引
# 负数索引也是左小右大，b[-1:-2]的结果是空集，
# 但设置步长为负数可以实现截取元素
print(l[-1:-2])
print(l[-1:-2:-1])
print(l[-2:-1])

[3, 4]	[1, 2]
[]
[4]
[3]


In [25]:
print(l)
# 分片可以控制增长幅度，默认增长幅度为1
print(l[1:6:1])

# 打印从下标1开始的数字，每次隔一个
print(l[1:6:2])

# 下标可以超出范围，超出后不在考虑多余下标内容
print(l[2:10])

# 下标值，增长幅度可以为负数
# 为负数，表明顺序是从右往左
# 规定： 数组最后一个数字的下标是-1

[1, 2, 3, 4]
[2, 3, 4]
[2, 4]
[3, 4]


In [31]:
# 验证list分片操作产生新的list案例
a = b = 1000
print(id(a), id(b), sep='\n')
print('*' * 100)

# 改变b的值后，a和b指向的变量就不是同一个
b = 10001
print(a, b, sep='\t')
print(id(a), id(b), sep='\n')

140666891022768
140666891022768
****************************************************************************************************
1000	10001
140666891022768
140666891980272


In [32]:
# 通过id可以直接判断出分片是从新生成了一份数据还是使用的同一份数据
l = [3,4,56,76,32,21,43,5]
ll = l[:]
lll = ll
# 如果两个id值一样，则表明分片产生的列表是使用的同一地址同一份数据
# 否则，则表明分片是从新生成了一份数据，即一个新的列表，然后把数值拷贝到新列表中
print(id(l))
print(id(ll))
print(id(lll))

# 通过id知道，ll和lll是同一份数据，验证代码如下
l[1] = 100
print(l)
print(ll)

ll[1] = 100
print(ll)
print(lll)

140666891743944
140666891467016
140666891467016
[3, 100, 56, 76, 32, 21, 43, 5]
[3, 4, 56, 76, 32, 21, 43, 5]
[3, 100, 56, 76, 32, 21, 43, 5]
[3, 100, 56, 76, 32, 21, 43, 5]


## list常用操作：新增、修改、删除
- 新增
    - insert()函数:在指定索引的位置插入新的元素
    - append()函数:在列表的最后插入新的元素
- 修改
    - 使用下标
- 删除
    - del 关键字
        - 删除指定索引的元素
        - 可以删除整个list
    - remove()
        - list内置函数
        - 删除指定索引的元素

In [12]:
# 新增
# insert()：在指定索引的位置插入新的元素
a = [1, 2, 3, 4, 5]
print(a)

# 在索引为1的地方新增元素7
a.insert(1, 7)
print(a)
print('列表a的长度为：{}'.format(len(a)))

# a数组的长度为6，因此最大索引是5，此时是可以在索引为6的地方新增一个元素
# 在索引为6的地方新增元素7
a.insert(5, 7)
print(a)
print('列表a的长度为：{}'.format(len(a)))

# 以下案例可以看出，当插入的位置大于当前列表的大小时，
# 默认会在列表的最后插入该元素
# 效果与append方法一样
a.insert(10, 8)
print(a)

print('*' * 100)

[1, 2, 3, 4, 5]
[1, 7, 2, 3, 4, 5]
列表a的长度为：6
[1, 7, 2, 3, 4, 7, 5]
列表a的长度为：7
[1, 7, 2, 3, 4, 7, 5, 8]
****************************************************************************************************
[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5, 6]


In [22]:
# 新增
# append()：在列表的最后插入新的元素
# 
b = [1, 2, 3, 4, 5]
print(b)
b.append(6)
print(b)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5, 6]


In [16]:
# 修改
a = [1, 2]
print(a)

# 将索引为1的元素修改为3
a[1] = 3
print(a)

[1, 2]
[1, 3]


In [25]:
#删除
a = [1, 2, 3, 4, 5, 6, 7, 8]
print(id(a), a)

# 删除指定索引的元素
del a[1]
print(id(a), a)

a.remove(3)
print(id(a), a)

# 删除整个列表a
del a
print(a)

139716092463048 [1, 2, 3, 4, 5, 6, 7, 8]
139716092463048 [1, 3, 4, 5, 6, 7, 8]
139716092463048 [1, 4, 5, 6, 7, 8]


NameError: name 'a' is not defined

## list的常用操作：+、×
- 运算
    - 加：+，直接拼接
    - 乘：×，重复拼接

In [33]:
a = [1, 2, 3, 4, 5]
b = [3, 4, 5, 6, 7]

# 加
print(a+b)

# 乘
print(a*3)

# 创建默认值的一维或二维列表
c = [0] * 10
d = [[0] * 5] * 2
print(c, d, sep='\n')

[1, 2, 3, 4, 5, 3, 4, 5, 6, 7]
[1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
[[0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]


## list的遍历
- for
- while

In [34]:
# for in list
a = [1,2,3,4,5]

# 挨个打印a里边的元素
for i in a:
    print(i)

1
2
3
4
5


In [35]:
# range
# in 后面的变量要求是可以可迭代的内容
for i in range(1,6):
    print(i)

print(type(range(1,10)))

1
2
3
4
5
<class 'range'>


In [36]:
# while循环访问list
# 一般不用while遍历list

a = [1,2,3,4,5,6]
length = len(a)
# indx表示的是list的下标
indx = 0
while indx < length:
    print(a[indx])
    indx += 1

1
2
3
4
5
6


In [37]:
# 双层列表循环

#a 为嵌套列表，或者叫双层列表
a = [["one", 1], ["two", 2], ["three", 3] ]

for k,v in a:
    print(k, "--", v)

one -- 1
two -- 2
three -- 3


In [38]:
# 双层列表循环变异

#a 为嵌套列表，或者叫双层列表
a = [["one", 1, "eins"], ["two", 2], ["three", 3,4,5,6,8] ]

for k,v in a:
    print(k, "--", v)

ValueError: too many values to unpack (expected 2)

In [39]:
# 双层列表循环变异

#a 为嵌套列表，或者叫双层列表
a = [["one", 1, "eins"], ["two", 2,"zwei"], ["three", 3,"drei"] ]
#这个例子说明，k，v,w的个数应该跟解包出来的变量个数一致
for k,v,w in a:
    print(k, "--", v, "--",w)

one -- 1 -- eins
two -- 2 -- zwei
three -- 3 -- drei


# list相关函数
- 统计函数，并不是list独有，可以适用多种数据类型
- list内置函数

## 统计函数
- len()：求数据对象的长度，即元素个数
- min()：求数据对象最小的元素
- max()：求数据对象最大的元素

In [4]:
# 求列表长度，即元素个数
a = [x for x in range(10, 16)]
print(len(a))

# 求列表最小元素
print(min(a))

# 求列表最大元素
print(max(a))

# 将其他格式的数据转成list
# 空格也是list中的一个元素
s = 'I love Songmengzhao'
l1 = list(s)
print(l1)

# 将range函数的结果转成list
l2 = list(range(10, 16))
print(l2)

6
10
15
['I', ' ', 'l', 'o', 'v', 'e', ' ', 'S', 'o', 'n', 'g', 'm', 'e', 'n', 'g', 'z', 'h', 'a', 'o']


## list内置函数
- append(el)：在list末尾处追加一个元素el
- insert(idx, el)：在索引为idx处插入一个元素el
- pop()：从list末尾去除一个元素，同时作为返回值。该方法会使list大小减1
- remove(el)：删除掉el元素，有重复值时只删除索引最小的那个，可能报异常，需要使用tra-catch
- reverse()：翻转list元素，在原list上进行操作
- clear()：清空list，在原list上进行操作
- extend()：等同+操作
- count(el)：查找列表中指定值或元素的个数
- copy()：此函数是浅拷贝
- sort([reverse=False])：排序，默认升序；关键字参数reverse设置为True可实现降序

In [4]:
# reverse()
a = [1, 2, 3, 4, 5, 4]
a.reverse()
print(a)

# clear()
a.clear()
print(a)

# extend()
b = [1, 2, 3, 4] * 2
c = [4 , 4, 2]
b.extend(c)
print(b)

# count()
n = b.count(4)
print(n)

# remove
print(b)
b.remove(4)
print(b)
# 没有100元素，remove报错
# b.remove(100)

# pop
el = b.pop()
print(el, '\t', b)

[4, 5, 4, 3, 2, 1]
[]
[1, 2, 3, 4, 1, 2, 3, 4, 4, 4, 2]
4
[1, 2, 3, 4, 1, 2, 3, 4, 4, 4, 2]
[1, 2, 3, 1, 2, 3, 4, 4, 4, 2]


ValueError: list.remove(x): x not in list

In [13]:
# copy 案例
a = [1, 2, 3]
b = a
print(b)

b[2] = 4
# 改变b[2]的值后，打印a，a的第二个元素也改变了
print(a, '\t', b)

print('*' * 100)

c= [1, 2, 3]
d = c.copy()
print(d)

d[2] = 4
# 改变d[2]的值后，打印a，a的第二个元素没有发生变化
print(c, '\t', d)

print('*' * 100)

e = [1 , 2, [1, 2, 3]]
f =e.copy()
print(f)

f[2][2] = 4
# f的第二个值是一个列表，改变该列表的第二个值值后
# 打印e，e中的列表的第二个值还是发生变化
print(e, '\t', f)

print('*' * 100)
#copy函数同样是浅拷贝
# 神拷贝需要使用copy包
import copy
g = copy.deepcopy(e)
g[2][2] = 5
# g的第二个值是一个列表，改变该列表的第二个值值后
# 打印e，e中的列表的第二个值还是发生变化
print(e, '\t', g)

[1, 2, 3]
[1, 2, 4] 	 [1, 2, 4]
****************************************************************************************************
[1, 2, 3]
[1, 2, 3] 	 [1, 2, 4]
****************************************************************************************************
[1, 2, [1, 2, 3]]
[1, 2, [1, 2, 4]] 	 [1, 2, [1, 2, 4]]
****************************************************************************************************
[1, 2, [1, 2, 4]] 	 [1, 2, [1, 2, 5]]


In [5]:
# sort
a = [43, 5, 1, 7,  3, 8]
print(a)

a.sort()
print(a)

a.sort(reverse=True)
print(a)

[43, 5, 1, 7, 3, 8]
[1, 3, 5, 7, 8, 43]
[43, 8, 7, 5, 3, 1]
