# 默认代码

In [1]:
# 抑制警告
import warnings
warnings.filterwarnings('ignore')

# List
>- 可包含不同类型元素的容器
>- `list()` 为内置函数，定义变量时应该避免使用 `list` 作为变量名

In [2]:
L = [1 , 2. , 'abc' , True]

## 长度 `len()`
> 对于 Tuple 和 String 和 Dictionary 也适用

In [3]:
len(L)

4

## 用于 `for` 循环

In [4]:
print(type(L))

for item in L:
    print(type(item))

<class 'list'>
<class 'int'>
<class 'float'>
<class 'str'>
<class 'bool'>


In [5]:
print([type(item) for item in L])

[<class 'int'>, <class 'float'>, <class 'str'>, <class 'bool'>]


## 增

### 尾部追加

In [6]:
L = [1 , 2. , 'abc' , True]

# append(object)
# 作为一个元素添加在 List 尾部，直接修改原 List

L.append(-99)
L.append(3.14)
L.append(['9' , '9' , '9'])
L

[1, 2.0, 'abc', True, -99, 3.14, ['9', '9', '9']]

In [7]:
L = [1 , 2 , 3]
l = ['a' , 3.14]

# extend(iterable)
# 将可迭代对象中的元素依次追加在 List 尾部，直接修改原 List
# 与下面的 + 拼接唯一区别是，直接修改原 List

L.extend(l)
L

[1, 2, 3, 'a', 3.14]

### 倍增 `*`

In [8]:
print(len([1 , [-1]] * 3))
[1 , [-1]] * 3

6


[1, [-1], 1, [-1], 1, [-1]]

### 拼接 `+`

In [9]:
L1 = [-1 , -2.]
L2 = [ [909 , 808 , 707] ]
L3 = ['xxx' , 2]

# 与上面的 extend 尾部追加的唯一区别是，不影响原 List

print(L1 + L2 + L3)
print(L1)
print(L2)
print(L3)
print(len(L1 + L2 + L3))

[-1, -2.0, [909, 808, 707], 'xxx', 2]
[-1, -2.0]
[[909, 808, 707]]
['xxx', 2]
5


### 首部插入

In [10]:
L = [0 , 1 , 2 , 3 , 4]

L[:0] = [520]      # 见下述正向切片
print(L)

[520, 0, 1, 2, 3, 4]


### 中间插入

In [11]:
L = [0 , 1 , 2 , 3 , 4]

L[2:2] = [1314]
print(L)

L[3:3] = ['xxx' , 'yyy' , 'zzz']
print(L)

[0, 1, 1314, 2, 3, 4]
[0, 1, 1314, 'xxx', 'yyy', 'zzz', 2, 3, 4]


## 切片
>- 下标索引从 0 开始
>- 切片操作创建了一个新的 List

### 正向
>- [start : end : step] $\Rightarrow$ [start , end)
>  - start 默认为 0，包括
>  - end  默认为列表长度，不包括
>  - step  默认为 1

In [12]:
L = [0 , 1 , 2 , 3 , 4 , 5]

In [13]:
print(L[0])
print(L[-1])       # 倒数第 1 个元素

0
5


In [14]:
print(L[2:5])
print(L[2:5:2])
print(L[2:5:3])

[2, 3, 4]
[2, 4]
[2]


In [15]:
print(L[:0])       # 见上述首部插入，start 默认为 0
print(L[2:2])      # start = end 为空 List
print(L[2:1])      # start > end 为空 List

[]
[]
[]


In [16]:
print(L[::2])      # 偶数位
print(L[1::2])     # 奇数位

[0, 2, 4]
[1, 3, 5]


### 反向
>- step 指定为负值
>- 且需 start > end
>- 依旧不包括 end

In [17]:
L = [0 , 1 , 2 , 3 , 4 , 5]

In [18]:
print(L[::-1])    # 省略 start 和 end ，为倒序

[5, 4, 3, 2, 1, 0]


In [19]:
print(L[::-2])    # 省略 start 和 end ，为倒序

[5, 3, 1]


In [20]:
print(L[5:2:-1])
print(L[5:2:-2])
print(L[5:2:-3])

[5, 4, 3]
[5, 3]
[5]


In [21]:
print(L[5:5:-1])       # start = end 为空 List
print(L[4:5:-1])       # start < end 为空 List

[]
[]


## 修

### 修改单个

In [22]:
L = [0 , 1 , 2 , 3 , 4]

L[2] = 'xxx'
print(L)

[0, 1, 'xxx', 3, 4]


### 修改切片

In [23]:
L = [0 , 1 , 2 , 3 , 4]

L[::2] = ['x' , 'y' , 'z']         # 切片含多少个元素，就要提供多少个参数
print(L)

['x', 1, 'y', 3, 'z']


In [24]:
L = [0 , 1 , 2 , 3 , 4]

L[1::2] = ['AAA'] * 2              # 切片含多少个元素，就要提供多少个参数
print(L)

[0, 'AAA', 2, 'AAA', 4]


## 删

### 复制备份

In [25]:
L1 = [1 , 2 , 3]
L2 = L1.copy()

### remove()
>- 在原 List 上直接删除指定元素
>- List 中不存在指定元素时则报错 `ValueError: list.remove(x): x not in list`

In [26]:
L = [1 , 2 , 3 , 4 , 5 , 1]

In [27]:
L.remove(1)          # 删除第一个 1
print(L)
L.remove(3)
print(L)
L.remove(5)
print(L)

[2, 3, 4, 5, 1]
[2, 4, 5, 1]
[2, 4, 1]


In [28]:
# 备份复制
L1 = [1 , 2 , 3]
L2 = L1.copy()
print(L1)
print(L2)

L1.remove(2)
print(L1)
print(L2)

[1, 2, 3]
[1, 2, 3]
[1, 3]
[1, 2, 3]


### =[]
>- 也是在原 List 上直接删除指定元素
>- 按位置删除：单个元素 & 连续切片区间

In [29]:
L = [0 , 1 , 2 , 3 , 4]

In [30]:
L[:0] = []           # 切片为空，则无变化
print(L)

L[2:2] = []          # 切片为空，则无变化
print(L)

L[len(L):] = []      # 切片为空，则无变化
print(L)       

[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]


In [31]:
L[2:3] = []         # 删除单个元素
print(L)

[0, 1, 3, 4]


In [32]:
L[1:3] = []         # 切片区间需连续
print(L)

[0, 4]


### del
>- 也是在原 List 上直接删除指定元素
>- 按位置删除：单个元素 & 连续切片区间 & 非连续切片区间

In [33]:
L = [0 , 1 , 2 , 3 , 4]

In [34]:
del L[2:3]         # 删除单个元素
print(L)

del L[1:3]         # 删除连续切片区间
print(L)

[0, 1, 3, 4]
[0, 4]


In [35]:
L = [0 , 1 , 2 , 3 , 4]
del L[::2]         # 删除非连续切片
print(L)

[1, 3]


In [36]:
L = [0 , 1 , 2 , 3 , 4]

del L[1::2]        # 删除非连续切片
print(L)

[0, 2, 4]


In [37]:
L = [0 , 1 , 2 , 3 , 4]

del L[::3]        # 删除非连续切片
print(L)

[1, 2, 4]


## 查

In [38]:
3 in [-1 , -2 , -3]

False

In [39]:
-3 in [-1 , -2 , -3]

True

## 有序比较

In [40]:
[1 , 2] == [1 , 2]

True

In [41]:
[1 , 2] == [2 , 1]

False

In [42]:
[1 , 2] != [2 , 1]

True

## `enumerate()`
>- List --> Tuple (idx , elem)
>- enumerate == 列举 、枚举，多用于 for 循环

In [43]:
L = ['a' , 'b' , 33 , 'c' , 'd' , 999]

In [44]:
E = enumerate(L)
print(type(E))

<class 'enumerate'>


In [45]:
for t in enumerate(L):
    print(f'{type(t)}   {t}')

<class 'tuple'>   (0, 'a')
<class 'tuple'>   (1, 'b')
<class 'tuple'>   (2, 33)
<class 'tuple'>   (3, 'c')
<class 'tuple'>   (4, 'd')
<class 'tuple'>   (5, 999)


In [46]:
for idx , elem in enumerate(L):
    print(f'{idx}   {elem}')

0   a
1   b
2   33
3   c
4   d
5   999


In [47]:
for idx , elem in enumerate(L , 1):     # 指定编号 idx 从 1 开始
    print(f'{idx}   {elem}')

1   a
2   b
3   33
4   c
5   d
6   999


## 排序
>- [List 排序]https://zhuanlan.zhihu.com/p/484949469

In [48]:
# 直接排序原 List

l = [2 , 1 , 4 , 3]
l.sort()
l

[1, 2, 3, 4]

In [49]:
# 生成排序好的新 List ，不改变原 List

l = [2 , 1 , 4 , 3]
s = sorted(l)
print(l)
print(s)

[2, 1, 4, 3]
[1, 2, 3, 4]


## 打乱 & 划分

In [50]:
from sklearn.model_selection import train_test_split as SPLIT

In [51]:
X = [1 , 2 , 3 , 4 , 5 , 6]
Y = [111 , 222 , 333 , 444 , 555 , 666]
print(X)
print(Y)

[1, 2, 3, 4, 5, 6]
[111, 222, 333, 444, 555, 666]


In [52]:
# test_size ：测试集的占比，6 * 0.2 == 1.2  向上取到 2
# random_state ：随机种子，设置相同则每次划分相同，不设置则每次划分不相同

X_train , X_test , Y_train , Y_test = SPLIT(X , Y , test_size = 0.2 , random_state = 3)
print(f'{X_train}\n{Y_train}\n\n{X_test}\n{Y_test}')

[5, 2, 1, 3]
[555, 222, 111, 333]

[4, 6]
[444, 666]


# Tuple
>- 与 List 的不同：
>   - 不可增 、删 、改自身
>   - 使用小括号 (...)
>- 与 List 的相同：
>   - 可包含不同类型的元素
>   - 长度 len()
>   - 用于 for 循环
>   - 拼接 、倍增
>   - 切片
>   - 查 、有序比较

In [53]:
tup = ()
print(tup)
print(type(tup) , end='\n\n')


tup = (50)
print(tup)
print(type(tup) , end='\n\n')


tup = (50 , )       # 单个元素，需要加逗号
print(tup)
print(type(tup))

()
<class 'tuple'>

50
<class 'int'>

(50,)
<class 'tuple'>


## del
>- 删除整个 Tuple ，该变量 tup 将不存在 、未定义

In [54]:
del tup

## tuple()
>- 内置函数，，定义变量时应该避免使用 `tuple` 作为变量名

In [55]:
L = [1 , 2 , 3]

print(type(L))
print(L , end = '\n\n')

print(type(tuple(L)))
print(tuple(L))

<class 'list'>
[1, 2, 3]

<class 'tuple'>
(1, 2, 3)


# String
>- python 无字符概念，单个字符也作为字符串使用
>  - 单引号 '...'
>  - 双引号 "..."
>- `str()` 为内置函数，定义变量时应该避免使用 `str` 作为变量名
>- 同上述 List 的相同：
>  - 切片
>  - 拼接 、倍增
>  - 用于 for 循环
>  - 查、有序比较

## join(List 、Tuple)
>- 需要保证 List 、Tuple 中的各项元素都为 String
>- 比使用 + 法拼接效率高

In [56]:
L = [1 , False , (1 , 2)]
S = '-'.join([str(i) for i in L])
print(S)

1-False-(1, 2)


In [57]:
tup = ('3.14' , 'a' , 'b')
s = '~'.join(tup)
print(s)

3.14~a~b


## 曲线修改
>- String 是不可变类型，无法直接修改

### 方法一
>- String --> List --> 修改 --> String

In [58]:
S = 'abcde'
L = list(S)
print(L)

['a', 'b', 'c', 'd', 'e']


In [59]:
L[1::2] = ['B' , 'D']
S = ''.join(L)
print(S)

aBcDe


### 方法二
>- 切片拼接

In [60]:
S = 'abcde'
print(S)
S = S[0] + 'B' + S[2:3] + 'D' + S[4:]
print(S)

abcde
aBcDe


### 方法三
>- 内置函数 `replace()` 全部替换

In [61]:
S = 'bbabbba'
print(S)
S = S.replace('a' , 'A')
print(S)

bbabbba
bbAbbbA


## f'...{变量名}...'

### 基本类型

In [62]:
print(f'...{1}...')
print(f'...{3.14}...')
print(f'...{False}...')
print(f'...{"李慧颖"}...')    # 括号 { } 内使用 "..." 避免冲突，且不会输出 " 符号

...1...
...3.14...
...False...
...李慧颖...


### 避免冲突
>- 适用 `'`、`"`、`'''`、`"""` 组合
>- 报错 f-string: unmatched '('

In [63]:
# '' 内嵌套 ""
# "" 内嵌套 ''
print(f'..."..."..."..."...')
print(f"...'...'...'...'...")

..."..."..."..."...
...'...'...'...'...


In [64]:
# f'''...'''
# f"""..."""
# 括号 { } 外部的 ' 、"  可自由使用，全都输出
# 括号 { } 内部的字符串可以使用 {"...'...'..."} 模式，但只输出 ' ，不会输出 " 符号
# 括号 { } 内部的字符串可以使用 {'..."..."...'} 模式，但只输出 " ，不会输出 ' 符号
print(f'''..."全'都"输'出"...{'y"y"y'}...''')
print(f"""...'全"都'输"出'...{"y'y'y"}...""")

..."全'都"输'出"...y"y"y...
...'全"都'输"出'...y'y'y...


### 特殊字符

In [65]:
# 两个连续的 {{ 输出 {
# 两个连续的 }} 输出 }
print(f'{{...')
print(f'...}}')
print(f'{{...}}')

{...
...}
{...}


In [66]:
# 首部或中间：用一个 \ 也行，用两个 \\ 也行，但都只输出一个 \
# 尾部：必须为偶数个 \ ，否则最后一个 \ 会转意 '
print(f'\...\\...\...\\...\n...\\') 

\...\...\...\...
...\


## 补长输出

In [67]:
l = '123456789'
s = 'aaa'
print(l)
print(s)
print(s.rjust(5))     # 右边空格补齐
print(s.ljust(5))     # 左边空格补齐
print(s.center(5))    # 左右空格补齐

123456789
aaa
  aaa
aaa  
 aaa 


In [68]:
print(len(s))
print(len(s.rjust(5)))     # 空格会计入长度
print(len(s.ljust(5)))
print(len(s.center(5)))

3
5
5
5


## 格式化输出
>- 更多见 `data_Use.ipynb` 的通用函数

In [69]:
words = ['123' , 'abcde' , 'A1B2C3D']

In [70]:
# f'{content:format}'

In [71]:
for word in words:
    print(f'{word:<10s} -- {len(word)}')    # 右对齐
    
for word in words:
    print(f'{word:>10s} -- {len(word)}')    # 左对齐

for word in words:
    print(f'{word:^10s} -- {len(word)}')    # 居中对齐

123        -- 3
abcde      -- 5
A1B2C3D    -- 7
       123 -- 3
     abcde -- 5
   A1B2C3D -- 7
   123     -- 3
  abcde    -- 5
 A1B2C3D   -- 7


# Dictionary
>- { key : value , ... }
>  - key 必须是不可变的：字符串 + 数字 + 元组 + 布尔
>  - value 可以取任何数据类型
>- dict() 为内置函数，定义变量时应该避免使用 `dict` 作为变量名

In [72]:
d = {
    'a': 1 , 
    2 : 's' , 
    (-1 , -2) : [3 , 3 , 3]
}

In [73]:
len(d)

3

In [74]:
type(d)

dict

In [75]:
# 按 key 取 val
print(d['a'])
print(d[2])
print(d[(-1 , -2)])

1
s
[3, 3, 3]


## 增 & 改
>- 直接 `dic[key] = value`

In [76]:
d = {1 : 'a' , 2 : 'b' , 3 : 'c'}
d[2] = 'SSS'    # 修
d[4] = 'D'      # 增
print(d)

{1: 'a', 2: 'SSS', 3: 'c', 4: 'D'}


## 删
>- 直接 `del dic[key]`

In [77]:
d = {1 : 'a' , '2' : 'b' , 3 : 'c'}
del d['2']
print(d)

{1: 'a', 3: 'c'}


In [78]:
del d        # 删除整个 Dictionary ，该变量 d 将不存在 、未定义

## 清空

In [79]:
d = {1 : 'a' , 2 : 'b' , 3 : 'c'}
d.clear()
print(d)

{}


## 遍历

### List 的形式返回全部键

In [80]:
d = {1 : 'xxx' , '2' : [0 , '3.14'] , 3 : (1 , )}

keyList = list(d.keys())
print(type(keyList))
print(keyList)

<class 'list'>
[1, '2', 3]


### List 的形式返回全部值

In [81]:
d = {1 : 'xxx' , '2' : [0 , '3.14'] , 3 : (1 , )}

valueList = list(d.values())
print(type(valueList))
print(valueList)

<class 'list'>
['xxx', [0, '3.14'], (1,)]


### 用于 `for` 循环

In [82]:
d = {1 : 'xxx' , '222' : [0 , '3.14'] , 3 : (1 , )}

In [83]:
for key , value in d.items():
    print(f'{key:<3}   {value}')

1     xxx
222   [0, '3.14']
3     (1,)


In [84]:
for item in d.items():
    print(f'{type(item)} : {item}')

<class 'tuple'> : (1, 'xxx')
<class 'tuple'> : ('222', [0, '3.14'])
<class 'tuple'> : (3, (1,))


## 布尔作为 `key`
>- True  == 1
>- False == 0

In [85]:
d = {True : 'xxx' , False : 'yyy'}
print(d)

{True: 'xxx', False: 'yyy'}


In [86]:
d[True] = 'x'
d[False] = 'y'
print(d)

{True: 'x', False: 'y'}


In [87]:
d[1] = 111
d[0] = 222
print(d)

{True: 111, False: 222}


# `for` 循环
>- for `i,j,...` in `List 、Tuple 、String 、Dictionary 、range`

In [88]:
L = [(1 , 'X' , 3) , [False , 3.14 , True] , ('a' , -99 , 'c')]
for a, b, c in L:
    print(f'{str(a):5s}  {str(b):5s}  {str(c):5s}')
print()

1      X      3    
False  3.14   True 
a      -99    c    



## range(start , end , step)
>- 返回一个可迭代对象 [start , end) ，通常用于 for 循环中
>  - start 默认为 0 ，包括
>  - end 不可省略，不包括
>  - step 默认为 1
>  - 三个参数必须为整数

In [89]:
print([i for i in range(5)])

[0, 1, 2, 3, 4]


In [90]:
print([i for i in range(1 , 5 , 4)])

[1]


In [91]:
for i in range(3):
    print(f'{i} * {i} == {i * i}')

0 * 0 == 0
1 * 1 == 1
2 * 2 == 4


In [92]:
print([i for i in range(1 , -5 , 1)])       # 依据 step 不能从 start 走向 end ，得到空
print([i for i in range(1 , -5 , -1)])
print([i for i in range(-1 , -5 , -3)])

[]
[1, 0, -1, -2, -3, -4]
[-1, -4]


## `zip()`
>- 一系列可迭代对象 => List [Tuple , Tuple , ...]
>- 第 i 个 tuple 包含每个可迭代对象的第 i 个元素

In [93]:
L = [1 , 2 , 3]                    # 最短参数
T = ('x' , 'y' , 'z' , 'k')
S = '深度学习入门'

Z = zip(L , T , S , range(80 , 100 , 5))
print(type(Z))

<class 'zip'>


In [94]:
for a, b, c, d in Z:              # 只能使用一次
    print(a , b , c , d)

1 x 深 80
2 y 度 85
3 z 学 90


In [95]:
L = [1 , 2 , 3]                   # 最短参数
T = ('x' , 'y' , 'z' , 'k')
S = '深度学习入门'

Z = zip(L , T , S , range(80 , 100 , 5))
print(type(Z))

<class 'zip'>


In [96]:
Z = list(Z)                       # 转换为 List 方便多次使用
print(len(Z))
print(Z)

3
[(1, 'x', '深', 80), (2, 'y', '度', 85), (3, 'z', '学', 90)]


### 解码

In [97]:
Z = zip([1 , 2] , ('x' , 'y' , 'z'))
L , T = zip(*Z)

In [98]:
# 解码都为 tuple
print(type(L) , L)
print(type(T) , T)

<class 'tuple'> (1, 2)
<class 'tuple'> ('x', 'y')


### 生成字典

In [99]:
keyL = [1 , 'x' , 3 , False , True]                         # 作为键 True = 1
valT = (True , (5 , 9) , [99 , 88 , 77] , 'x' , 'yyy')
d = dict(zip(keyL , valT))
print(d)

{1: 'yyy', 'x': (5, 9), 3: [99, 88, 77], False: 'x'}


## 循环生成器
>- [i for i in ...] --> List
>- (i for i in ...) --> generator（只能使用一次）

In [100]:
gen = (i for i in range(5))
print(type(gen))

tup = tuple(gen)    # 只能使用一次，gen --> Tuple
print(tup)

L = list(gen)
print(L)

<class 'generator'>
(0, 1, 2, 3, 4)
[]


In [101]:
gen = (i for i in [1 , 2. , True , (3 , 3 , 3)])
print(type(gen))

L = list(gen)    # 只能使用一次，gen --> List
print(L)

tup = tuple(gen)
print(tup)

<class 'generator'>
[1, 2.0, True, (3, 3, 3)]
()
