# Python深度学习基础
- 深度学习相关库：NumPy，Pandas，Matplotlib，Scikit-learn，TensorFlow，Pytorch

- 这份笔记主要介绍纯Python基础，包括语法、变量、函数和类 

## 变量类型与输出语句
两点提示：

- Python是动态输入类型的语言，变量类型是动态推断的，如C++中“int a=1”，在python中只需要“a=1”

- Python不需要分号，换行即可，四个空格是缩进，不要随便加

七种变量类型：

- 基本变量类型：字符串（str），数字（int，float），布尔型（bool）

- 高级变量类型：集合（set），元组（tuple），列表（list），字典（dict）

输出语句有Jupyter和Python两种，其中Jupyter是在代码块最后一行直接写下变量名

In [75]:
# 变量类型示例
# 字符串（str）
str_v = "a real man"
# 数字（int，float）
num_v = 1234
# 布尔型（bool）
bool_v = True
# 集合（set）
set_v = {1, 2, 3, 1}
# 元组（tuple）
tuple_v = (1, 2, 3)
# 列表（list）
list_v = [1, 2, 3]
# 字典（dict，key-value）
dict_v = {'a':1, 'b':2, 'c':3}

# Python输出
print(dict_v)  
# Jupyter输出
dict_v 

{'a': 1, 'b': 2, 'c': 3}


{'a': 1, 'b': 2, 'c': 3}

## 基本变量类型
### 字符串
#### 字符串的结构
字符串用单或双引号括起来


In [76]:
# 字符串的两种引号（为了避免字符串中符号影响）
str1 = 'He said:"Rose.'
str2 = "Jack's book is in his home."

#### 输出语句的经典用法
在字符串中插入其他变量，可以用“f字符串”的方法

In [77]:
str1 = "money path"
str2 = "doctor"
str3 = f"You ruined his {str1}. You ruined his {str2}."
print(str3)
answer = 0.98
print(f"测试集的准确率为：{answer}") # 最常用场景

You ruined his money path. You ruined his doctor.
测试集的准确率为：0.98


#### 输出语句的转义字符
字符串中的转义字符，如换行符\n和制表符\t，增加print的可读性

In [78]:
message = "Shop sells:\n\tlitchi, \n\tfritters."
print(message)
message # 单独输出不能识别转义字符

Shop sells:
	litchi, 
	fritters.


'Shop sells:\n\tlitchi, \n\tfritters.'

### 数字
分为整数型（int）和浮点型（float）
常用运算符：+，-，*，/，**，()，//，%

### 布尔型
#### 基于其他变量类型生成
生成方式：
- 对字符串或数字做比较
- 判断某元素是否在集合/元组/列表/字典里

In [79]:
str_v = 'cxk'
print(str_v == 'chicken')
num_v = 3
print(num_v >= 5)
list_v = [1, 2, 3]
print(2 in list_v)
print(1 not in list_v)

False
False
True
False


#### 同时检查多个条件
and和or的规则

In [80]:
T = True
F = False
print(T and F)
print(T or F)

False
True


### 判断语句
if判断的语法规则

In [81]:
answer = 40
if answer > 90:
    print('卓越')
elif answer > 80:
    print('优秀')
elif answer > 60:
    print('合格')
else:
    print('挂科')

挂科


### 基本变量之间的转换
字符串，整数，浮点数，布尔型四者之间可以无缝切换，分别使用str，int，float，bool函数

其中注意布尔型True会转化为1或1.0

In [82]:
# 定义变量
str_v = '123'
int_v = 123
float_v = 123.0
bool_v = True
# 转化为字符串
print(str(int_v))
print(str(float_v))
print(str(bool_v))

123
123.0
True


## 高级变量类型
共同特点：作为容器，他们可以随意容纳任意变量

### 集合
- 集合是无序，不可重复的元素的组合
- 可以用set函数或者大括号来创建集合
- 请勿用大括号创建空字典，否则会被误认为字典（事实上，集合出现的频率非常低）

In [83]:
set_v = set([9, 1, 4, 1, 3, 1]) # 相当于把列表转化为集合
print(set_v)
set_v = {'中','山','大','学','数','学','学','院'}
print(set_v)

{9, 3, 4, 1}
{'山', '学', '数', '院', '大', '中'}


### 元组
- 创建元组的两种方法：规范括号法，省略括号法
- 输出语句中的元组法（高级变量类型可以容纳任何变量）

In [84]:
# 一个包含七种变量类型的元组
'a', 1, True, {1, 2, 3}, (1, 2, 3), [1, 2, 3], {'a':1, 'b':2, 'c':3}
# 元组法代替f字符串
answer = 0.98
print(f'最终答案为：{answer}')
print('最终答案为：', answer) # 缺点是有一个空格

最终答案为：0.98
最终答案为： 0.98


#### 元组拆分法
Python语法灵活的关键所在

In [85]:
# 极速创建新变量
a, b, c = 1, 2, 3
# 极速交换变量值
a, b = b, a
# 只要前n个答案
values = 98, 99, 94, 94, 90, 92
a, b, *rest = values
a, b, rest

(98, 99, [94, 94, 90, 92])

### 列表
列表由若干个有序的变量组成，其中的元素可以无任何关系

列表非常灵活，但是代价是列表要单独存储每一个元素的变量类型，事实上list3这种情况并不多见，在之后的Numpy数组中仅接纳一种变量类型，可以大幅提升运算速度并节约内存空间

In [86]:
# 一个全是字符串的列表
list1 = ['Bro', '30 months']
# 一个全是数字的列表
list2 = [123, 45, 667]
# 一个释放自我的列表
list3 = ['cxk', 666, True, (1, 2, 3)]

print(list3[1]) # 索引从0开始
print(list3[-1]) # 访问倒数第n个元素
print(list3[-2])
list1[0] = 'bro'

666
(1, 2, 3)
True


#### 切片--访问部分元素
切片就是列表的部分元素，可以实现下面三种访问元素的方法



In [87]:
list_v = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
print(list_v)
# 从x切到y
print(list_v[1:4]) # 从索引[1]开始，切到索引[4]之前
print(list_v[1: ])
print(list_v[ :4])

# 切除开头结尾
print(list_v[2:-2]) # 切除开头2个和结尾2个
print(list_v[2: ])
print(list_v[ :-2])

# 采样
print(list_v[ : :2])
print(list_v[1:-1:3]) # 去除一头一尾后，每隔3个元素采样一次

['a', 'b', 'c', 'd', 'e', 'f', 'g']
['b', 'c', 'd']
['b', 'c', 'd', 'e', 'f', 'g']
['a', 'b', 'c', 'd']
['c', 'd', 'e']
['c', 'd', 'e', 'f', 'g']
['a', 'b', 'c', 'd', 'e']
['a', 'c', 'e', 'g']
['b', 'e']


值得注意的是，对列表切片后将得到一个新的变量，与原列表变量相互独立，非常消耗内存，因此之后Numpy数组的切片被设定为原变量的一个视图，改变切片的值会影响原变量，若需要复制可用copy函数

#### 列表元素的添加
列表可以使用 + 和 * 来添加原列表

In [88]:
list1 = [1, 2, 3]
print(list1 + [4])
print(list1 + [10, 11, 12])
print(list1 * 2)
print(list1 * 4)

[1, 2, 3, 4]
[1, 2, 3, 10, 11, 12]
[1, 2, 3, 1, 2, 3]
[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]


由此可以看出，列表不具备数组的任何特征，只能看做一个万能容器

因此需要Numpy的出现，加减乘除得到释放，可以像Matlab一样做数学运算

### 字典
#### 创建字典
- 字典可以理解为升级版的列表，每一个元素的索引都可以自己决定
- 字典的值可以是任何变量类型，但索引只能是数字或者字符串，且一般都是字符串
- 按官方的说法，字典的索引称为“键”，字典的索引值称为“值”

In [89]:
# 一个普通的字典
dict_v = {'a':90, 'b':95, 'c':100}

# 下面的列表和字典完全等效
list_v = [90, 95, 100]
dict_v = {0:90, 1:95, 2:100}
print(list_v[1])
print(dict_v[1])

dict_v = {
    'zero':123,
    1:True
}
print(dict_v['zero'], dict_v[1])

95
95
123 True


#### 字典元素的修改和删除

In [90]:
# 原字典
CSU = {
    '冶金工程':'A+',
    '计算机科学与技术':'A-',
    '矿业工程':'A+'
}
print(CSU)

# 添加元素
CSU['临床医学'] = 'A-'
CSU['数学'] = '双一流学科'
CSU['控制科学与工程'] = 'A-'
CSU['护理学'] = 'A+'
print(CSU)

# 删除元素
del CSU['矿业工程']
del CSU['冶金工程']
print(CSU)

{'冶金工程': 'A+', '计算机科学与技术': 'A-', '矿业工程': 'A+'}
{'冶金工程': 'A+', '计算机科学与技术': 'A-', '矿业工程': 'A+', '临床医学': 'A-', '数学': '双一流学科', '控制科学与工程': 'A-', '护理学': 'A+'}
{'计算机科学与技术': 'A-', '临床医学': 'A-', '数学': '双一流学科', '控制科学与工程': 'A-', '护理学': 'A+'}


### for循环语句
#### for循环语句遍历列表和字典

In [91]:
# for循环遍历列表
schools = ['中山大学', '武汉大学', '华中科技大学', '清华大学']
for school in schools:
    message = f"{school}, you are great school!"
    print(message)
print("I can't wait you visit you!")

中山大学, you are great school!
武汉大学, you are great school!
华中科技大学, you are great school!
清华大学, you are great school!
I can't wait you visit you!


In [92]:
# for循环遍历字典
schools = {'中山大学':'生态学', '武汉大学':'法学', '华中科技大学':'电气工程', '清华大学':'计算机科学与技术'}
for k in schools.keys():
    print(f'四所985包括{k}')
for v in schools.values():
    print(f'A+学科是{v}')
for k, v in schools.items():
    print(f'{k}的A+学科是{v}')

四所985包括中山大学
四所985包括武汉大学
四所985包括华中科技大学
四所985包括清华大学
A+学科是生态学
A+学科是法学
A+学科是电气工程
A+学科是计算机科学与技术
中山大学的A+学科是生态学
武汉大学的A+学科是法学
华中科技大学的A+学科是电气工程
清华大学的A+学科是计算机科学与技术


注：
- schools.keys()和school.values()的变量类型其实是列表，因此本质是还是遍历列表
- schools.items()的变量类型也是列表，只不过他的每一个元素是元组

### while循环
基本语法跟C++一样，包括break和continue的用法也一样

In [93]:
a = 1
while a <= 5:
    print(a)
    a += 1

1
2
3
4
5


### 列表推导式
这个能看懂即可，有时读代码会碰到

In [96]:
# 求平方-循环
value = []
for i in [1, 2, 3, 4, 5]:
    value += [i**2]
print(value)

# 求平方-列表推导式（代码更加简洁）
value = [i**2 for i in [1, 2, 3, 4, 5]]
print(value)

# 还可以加if函数
value = [i**2 for i in [1, 2, 3, 4, 5] if i < 4]
print(value)

[1, 4, 9, 16, 25]
[1, 4, 9, 16, 25]
[1, 4, 9]


### 高级变量间的转换
集合、元组、列表、字典四者之间可以做到无缝切换
- 转换为集合使用set函数
- 转换为元组使用tuple函数
- 转换为列表使用list函数
- 转换为字典使用dict函数

In [103]:
# 定义变量
set_v = {1, 2, 3}
tuple_v = (1, 2, 3)
list_v = [1, 2, 3]
dict_v = {'a':1, 'b':2, 'c':3}

# 转化成集合
print(set(tuple_v))
print(set(list_v))
print(set(dict_v.keys()))
print(set(dict_v.values()))
print(set(dict_v.items())) # 结果中集合元素是元组

# 转化成元组和列表道理同上

# 转化为字典（需搭配zip函数）
print(dict(zip(('a', 'b', 'c'), (1, 2, 3))))
print(dict(zip(['a', 'b', 'c'], [1, 2, 3])))
print(dict(zip({'a', 'b', 'c'}, {1, 2, 3}))) # 集合会出现乱序

{1, 2, 3}
{1, 2, 3}
{'b', 'c', 'a'}
{1, 2, 3}
{('a', 1), ('b', 2), ('c', 3)}
{'a': 1, 'b': 2, 'c': 3}
{'a': 1, 'b': 2, 'c': 3}
{'b': 1, 'c': 2, 'a': 3}


## 函数

## 类