# Python 进阶实验内容

<br>


## 目录

+ 了解 Python 函数的使用，能够在 Jupyter Notebook 中 编写函数代码并运行；<br>
<br>
+ 了解 Python 的高阶用法 - 语法糖，了解 Python 对于相关语法的多变性的相关知识；<br>
<br>
+ 了解 Python 的高级用法：了解 线程、协程的相关概念；<br>

## Python 函数

在每一个编程语言中都有函数的相关概念，函数可以帮助你将程序的相关逻辑变更加紧凑和有理可循，在 Jupyter Notebook 的相关交互环境中，因为代码较为分散，即IPython的交互方式，因此不能形成完整的历程体系，但这种好处就是可以随时得到相应的结果，方便在调试中编写代码；

对于数据科学领域，能够及时的了解数据结构以及相关数据特征是非常关键的，这也是 Jupyter Notebook 的相关优点；

但是，这并不影响去学习函数，因为在一些集成化的条件下，编写函数可以将相关的功能封装起来，更方便调用；

参考的相关链接：

+ [菜鸟教程 - 函数](https://www.runoob.com/python3/python3-function.html)
+ [廖雪峰 - 定义函数](https://www.liaoxuefeng.com/wiki/1016959663602400/1017106984190464)
+ [Python函数（函数定义、函数调用）用法详解](http://c.biancheng.net/view/2247.html)

## Python 的语法糖

每一个语言都有对应的语法糖，Python 也不例外，因此掌握相关的语法糖，可以很大程度的减少代码的编写量；

Python 中 `lamda` 的相关用法就是一个语法糖，掌握这一特性也非常关键：

参考链接：

+ [极客教程](https://geek-docs.com/python/python-tutorial/python-lambda.html)

+ [廖雪峰教程 - 匿名函数](https://www.liaoxuefeng.com/wiki/1016959663602400/1017451447842528)

+ [Python 有哪些好玩的语法糖？](https://www.zhihu.com/question/57470958)

+ [Python语法糖系列](https://blog.csdn.net/five3/article/details/83474633)

In [1]:
# 举几个Python常用的语法糖
import pandas as pd
data_file = pd.read_csv("../data/test_data/loans.csv")
data_file

Unnamed: 0,credit_policy,purpose,int_rate,installment,log_annual_inc,dti,fico,days_with_cr_line,revol_bal,revol_util,inq_last_6mths,delinq_2yrs,pub_rec,not_fully_paid
0,1,debt_consolidation,0.1189,829.10,11.350407,19.48,737,5639.958333,28854,52.1,0.0,0.0,0.0,0
1,1,credit_card,0.1071,228.22,11.082143,14.29,707,2760.000000,33623,76.7,0.0,0.0,0.0,0
2,1,debt_consolidation,0.1357,366.86,10.373491,11.63,682,4710.000000,3511,25.6,1.0,0.0,0.0,0
3,1,debt_consolidation,0.1008,162.34,11.350407,8.10,712,2699.958333,33667,73.2,1.0,0.0,0.0,0
4,1,credit_card,0.1426,102.92,11.299732,14.97,667,4066.000000,4740,39.5,0.0,1.0,0.0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9573,0,all_other,0.1461,344.76,12.180755,10.39,672,10474.000000,215372,82.1,2.0,0.0,0.0,1
9574,0,all_other,0.1253,257.70,11.141862,0.21,722,4380.000000,184,1.1,5.0,0.0,0.0,1
9575,0,debt_consolidation,0.1071,97.81,10.596635,13.09,687,3450.041667,10036,82.9,8.0,0.0,0.0,1
9576,0,home_improvement,0.1600,351.58,10.819778,19.18,692,1800.000000,0,3.2,5.0,0.0,0.0,1


In [2]:
# 下边的写法是一种遍历 Pandas DataFrame 的写法，我们需要创建一个字典类型
# 记录一下相关的 id 对应 installment 的对应关系

temp_dict_id2installment_1 = dict()

for sid, row in data_file.iterrows():
    temp_dict_id2installment_1[sid] = row["installment"]

# 打印 字典类型
temp_dict_id2installment_1[1]

228.22

In [3]:
# 现在尝试一下 Python 字典语法糖
# 可以看出来代码更简洁了

temp_dict_id2installment_2 = { sid:row["installment"] for sid, row in data_file.iterrows()}

temp_dict_id2installment_2[1]

228.22


## Python 多线程理解

Python 在运行效率上存在着多种限制，最重要的一个限制就是： GIL 锁，这个在Python中是非常关键的概念，在面试中会经常被问道，请阅读下边的资料：

参考链接：

+ [Python的GIL是什么鬼，多线程性能究竟如何](http://cenalulu.github.io/python/gil-in-python/)
+ [谈谈python的GIL、多线程、多进程](https://zhuanlan.zhihu.com/p/20953544)
+ [深入理解Python中的GIL（全局解释器锁）](https://zhuanlan.zhihu.com/p/75780308)

当然上边的内容并不一定非常理解，但是需要去理解 Python 的多线程，在这里不做过多的讨论，也不要求编写对应的多线程代码；

但是，在 pyspark / numpy 等数据计算库中有多线程的相关函数，后边的相关内容需要用到多进程的函数来加快Python的数学运算速度；

多线程的参考链接：

+ [菜鸟教程 - 多线程](https://www.runoob.com/python/python-multithreading.html)
+ [廖雪峰 - 多线程](https://www.liaoxuefeng.com/wiki/1016959663602400/1017629247922688)
+ [Python threading实现多线程 基础篇](https://zhuanlan.zhihu.com/p/91601448)

## Python 协程理解

协程 - 是高级语言非常重要的特性，Python - CPython 在严格意义上不是真正的多进程，但是使用协程可以

协程概念在处理并发操作时非常有用，掌握好这个概念可以有效地理解业务逻辑、提升业务的运行效率；

参考链接：

+ [官方教程 - 协程与任务](https://docs.python.org/zh-cn/3/library/asyncio-task.html)
+ [廖雪峰 - 协程](https://www.liaoxuefeng.com/wiki/1016959663602400/1017968846697824)
+ [什么是协程？](https://zhuanlan.zhihu.com/p/172471249)