# Python基础

## 环境配置：Anaconda安装

**Anaconda**是一个包含众多科学计算包及其依赖项的Python发行版本。其包含的库包括：**numpy, pandas, scipy, sklearn,jupyter notebook**等。

安装**Anaconda**能快速搭建数据分析的环境，并方便日后管理多个Python环境。

前几次课程的内容对于计算性能要求不高，大家若没有完成本地Anaconda安装，可以暂时使用在线的Jupyter notebook服务

* [jupyter notebook 在线试用](https://jupyter.org/try)
* [google colab](https://colab.research.google.com/)

后续的某些课程内容包括项目实战环节，可能需要使用本地的数据，请大家也尽可能也在自己的电脑上安装好。

## Jupyter Notebook的启动

启动方式（以下三种三选一）：
1. 打开Anaconda，找到`jupyter notebook`，点击lauch。旁边的jupyter lab也是类似的功能。

<img src="https://pan.imgbed.link/file/173600" width=550>


2. 打开命令行Anaconda Prompt，输入`jupyter notebook`，回车
3. Windows搜索Jupyter notebook，点击logo打开

## Jupyter Notebook默认工作路径配置

首次打开jupyter notebook，默认的路径一般是在`C:\Users\你的用户名`。这给后续的有一些操作可能带来不便，如需要修改修改默认的打开路径，windows下的操作步骤如下（macOS的操作类似，可自行上网搜索）：
- 打开 Anaconda Prompt
- 输入`jupyter notebook --generate-config`生成配置文件
- 这个命令将会在用户的目录(`C:\Users\你的用户名\.jupyter`)下生成一个名为`jupyter_notebook_config.py`的配置文件。打开这个文件，找到以下代码行：
- `# c.ServerApp.root_dir = r'D:/notebooks'`
- 去掉注释用的井号，顶格书写。将其修改为：`c.ServerApp.root_dir = r'你的路径'`，如`c.ServerApp.root_dir =  r'D:/notebooks'`
- 完成上述流程后。此外，选中Jupyter Notebook的快捷方式，鼠标右键-属性-快捷方式-目标，删除目标里的`"%USERPROFILE%/"`这一行语句，即删除`.py`后的后缀内容。
- 此后打开jupyter notebook会默认进入你设定的路径

查看当前路径的方法： `pwd`命令 （print working directory）

In [None]:
pwd

## Jupyter Notebook的使用

<div class="alert alert-block alert-success">
<b>快速入门:</b> 
想要运行一个代码段（cell）,你可以点击菜单栏的<b>运行</b>,或者也可以使用以下快捷键
<ul>
 <li> Ctrl+Enter</li>  
   <li>Shift+Enter</li>    
</ul>  
</div>



In [None]:
print('hello world')

Cell 的两种格式：
- **markdown** 用于书写文本、公式、图片、链接等。除了基础的markdown语法支持以外，也支持部分html的语法。可用于撰写数据分析的文本内容，以及展示不方便使用通过简单注释解释的内容
- **code** 编写代码
两种格式的切换方法：选中cell以后在下拉菜单中选择，或是直接使用快捷键`M`修改为markdown，`Y`修改为code

<div class="alert alert-block alert-success">
<b>markdown语法介绍：</b> https://support.typoraio.cn/zh/Markdown-Reference/
</div>






常用的键盘快捷键:

* ↑和↓ ： 切换代码框（cell）
* `shift + enter`: 运行当前cell并挪动到下一个cell
* `ctrl + enter` ：运行当前cell，保持在当前cell
* `b` : 在当前cell下面插入新cell
* `a` : 在当前cell上面插入新cell
* `dd` (敲击d键两下): 删除当前cell
* `m` : 将当前cell由code模式转换成markdown模式
* `y` : 将当前cell由markdown模式转换成code模式
* `z` 删除cell后的撤回
* `ctrl+z` cell内部的编辑撤回
* `c` 复制cell
* `v` 在下方粘贴cell

<div class="alert alert-block alert-success">
更多快捷键可以访问Help/Show KeyBoard ShortsCuts获取  
</div>


## 练习：上手jupyter notebook操作

1. 鼠标单击选中下面的代码块，快捷键`shift + enter`执行该代码块
2. 自由使用快捷键和命令，尝试:增加cell`a`、复制cell`c`、粘贴cell`v`、删除cell`dd`、删除cell后的撤回`z`、编辑cell后的撤回`ctrl+z`等各种操作

In [None]:
# 绘制简单散点图
import matplotlib.pyplot as plt
x = [1,2,3,4,5]
y = [1,3,4,2,1]
plt.plot(x,y,'-o')

In [None]:
import plotly.express as px

z = [[.1, .3, .5, .7, .9],
     [1, .8, .6, .4, .2],
     [.2, 0, .5, .7, .9],
     [.9, .8, .4, .2, 0],
     [.3, .4, .5, .7, 1]]

fig = px.imshow(z, text_auto=True)
fig.show()

<div class="alert alert-block alert-success">
<b>补充内容:环境的新建和库安装</b> 

安装Anaconda后，默认打开的环境为base环境，如果你需要创建新的环境用于调试和开发，或者不希望你的操作影响到base环境，你也可以新建其他的环境，方法如下：

<ul>
<li> 打开终端（在 Windows 上可以使用 Anaconda Prompt 或者 PowerShell）  </li>  
<li> 使用以下命令创建一个新的环境，指定 Python 版本（例如 3.12）。其中 myenv 是你想要给新环境起的名字，可以根据需要更改。 <code>conda create --name myenv python=3.12</code>  </li>  
<li> 激活新创建的环境： <code>conda activate myenv</code>  </li>  
<li> 将该环境加入到jupyter notebook中: <code>python -m ipykernel install --user --name myenv --display-name "Python (myenv)"</code>  </li>  
<li> 你可以使用以下命令查看当前环境安装的包 <code>conda list</code>
<li> 你可以使用以下命令查看当前所有的环境
   <code>conda env list</code> </li>   
<li> 要退出当前环境，可以使用以下命令
   <code>conda deactivate</code> </li>   
</ul>



新建的环境往往缺少必要的库，需要安装。安装库的方法有很多种，例如通过pip或者conda安装，这里我们介绍使用conda的安装方法。
<ul>
<li>运行以下命令添加清华大学的镜像源。这样就可以使用清华大学的镜像源来加速 conda 包的下载和安装了
<pre><code>conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes</code> </pre> </li>
<li> 运行以下命令查看配置是否成功 <code>conda config --show </code> </li>
<li> 激活对应环境后，使用如下命令来安装<code>conda install numpy </code> </li>
</ul>

在 Jupyter Notebook 界面中，点击 "Kernel" 菜单，然后选择 "Change kernel"。在下拉菜单中选择你刚刚添加的内核（例如 "Python (myenv)"）。即可使用新的内核进行调试和开发。

</div>


# Python语法基础回顾

本节课程不是Python的语法基础课，因此本节课我们队基础语法**仅做要点概述**，没有相关学习经验的同学可以通过自学补齐一些相关基础。

比如你可以通过[RUNOOB菜鸟教程](https://www.runoob.com/python/python-tutorial.html)进行学习。


## 输入输出、注释

In [None]:
# 以下为变量的赋值，其中 # 井号后面是单行注释
# 当需要注释多行时，可以在前后使用三个连续单引号`'''`或三个连续双引号`"""`

'''
这里是
多行注释
'''

"""
这里也是
多行注释
"""


a = 'sjtu'
print(a)
a

`print()`会打印显示一些文本和结果，便于展示中间数据或辅助调试

In [None]:
import time # 导入time库，time 库是 Python 的标准库之一，用于处理时间相关的任务，其官方文件详见：https://docs.python.org/3/library/time.html
print('Hello World!')
print('现在是 ' + time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

在 **Jupyter notebook** 这种交互式的编程中，即使不使用`print()`, 每个cell也会自动打印最后一行的返回值。

除了数值和文本以外，`print()`也可以打印显示列表、字典等复合的类型变量，可以用`,`分隔多个打印对象

此外，`input()`会弹出会话框，请求一个输入，并将会话的输入作为input函数的输出。

In [None]:
a = input("what's the time now? ") # a的取值来源于input输入，输入的数据类型默认为字符串
print(type(a))
print("it's "+ a + " now")

## 基础变量类型

Python的标准数据类型:
1. numbers（数字）
1. string（字符串）
3. list（列表）
4. tuple（元组）
5. sets（集合）
6. dictionary（字典）

可以用`type`函数，查看某一个变量的类型。

In [None]:
university = 'sjtu'
type(university)

### Numbers（数字）

数值型用于存储数值。支持四种不同的数字类型：

- **int（有符号整型）**：可以是正整数或负整数，不带小数点。
- **float（浮点型）**：浮点型由整数部分与小数部分组成
- **bool （布尔型）**：`True`和`False`
- **complex（虚数）**：复数由实数部分和虚数部分构成，可以用`a + bj`,或者`complex(a,b)`表示， 复数的实部a和虚部b都是浮点型。

In [None]:
a = 30 # 整数默认用整形
type(a)

In [None]:
b = 10.2 # 小数默认用浮点型
type(b)

In [None]:
c = True # bool类型有两个取值：True or False
type(c)

In [None]:
d = 1+2j
type(d)

**四类运算符**

1. 算术运算符用于基本数值计算

运算符	| 描述
:----: |:----:
\+	| 加
\-	| 减
\*	| 乘
/	| 除	
%	| 取模（余数）	
\**	| 幂
//	| 取整除（向下取整）

In [None]:
10//3  # 求整除（向下取整）

In [None]:
10%3  # 求余数

2. 比较运算符可以比较两个值，返回布尔变量`True`或者`False` 

运算符 | 描述
:----: |:----:
==  | 等于
!=	| 不等于
\>	| 大于
\<	| 小于
\>=	| 大于等于
\<=	| 小于等于

In [None]:
import math
math.pi**2>9.8

3. 赋值运算符对变量进行赋值

运算符	| 描述	| 解释
:----: |:----:|:----:
=	| 简单的赋值运算符|	将 a + b 的运算结果赋值为 c
+=|	加法赋值运算符	|c += a 等效于 c = c + a
-=	|减法赋值运算符	|c -= a 等效于 c = c - a
\*=	|乘法赋值运算符	|c \*= a 等效于 c = c * a
/=	|除法赋值运算符|	c /= a 等效于 c = c / a
%=	|取模赋值运算符|	c %= a 等效于 c = c % a
\*\*=	|幂赋值运算符|	c \*\*= a 等效于 c = c \*\* a
//=|	取整除赋值运算符	|c //= a 等效于 c = c // a


In [None]:
x = 2
x *= 6
print(x)

4. 逻辑运算符对布尔变量进行操作,返回值也是布尔变量

|运算符|	逻辑表达式|	描述|
|:----: |:----:|:----:|
| and	| x and y | 布尔"与" |
| or | x or y |	布尔"或" |
| not| not x |	布尔"非" |


In [None]:
a = 5
(a < 4) or (a>2)

### String（字符串）

字符串是字符的序列。字符串需要使用单引号`' '`或双引号`" "`括起来。

In [5]:
string_a = 'Welcome to data science!'
type(string_a)

str

使用`len()`函数获得字符串的长度，这里的`len()`是python内置函数。可以通过`? len`获取帮助。当然使用AI提问也是不错的选择

In [None]:
len(string_a)

In [None]:
? len

字符串可以通过`+`进行拼接

In [None]:
string_a + ' Wish you a happy journey!'

字符串可以被视作从左到右的字符序列，使用字符在序列中的序号，可以索引到对应字符，或对字符串进行切片。

In [None]:
string_a[3] #单个序号表示索引,从0开始计数

`:`分隔表示切片，格式为`start:end:step`。`step`默认为1，此时切片格式可简化为`start:end`

In [7]:
string_a[0:7] #区间为[a,b),索引切片包括第a位，但不包括第b位

'Welcome'

In [9]:
string_a[0:7:2] #步长为2

'Wloe'

In [None]:
string_a[::-1] #步长为-1,即字符串逆序

字符串的split 和join操作：
`split()`分割字符串为列表，`join()`将列表连接为字符串

In [11]:
string_b = 'mail.sjtu.edu.cn'
splitted = string_b.split('.')
splitted

['mail', 'sjtu', 'edu', 'cn']

In [13]:
'。'.join(splitted)

'mail。sjtu。edu。cn'

我们在输出计算结果（尤其是数值结果）的时候，常常会用到**格式化字符串**，用于控制数字的显示格式，例如指定小数点位数、对齐方式、填充字符等。

In [None]:
# 指定小数点位数
pi = 3.141592653589793
formatted_string = "Pi is approximately {:.4f}".format(pi) # 坑用大括號來標示
print(formatted_string)  # 输出: Pi is approximately 3.1416
# 指定宽度和对齐方式
number = 42
formatted_string = "Number: {:5d}".format(number)  # 右对齐，宽度为 5
print(formatted_string)  # 输出: Number:    42

formatted_string = "Number: {:<5d}".format(number)  # 左对齐，宽度为 5
print(formatted_string)  # 输出: Number: 42   

In [None]:
name = "Alice"
age = 30
height = 1.75253

formatted_string = "Name: {}, Age: {}, Height: {:.2f} meters".format(name, age, height)
print(formatted_string)

`str.format`方法的详细用法见：https://docs.python.org/3/library/string.html#formatstrings

下表展示了 `str.format()` 格式化数字的多种方法(供阅读，实际使用的时候可以根据需求再查)：

| 数字       | 格式     | 输出       | 描述                     |
|------------|----------|------------|--------------------------|
| 3.1415926  | {:.2f}   | 3.14       | 保留小数点后两位         |
| 3.1415926  | {:+.2f}  | +3.14      | 带符号保留小数点后两位   |
| -1         | {:-.2f}  | -1.00      | 带符号保留小数点后两位   |
| 2.71828    | {:.0f}   | 3          | 不带小数                 |
| 5          | {:0>2d}  | 05         | 数字补零 (填充左边, 宽度为2) |
| 5          | {:x<4d}  | 5xxx       | 数字补x (填充右边, 宽度为4) |
| 10         | {:x<4d}  | 10xx       | 数字补x (填充右边, 宽度为4) |
| 1000000    | {:,}     | 1,000,000  | 以逗号分隔的数字格式     |
| 0.25       | {:.2%}   | 25.00%     | 百分比格式               |
| 1000000000 | {:.2e}   | 1.00e+09   | 指数记法       (宽度为10)      |

### List（列表）
一个列表可以由多个不同的对象组成，比如向量、数值、字符甚至其他列表。你可以把列表当成一个由关联信息构成的，且结构良好易于读取的容器。

列表的每个元素都有索引（序号）：第一个元素是0，第二个元素是1，依次类推。你可以从list中删除元素，也可以在list的末尾添加元素。

list有如下特性
- 元素由逗号分隔，整个列表由中括号包围([ ])。
- 其中的元素可以用切片操作符（[ ]和[:]）来访问
- 列表的索引从0开始
- 加号是列表连接操作符

现在假设我们有4张专辑的发售年份为(1982, 1980, 1973, 1992)，我们需要把它赋值到单个变量中，即一个数值型列表变量。

In [15]:
Released_dates = [1982,1980,1973,1992]
Released_dates

[1982, 1980, 1973, 1992]

列表的索引、切片、拼接方式与字符串相同

In [None]:
Released_dates[0] # 索引

In [17]:
Released_dates[1:] # 切片

[1980, 1973, 1992]

使用`in`，`not in`可以判断的元素是否包含于列表

In [None]:
1982 in Released_dates

使用`append()`方法向列表末尾追加元素

In [None]:
Released_dates.append(1966)
print(Released_dates)

列表的元素是可以覆盖的，重新赋值即可

In [None]:
Released_dates[2] = 2024
print(Released_dates)

### Tuple（元组）

Tuples与list很类似，区别在于元组中的元素不能被修改，并且使用的是圆括号而不是方括号。元组也是用索引机制来访问的。音乐风格就很适合存储在元组中，因为它们不会经常变动。这里有一些Python元组的例子：

In [None]:
genres_tuple = ("pop", "rock", "soul", "hard rock",
                "soft rock","R&B", 
                "progressive rock",
                "disco")  # 这里这里用的是圆括号，注意和list 的方括号区分
                # 逗号之后的换行不需要额外标记，如需要将单行代码写为两行，可以使用\
genres_tuple

In [None]:
genres_tuple[-1] = 'folk' #对元组元素直接赋值会报错

In [19]:
# 元组解包操作
a,b,*c= (1,2,3,4,5)
print(a)
print(b)
print(c) # *的用法是接收其余所有的剩余参数

1
2
[3, 4, 5]


### Dictionary（字典）

字典是Python内置的最重要的数据结构。字典如其名所示，其格式为

**`关键字:值`** 对组成的结构

在字典中，任何一个元素都有一个关键字key和值value。**元素在字典中没有序号，即没有顺序。**同时，每个key必须是唯一的。请看下面这个电话本的例子。

In [None]:
phonebook = {'Andrew Parson':8806336,
             'Emily Everett':\
             6784346,
             'Peter Power':7658344, 
             'Lewis Lame':1122345}
phonebook

在字典中获取值的方式是指定关键字。例如，下面操作的结果就是获得指定的关键字所对应的值。

In [None]:
phonebook['Peter Power']

在字典中添加元素十分简单，直接通过赋值即可，下面的代码在字典中添加新的键-值对

In [None]:
phonebook['Jerry Lu'] = 7628644
phonebook

修改元素的方式与添加元素类似，下面的代码会将关键字为‘Jerry Lu’的元素的值修改为 7628645

In [None]:
phonebook['Jerry Lu'] = 7628645
phonebook

### 集合 Set
集合中的元素不能重复

In [21]:
set_b ={0,1,1}
set_b

{0, 1}

In [23]:
list_a = [0,1,2,3,2,1,0]
set_a = set(list_a)
list(set_a)

[0, 1, 2, 3]

set可以进行集合运算

In [25]:
a = set('Michael Jackson')
b = set('Fleetwood Mac')

print(a)
print(b)
print(a - b)     # a 和 b 的差集
print(a | b)     # a 和 b 的并集
print(a & b)     # a 和 b 的交集
print(a ^ b)     # a 和 b 中不同时存在的元素

{'i', 'c', 'o', 'e', 'J', 'h', 'l', ' ', 's', 'n', 'a', 'k', 'M'}
{'t', 'c', 'o', 'd', 'e', 'F', 'l', ' ', 'w', 'a', 'M'}
{'i', 'J', 's', 'n', 'h', 'k'}
{'t', 'c', 'd', 'J', 's', 'n', 'h', 'M', 'i', 'o', 'e', 'F', 'l', ' ', 'w', 'a', 'k'}
{'c', 'o', 'e', 'l', ' ', 'a', 'M'}
{'i', 't', 'd', 'J', 'F', 'h', 'w', 's', 'n', 'k'}


## 控制流

截止到现在，以上代码都是从上到下顺序执行的。如果我们想改变这一工作流程，应该怎么做？就像这样的情况：你需要程序作出一些决定，并依据不同的情况去完成不同的事情，例如依据每天时间的不同打印出 '早上好'  或 '晚上好' ？

这将通过控制流语句来实现的。在 Python 中有三种控制流语句——`if-else` `for` 和 `while`。

### if-else

`if`语句用以检查条件：如果 条件为真（True），我们将运行一块语句（if-block），否则 我们将运行另一块语句（else-block）。其中（else-block）部分是可选的。
<img src="https://pan.imgbed.link/file/173602" width="500">

In [27]:
#获取当前时间的小时数
import time
current_hour = time.localtime().tm_hour
print('current_hour: '+ str(current_hour))

current_hour: 18


In [31]:
#控制流代码
if current_hour <= 19:
    print('讲课进度还可以')
else:
    print('进度偏慢，后面要快点了')

讲课进度还可以


需要注意，python使用缩进来判断控制流的作用范围和嵌套关系，缩进对齐的if和else才是对应关系。例如:
```python
if current_hour <= 5:
    if current_hour > 7:
        print('...')
    else:
        print('...')
else:
    print('...')
```
建议使用Tab键或4个空格来实现缩进。

`if`也可以单独使用，不加else。

In [None]:
if 2<1:
    print("True")

`if`也可以有多个判断条件。使用`elif`来实现。`elif` 语句在前面的 `if` 或 `elif` 条件不满足时才会被检查。如果 `elif` 条件为真，则执行对应的代码块。后面的`elif`代码块将不会被执行。

In [None]:
x = 10
if x > 0:
    print("x 是正数")
elif x == 0:
    print("x 是零")
else:
    print("x 是负数")

### for 循环

for循环用于遍历任何序列的项目，如一个列表或者一个字符串。

<img src="https://pan.imgbed.link/file/173603" width="500">

In [33]:
progress = ['1. 简介与工具准备',
            '2. python基础语法',
            '3. python变量类型',
            '4. 控制流',
            '5. 函数',
            '6. 类',
            '7. 模块'] # 一个字符串列表
i=0
for p in progress: # 这里的p是循环变量，progress是被循环的序列
    print(p)
    print("loop",i)
    i+=1 # i = i+1
    #time.sleep(1) #暂停1秒

1. 简介与工具准备
loop 0
2. python基础语法
loop 1
3. python变量类型
loop 2
4. 控制流
loop 3
5. 函数
loop 4
6. 类
loop 5
7. 模块
loop 6


除了用于遍历列表以外，`for`循环也常与`range()`一起使用。用于数字的循环。`range()` 函数是 Python 中的一个内置函数，用于生成一个整数序列。有三种不同的调用方式
- range(stop)，从0到stop-1
- range(start, stop) 从start到stop-1
- range(start, stop, step) 从start到stop-1，步长为step

In [None]:
for i in range(2,10,2):
    print(i)

for循环也可以循环其他序列对象，此处不再展开。

### while 循环

while循环用于循环执行某段程序，直到不满足循环条件时终止。

<img src="https://pan.imgbed.link/file/173604" width="500">

In [None]:
#使用while循环打印斐波那契数列
i = 0
j = 1
fi = 0
while fi < 500:
    fi = i+j
    i,j = j,fi # 同时进行两个变量的赋值
    print(fi)

### 循环的continue、break与pass

`continue`能**跳过**循环体中剩余的代码，直接进入下一轮循环。

In [None]:
i = 0
j = 1
fi = 0
while fi < 500:
    fi = i+j
    i= j
    j= fi
    if fi%2 == 0:
        continue  #当fi为偶数时，跳过print，进入下一循环
    print(fi)

`break`能直接**跳出**当前循环体，结束循环。

In [None]:
i = 0
j = 1
fi = 0
while fi < 500:
    fi = i+j
    i= j
    j= fi
    print(fi)
    if fi%11 == 0:
        break    #当fi为11的倍数时，结束循环

`pass`实际上不执行任何操作。仅用作占位。提高代码的可读性。

In [None]:
for i in range(10):
    if i % 2 == 0:
        pass  # 占位符，不执行任何操作
    else:
        print(i)

# 函数 Function

## 定义函数

函数在编程中指一段可复用的代码。使用函数有助于简化代码，便于理解和修改。 

在Python中采用`def`关键字进行函数的定义。

来看一个简单的数学问题，对于：
$$
f(n)
\begin{cases}
\cfrac n2, & \text{if}\ n \ \text{is even}\\
3n + 1, & \text{if}\ n \ \text{is odd}
\end{cases}
$$

我们现在可以用python代码来表达：
```python
if n%2 == 0:
    f_n = n/2
else:
    f_n = 3*n+1
```
如果我们需要计算
$$ f(3)+f(4)*f(5)$$
不使用函数的话，我们可以这样写：

In [None]:
a = 3
b = 4
c = 5

##计算f(3)
if a%2 == 0:
    f_a = a/2
else:
    f_a = 3*a+1
    
##计算f(4)
if b%2 == 0:
    f_b = b/2
else:
    f_b = 3*b+1
    
##计算f(5)
if c%2 == 0:
    f_c = c/2
else:
    f_c = 3*c+1
    
print('f(3) + f(4) * f(5) =',f_a+f_b*f_c)

可以观察到其中大部分代码是**重复**的。对于这类简单的问题，我们尚且可以使用循环来简化。但面对更复杂的问题，函数的重要性就显现出来了。

In [None]:
def f(n): #def关键字，定义函数名称为f，函数的输入为n
    if n%2 == 0:     #函数体，注意相比 def 关键字要整体缩进
        f_n = n/2
    else:
        f_n = 3*n+1
    return f_n       #return关键字，函数的返回值，可以没有，有一个，或者多个

当定义完成函数之后，前述问题可以用一行代码简单实现。

In [None]:
print('f(3) + f(4) * f(5) =',f(3) + f(4) * f(5))

需要注意的是，函数中的变量存在**作用域**的问题，函数以外不能调用函数里层的变量。

In [None]:
def func(x):
    my_a = 5
    return my_a * x
b = 3
#a = func(b)
print(my_a)

这个例子可以看到，打印的 my_a 是函数体以外的 my_a ，而不是函数体内的 my_a。这是由于作用域的原因。

共有两种类型的函数：

- **用户自定义函数**：由我们自定义的函数，比如上面的例子
- **预定义函数**：Python预定义的函数,如`max()`,`min()`,`abs()`等
- **通过库引入的函数**： 例如绘图函数`plt.plot()`，使用这些函数需要导入第三方库

In [None]:
album_ratings = [10.0,8.5,9.5,12.5,7.0,7.0,9.5,9.0,9.5] 
M = max(album_ratings) # 使用内置的max函数可以得到列表中最大的数值
M

<div class="alert alert-block alert-success">
Python的预定义函数在这里不进行一一介绍，大家可以通过<code>print(dir(__builtins__))</code>查询
</div>

In [None]:
print(dir(__builtins__))

## 在函数中使用参数



以下是调用函数时可使用的正式参数类型：

- 必需参数
- 关键字参数
- 默认参数
- 不定长参数

### 必需参数
必需参数也叫位置参数，须以正确的顺序传入函数。调用时的数量必须和声明时的一样。

In [None]:
def grow(name,currentAge,Year):
    print(name+' will be',currentAge + Year,'years old.')

In [None]:
grow('Pete',10,2)

### 关键字参数
关键字参数和函数调用关系紧密，函数调用使用关键字参数来确定传入的参数值。

In [None]:
grow('pete', Year = 2,currentAge = 10)

### 默认参数
调用函数时，如果没有传递参数，则会使用默认参数。默认参数需要再函数定义时给出。

In [None]:
def printinfo( name = 'SJTU', age = 128 ):
    print("name: ", name)
    print("age: ", age)

printinfo(name = 'FDU',age = 120)

In [None]:
printinfo()

### 不定长参数

在 Python 中，不定长参数允许你定义可以接受任意数量参数的函数。主要有两种类型的不定长参数：

- 位置不定长参数（使用 `*args`）
- 关键字不定长参数（使用 `**kwargs`）

对于位置不定长参数（使用 `*args`），参数在函数内部会被打包成一个元组。

In [23]:
def printinfo(arg1, *vartuple ):
    print("Output:")
    print(arg1)
    print(vartuple)
    print(vartuple[1])
    print(type(vartuple))
    for v in vartuple:
        print(v)
printinfo(40, 50,60,70 ,80,90,100,110) # 會用元組的形式把東西打包

Output:
40
(50, 60, 70, 80, 90, 100, 110)
60
<class 'tuple'>
50
60
70
80
90
100
110


使用关键字不定长参数 `**kwargs` 可以传递任意数量的关键字参数给函数。参数在函数内部会被打包成一个**字典**。这种写法在很多内置函数的帮助文档中经常会见到。

In [44]:
def printinfo(arg1, **kwargs):
    print(arg1)
    print(kwargs)
    print(type(kwargs))
    for key, value in kwargs.items():
        print(f"{key}: {value}")
    print(kwargs['location'])

In [48]:
printinfo('sjtu',year = 1896,location = 'Minhang') # 會用字典的形式把東西打包

sjtu
{'year': 1896, 'location': 'Minhang'}
<class 'dict'>
year: 1896
location: Minhang
Minhang


### 位置参数和关键字参数的组合

你可以在同一个函数中同时使用位置参数、关键字参数、默认参数、*args 和 **kwargs。

In [None]:
def greet(greeting, *names, age=25, **info):
    for name in names:
        print("{}, {}! You are {} years old.".format(greeting,name,age))
    for key, value in info.items():
        print("{}: {}".format(key,value))

greet("Hello", "Alice", "Bob", age=30, city="New York", hobby="Reading")

# 类 Class (*选学)

由以上的知识，我们已经可以实现大部分的**面向过程**编程了。所谓面向过程是一种以过程为中心的编程思想。这些都是以什么正在发生为主要目标进行编程，不同于面向对象的是谁在受影响。许多时候面向过程的思考方式是不直观的、不自然的，与之对应的是**面向对象**的编程方式。

Python从设计之初就已经是一门面向对象的语言，正因为如此，在Python中创建一个类和对象是很容易的。
如果以前没有接触过面向对象的编程语言，那我们可能需要先了解一些面向对象思想的一些基本知识。

* **类:** 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。 
 
 
* **类变量：**类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。 


* **类方法：**类中定义的函数。


* **实例化：**创建一个类的实例，类的具体对象。 
 
 
* **对象：**通过类定义的数据结构实例。对象包括两个数据成员（类变量和实例变量）和方法。 

我们通过以下一个银行账户转账的简单例子了解一下面向对象的编程方式。

In [None]:
class Account:                               #定义一个名叫Account的类
    def __init__(self, name, balance):       #__init__()方法是类的初始化函数，是必须的，self关键字表示类的成员
        self.name = name                     #定义了类成员变量name
        self.balance = balance               #定义了类成员变量balance
        
    def transfer(self, receiver, amount):    #定义类的成员函数transfer，实现转账功能。类成员函数包含参数self。
        if self.balance < amount:
            print('账户:',self.name,'余额不足')
        else:
            self.balance = self.balance - amount
            receiver.balance = receiver.balance + amount
            print('已转账',amount)
            
    def check_balance(self):                 #定义类的成员函数check_balance，实现余额查询功能。
        print('账户:',self.name,'余额:',self.balance)

至此，我们定义的Account类中包含以下内容：
* 类变量
     * name 
     * balance 
* 类方法
     * transfer() 
     * check_balance() 

In [None]:
account_a = Account(name='A',balance=50)  #类的实例化，传入的参数即__init__()要求传入的变量，除去self
account_b = Account(name='B',balance=100) #这里的account_a, account_b就称为对象(Object)

account_a.check_balance()  #对象可以用 object.method()的方法调用自身的成员方法
account_b.check_balance()  #对象可以用 object.method()的方法调用自身的成员方法

In [None]:
account_a.transfer(receiver=account_b,amount=100)

In [None]:
account_a.transfer(receiver=account_b,amount=50)

account_a.check_balance()
account_b.check_balance()

对**面向对象**的编程方式有了一个大概的了解之后，我们在回过头想：同样的账户与转账的操作，用**面向过程**的方式会怎么写？

我们可能会需要一个**字典**储存账户名和余额，另外创建一个**函数**来实现字典的修改，即转账功能。

不难感受到，面向对象的思考方式是**更自然的，更接近现实的**。

类的继承： 面向对象编程 (OOP) 语言的一个主要功能就是**“继承”**。继承是指这样一种能力：它可以使用现有类的所有功能，并在无需重新编写原来的类的情况下对这些功能进行扩展。
通过继承创建的新类称为**“子类”**或“派生类”，被继承的类称为“基类”、**“父类”**或“超类”。

接下来我们通过继承上述的Account类，创建拥有密码属性的子类EncryptAccount：

In [None]:
class EncryptAccount(Account):  #定义一个名叫EncryptAccount的类，继承自Account类
    def __init__(self, name, balance, passwd):       
        Account.__init__(self, name, balance) # 调用父类的初始化
        self.passwd = passwd
        
    def transfer(self, receiver, amount, passwd): # 重写父类的transfer方法，加入密码验证
        if passwd != self.passwd:
            print('密码错误')
            return    
        if self.balance < amount:
            print('账户:',self.name,'余额不足')
            return
        self.balance = self.balance - amount
        receiver.balance = receiver.balance + amount
        print('已转账',amount)

In [None]:
encrypt_account_a = EncryptAccount(name='A',balance=50,passwd='ac_a')  
encrypt_account_b = EncryptAccount(name='B',balance=100,passwd='ac_b') 

encrypt_account_a.check_balance() 
encrypt_account_b.check_balance() # 子类EncryptAccount直接继承了父类Account的`check_balance() `方法

In [None]:
encrypt_account_a.transfer(receiver=encrypt_account_b,amount=30,passwd='ac') # 重写的transfer方法

In [None]:
encrypt_account_a.transfer(receiver=encrypt_account_b,amount=30,passwd='ac_a')

In [None]:
encrypt_account_a.check_balance()  
encrypt_account_b.check_balance()

# 模块

又称**库**，其中包含了**子模块**、**类**和**方法**。比如用于数学运算的math、numpy，用于数据分析的pandas，用于数据可视化的matplotlib，用于机器学习的pytorch、tensorflow。正是这些丰富而强大的模块，使得python在数据科学领域如此流行。

这些库有些是python内置的，称为**标准模块**；另外一些是需要我们自行安装的，称为**第三方模块**。当我们通过安装Anaconda来安装python的时候，Anaconda已经帮我们把许多常用的数据科学相关的第三方模块安装好了，这也是为什么我们推荐大家入门的时候使用Anaconda。当然有的时候你可能会需要用到anaconda没有安装的模块，这时候你就需要使用conda或者pip工具去安装这些模块了。

标准模块：
* datetime 日期时间
* math 数学计算
* os 操作系统、文件操作
* sys 操作系统、文件操作
* urllib 网页、爬虫
* re 正则表达式

第三方模块：
* numpy 加速的数学计算
* scipy 科学计算
* pandas 统计
* matplotlib 数据可视化
* seaborn 数据可视化
* sci-learn 机器学习
* pytorch 神经网络
* tensorflow 神经网络

大家可能注意到了，我们在之前使用了语句`import time`，其中`time`就是python内置的一个标准模块，`import`是引入模块的关键字。

In [None]:
import time
print('Hello World!')
print('现在是 '+time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

引入time模块之后，我们通过`time.localtime()`调用time模块的localtime()方法，获得了当前的时间。再通过time模块的strftime()方法，将当前时间格式化为`%Y-%m-%d %H:%M:%S`的格式，然后打印输出。

模块引用语法即
```python
import library
```
同时也有 
```python
from library import name
```
和
```python
from library import name as nm
```

其中`from…import…` 语句不引入整个模块，而是只引入其中一部分。`as`可以用简写进行重命名，以方便后续编程。如以下几个是通过引入`numpy`的随机数子模块来产生0~10随机整数的一个例子。

In [None]:
import numpy 
numpy.random.randint(10)

In [None]:
import numpy as np # 有時候我們會受限於名字的長度  並進行一個重命名
np.random.randint(10)

In [None]:
from numpy import random
random.randint(10)

In [None]:
from numpy import random as rand
rand.randint(10)

# 练习作业

**1. 判断水仙花数**: 编写一个函数，语法为`is_narcissistic_number(number)`，判断一个**三位数**是否是水仙花数。这里的水仙花数是指该三位数的各位数字的立方和等于该数本身。例如，153 是一个水仙花数，因为 $1^3+5^3+3^3 = 153$。要求：使用位置参数传入的形式获取函数输入，参数名为`number`。使用 `if` 语句判断输入的整数是否是水仙花数。根据判断结果打印出相应的消息，不需要有显式的返回值（可以不写return）。
示例：
```
is_narcissistic_number(153)
输出>>> 
153 是水仙花数。

is_narcissistic_number(123)
输出>>> 
123 不是水仙花数。
```

In [19]:
# import numpy as np
def is_narcissistic_number(number):
    # 你的代码写在这里
    # print(type(str(number)[1]));
    sum = 0; 
    for i in range(len(str(number))): 
        sum += int(str(number)[i]) ** (len(str(number)));

    if sum == number:
        return True;
    else: 
        return False;
is_narcissistic_number(153)

True

**2. 线性插值**。编写一个函数来进行线性插值。函数接受两个列表 `x_values` 和 `y_values`，以及一个需要插值的 `x` 值。假设 `x_values` 和 `y_values` 是等长的，并且 `x_values` 中的值是按升序排列的。函数需要找到 `x` 所在的区间，并使用线性插值公式计算对应的 `y` 值。
线性插值公式如下：
$$y = y_0 + \frac{(y_1 - y_0) \cdot (x - x_0)}{(x_1 - x_0)}$$。其中的$(x_0,y_0),(x_1,y_1)$分别代表区间的两个端点。
要求：
函数调用语法为`y = linear_interpolation(x_values, y_values, x)`
使用线性插值公式计算并返回（return）对应的 y 值。如果 x 超出 x_values 的范围，返回 `None`。示例：


```
linear_interpolation([1, 2, 3], [2, 3, 5], 2.5) = 4.0
linear_interpolation([0, 10], [0, 10], 5) = 5.0
linear_interpolation([1, 2, 3], [2, 3, 5], 0) = None
```

In [74]:
def linear_interpolation(*args):
    # 你的代码写在这里

    # print(args)
    # print(type(args))

    # successfully fetch x!
    x = args[-1]
    # print(x)

    if len(args) == 3:
        x_values = args[0]
        y_values = args[1]
    else:
        x_values = args[0:len(args) // 2] # note: 但起點是要的!
        y_values = args[(len(args) // 2) : len(args) - 1] # note: 終點是不要的!
        
    # print(len(args))
    # note: everything in Python is 0-indexed


    if x > x_values[-1] or x < x_values[0]:
        return None

    # 能做到這一步代表餵進來的 x 正常

    # 接著找出 x 在 x_values 的哪個 partitions
    partitions = 0
    for i in range(len(x_values) - 1):
        if x >= x_values[i] and x <= x_values[i + 1]:
            partitions = i
            break
        else:
            continue
    
    # 代公式
    return y_values[partitions] + (y_values[partitions + 1] - y_values[partitions]) * (x - x_values[partitions]) / (x_values[partitions + 1] - x_values[partitions])
    

# linear_interpolation(1, 2, 3, 4, 2)
# linear_interpolation([1, 2, 3], [2, 3, 5], 2.5)
#linear_interpolation([1, 2, 3], [2, 3, 5], 0) == None

**3. 函数的参数控制：** 编写一个名为 `evaluate_polynomial` 的函数，该函数可以接受多个系数，并根据指定的变量值计算多项式的值。函数需要支持以下功能：

- 接受任意数量的系数作为位置参数，系数按从高次到低次的顺序排列
- 接受一个名为 `x` 的关键字参数，指定多项式的变量值，默认值为 0

示例
```
evaluate_polynomial(1, 0, -2, x=3)
# 输出: 1*3^2 + 0*3^1 + (-2)*3^0 = 7

evaluate_polynomial(2, -1, 3, 0, x=2)
# 输出: 2*2^3 + (-1)*2^2 + 3*2^1 + 0*2^0 = 13

evaluate_polynomial(5, 0, 0, 1)
# 输出: 5*0^3 + 0*0^2 + 0*0^1 + 1*0^0 = 1
```

提示：
- 使用 `*args` 接受任意数量的位置参数。
- 使用关键字参数 `x` 提供默认值。
- 使用循环和幂运算来计算多项式的值。

In [1]:
def evaluate_polynomial(*coefficients, x = 0):
    # your code here
    # Issue: user有時候會輸入 x 有時候不會輸入 x
    # print(coefficients)
    # print(x)
    result = 0
    for i in range(len(coefficients)):
        # print(len(coefficients) - i - 1)
        # print(coefficients[i])
        # print("---")
        result += coefficients[i] * ( x ** (len(coefficients) - i - 1) )
    
    return result

In [3]:
evaluate_polynomial(1, 0, -2, x=3)

7

In [5]:
evaluate_polynomial(2, -1, 3, 0, x=2)

18

**4. 面向对象编程练习（供自学练习，选做, 不计分）：** 试实现子类CreditAccount（继承自课件前面的Account父类），使账户拥有各自的信用额度属性credit，并重写父类的transfer方法，转账时允许账户透支相应的信用额度。

In [None]:
class CreditAccount(Account):  #定义一个名叫CreditAccount的类，继承自Account类
    
    def __init__(self, name, balance, credit):       
        ########在此行以下输入代码，完成题目要求


        #######输入代码结束
        
    def transfer(self, receiver, amount): # 重写父类的transfer方法，允许账户透支相应的信用额度
        ########在此行以下输入代码，完成题目要求


        #######输入代码结束

In [None]:
credit_account_a = CreditAccount(name='A',balance=50, credit=100)  
credit_account_b = CreditAccount(name='B',balance=100, credit= 0) 

credit_account_a.check_balance()
credit_account_b.check_balance() 

In [None]:
credit_account_a.transfer(receiver=credit_account_b,amount=200)

In [None]:
credit_account_a.transfer(receiver=credit_account_b,amount=100)

In [None]:
credit_account_a.check_balance()
credit_account_b.check_balance() 