# Python 备忘单 

## 目录  
1. <a href='#section1'>语法和空格</a>
2. <a href='#section2'>注释</a>
3. <a href='#section3'>数字和运算</a>
4. <a href='#section4'>字符串处理</a>
5. <a href='#section5'>列表、元组和字典</a>
6. <a href='#section6'>JSON</a>
7. <a href='#section7'>循环</a>
8. <a href='#section8'>文件处理</a>
9. <a href='#section9'>函数</a>
10. <a href='#section10'>处理日期时间</a>
11. <a href='#section11'>NumPy</a>
12. <a href='#section12'>Pandas</a>

要运行单元格，请按 **Shift+Enter** 或单击页面顶部的 **Run（运行）**。

<a id="section_1"></a>

## 1. 语法和空格
Python 使用缩进空间来指示语句的级别。下面的单元格是一个示例，其中 '**if**' 和 '**else**' 处于同一级别，而 '**print**' 由空格分隔到不同级别。相同级别的项目的间距应相同。

In [None]:
student_number = input("Enter your student number:")
if student_number != 0:
    print("Welcome student {}".format(student_number))
else:
    print("Try again!")

<a id='section2'></a>

## 2. 注释
在 Python 中，注释以井号 '#' 开头并延伸至该行的末尾。'#' 可以在行的开头或代码之后。

In [None]:
# 这是打印“hello world!”的代码

print("Hello world!") # hello world 的打印语句
print("# is not a comment in this case")

<a id='section3'></a>

## 3. 数字和运算

与其他编程语言一样，数字有四种类型： 
- 由 *int* 表示的整数（例如 1、20、45、1000）
- 由 *float* 表示的浮点数（例如 1.25、20.35、1000.00）
- 长整数 
- 复数（例如 x+2y，其中 x 是已知的）

运算 | 结果
----------------|-------------------------------------               
x+y | x 和 y 的和	
x - y |  x 和 y 的差	
x * y | x 和y 的乘积	
x / y | x 和 y 的商
x // y | x 和 y 的商（取整）
x % y | x / y 的余数
abs(x) | x 的绝对值	
int(x) | 将 x 转换为整数
long(x) | 将 x 转换为长整数
float(x) | 将 x 转换为浮点	
pow(x, y) | x 的 y 次方	
x ** y | x 的 y 次方	

In [None]:
# 数字示例
a = 5 + 8
print("Sum of int numbers: {} and number format is {}".format(a, type(a)))

b = 5 + 2.3
print ("Sum of int and {} and number format is {}".format(b, type(b)))

<a id='section4'></a>

## 4. 字符串处理

Python 具有丰富的特征，例如用于字符串运算的其他编程语言。

In [None]:
# 将字符串存储在变量中
test_word = "hello world to everyone"

# 打印 test_word 值
print(test_word)

# 使用 [] 访问字符串的字符。第一个字符由 '0' 表示。
print(test_word[0])

# 使用 len() 函数查找字符串的长度
print(len(test_word))

# 在字符串中查找的一些示例
print(test_word.count('l')) # 计算字符串中 l 重复的次数
print(test_word.find("o")) # 在字符串中查找字母 'o' 。返回第一个匹配项的位置。
print(test_word.count(' ')) # 计算字符串中的空格数
print(test_word.upper()) # 将字符串更改为大写
print(test_word.lower()) # 将字符串更改为小写
print(test_word.replace("everyone","you")) # 将“everyone”替换为“you”
print(test_word.title()) # 将字符串更改为标题格式
print(test_word + "!!!") # 连结字符串
print(":".join(test_word)) # 在每个字符之间添加“:”
print("".join(reversed(test_word))) # 将字符串进行反转 

<a id='section5'></a>

## 5. 列表、元组和字典

Python 支持数据类型列表、元组、字典和数组。

### 列表

通过将所有项目（元素）放在方括号 \[ ] 内并以逗号分隔来创建列表。列表可以具有任意数量的项目，并且它们可以具有不同的类型（整数、浮点数、字符串等）。

In [None]:
# Python 列表类似于数组。您也可以创建一个空列表。

my_list = []

first_list = [3, 5, 7, 10]
second_list = [1, 'python', 3]

In [None]:
# 嵌套多个列表
nested_list = [first_list, second_list]
nested_list

In [None]:
# 合并多个列表
combined_list = first_list + second_list
combined_list

In [None]:
# 您也可以分割列表，就像字符串一样
combined_list[0:3]

In [None]:
# 将新条目追加到列表
combined_list.append(600)
combined_list

In [None]:
# 从列表中删除最后一个条目
combined_list.pop()

In [None]:
# 迭代列表
for item in combined_list:
    print(item)    

### 元组

元组类似于列表，但是您可以将其与括号 ( ) 一起使用，而不是与方括号一起使用。主要区别在于元组不可变，而列表可变。

In [None]:
my_tuple = (1, 2, 3, 4, 5)
my_tuple[1:4]

### 字典

字典也称为关联数组。字典由键值对的集合组成。每个键值对将键映射到其关联值。

In [None]:
desk_location = {'jack': 123, 'joe': 234, 'hary': 543}
desk_location['jack']

<a id='section6'></a>

## 6. JSON 

JSON 是用 JavaScript 对象表示法编写的文本。Python 有一个名为 `json` 的内置程序包，可用于处理 JSON 数据。

In [None]:
import json

# 示例 JSON 数据
x = '{"first_name":"Jane", "last_name":"Doe", "age":25, "city":"Chicago"}'

# 读取 JSON 数据
y = json.loads(x)

# 打印输出结果，类似于字典
print("Employee name is "+ y["first_name"] + " " + y["last_name"])

<a id='section7'></a>

## 7. 循环
**If, Else, ElIf 循环**：Python 支持条件语句，就像其他任何编程语言一样。Python 依靠缩进（行的开头是空格）来定义代码范围。

In [None]:
a = 22
b = 33
c = 100

# if ... else 示例
if a > b:
    print("a is greater than b")
else:
    print("b is greater than a")
    
    
# if .. else .. elif 示例

if a > b:
    print("a is greater than b")
elif b > c:
    print("b is greater than c")
else:
    print("b is greater than a and c is greater than b")

**While 循环：**只要条件为 true，就执行一组语句

In [None]:
# while 示例
i = 1
while i &lt; 10:
    print("count is " + str(i))
    i += 1

print("="*10)

# 如果 x 为 2，则继续进行下一个迭代。最后，条件为 false 时打印消息。

x = 0
while x &lt; 5:
    x += 1
    if x == 2:
        continue
    print(x)
else:
    print("x is no longer less than 5")

**For 循环：** `For` 循环更像 Python 中的迭代器。`For` 循环用于遍历序列（列表、元组、字典、集合、字符串或范围）。

In [None]:
# 循环示例
fruits = ["orange", "banana", "apple", "grape", "cherry"]
for fruit in fruits:
    print(fruit)

print("\n")
print("="*10)
print("\n")

# 迭代范围
for x in range(1, 10, 2):
    print(x)
else:
    print("task complete")

print("\n")
print("="*10)
print("\n")

# 迭代多个列表
traffic_lights = ["red", "yellow", "green"]
action = ["stop", "slow down", "go"]

for light in traffic_lights:
    for task in action:
        print(light, task)

<a id='section8'></a>

## 8. 文件处理
在 Python 中处理文件的主要函数是 `open()` 函数。`open()` 函数使用两个参数：文件名和模式。

打开文件有四种不同的方法（模式）：

- "r" - 读取
- "a" - 追加
- "w" - 写入
- "x" - 创建

此外，您还可以指定以二进制或文本模式处理文件。

- "t" - 文本
- "b" - 二进制

In [None]:
# 我们来创建一个测试文本文件
!echo "This is a test file with text in it.This is the first line." > test.txt
!echo "This is the second line." >> test.txt
!echo "This is the third line." >> test.txt

In [None]:
# 读取文件
file = open('test.txt', 'r')
print(file.read())
file.close()

print("\n")
print("="*10)
print("\n")

# 读取文件的前 10 个字符
file = open('test.txt', 'r')
print(file.read(10))
file.close()

print("\n")
print("="*10)
print("\n")

# 从文件读取行

file = open('test.txt', 'r')
print(file.readline())
file.close()

In [None]:
# 创建新文件

file = open('test2.txt', 'w')
file.write("This is content in the new test2 file.")
file.close()

# 读取新文件的内容
file = open('test2.txt', 'r')
print(file.read())
file.close()

In [None]:
# 更新文件
file = open('test2.txt', 'a')
file.write("\nThis is additional content in the new file.")
file.close()

# 读取新文件的内容
file = open('test2.txt', 'r')
print(file.read())
file.close()

In [None]:
# 删除文件
import os
file_names = ["test.txt", "test2.txt"]
for item in file_names:
    if os.path.exists(item):
        os.remove(item)
        print(f"File {item} removed successfully!")
    else:
        print(f"{item} file does not exist.")

<a id='section9'></a>

## 9. 函数

函数是在调用时运行的代码块。您可以将数据或*参数*传递到函数中。在 Python 中，函数是由 `def` 定义的。

In [None]:
# 定义函数
def new_funct():
    print("A simple function")

# 调用函数
new_funct()

In [None]:
# 带有参数的示例函数

def param_funct(first_name):
    print(f"Employee name is {first_name}.")

param_funct("Harry")
param_funct("Larry")
param_funct("Shally")

**匿名函数 (lambda)：** lambda 是小的匿名函数。Lambda 函数可以使用任意数量的参数，但只有一个表达式。

In [None]:
# lambda 示例
x = lambda y: y + 100
print(x(15))

print("\n")
print("="*10)
print("\n")

x = lambda a, b: a*b/100
print(x(2,4))

<a id='section10'></a>

## 10. 处理日期时间 

Python 中的 `datetime` 模块可用于处理日期对象。

In [None]:
import datetime

x = datetime.datetime.now()

print(x)
print(x.year)
print(x.strftime("%A"))
print(x.strftime("%B"))
print(x.strftime("%d"))
print(x.strftime("%H:%M:%S %p"))

<a id='section11'></a>

## 11. NumPy

NumPy 是使用 Python 进行科学计算的基本软件包。以下是它包含的一部分内容：

- 强大的 N 维数组对象
- 复杂的（广播）函数
- 集成 C/C ++ 和 Fortran 代码的工具
- 有用的线性代数、傅立叶变换和随机数功能

In [None]:
# 使用 pip 安装 NumPy
!pip install numpy

In [None]:
# 导入 NumPy 模块
import numpy as np

### 检查您的数组

In [None]:
# 创建数组
a = np.arange(15).reshape(3, 5) #在 3 x 5 维中创建范围为 0-14 的数组
b = np.zeros((3,5)) # 使用 0 创建数组
c = np.ones( (2,3,4), dtype=np.int16 ) # 使用 1 创建数组并定义数据类型
d = np.ones((3,5))

In [None]:
a.shape # 数组维度

In [None]:
len(b)# 数组长度

In [None]:
c.ndim # 数组维度的数量

In [None]:
a.size # 数组元素的数量

In [None]:
b.dtype # 数组元素的数据类型

In [None]:
c.dtype.name # 数据类型的名称

In [None]:
c.astype(float) # 将数组类型转换为其他类型

### 基本数学运算

In [None]:
# 创建数组
a = np.arange(15).reshape(3, 5) #在 3 x 5 维中创建范围为 0-14 的数组
b = np.zeros((3,5)) # 使用 0 创建数组
c = np.ones( (2,3,4), dtype=np.int16 ) # 使用 1 创建数组并定义数据类型
d = np.ones((3,5))

In [None]:
np.add(a,b) # 加法

In [None]:
np.subtract(a,b) # 减法

In [None]:
np.divide(a,d) # 除法

In [None]:
np.multiply(a,d) # 乘法

In [None]:
np.array_equal(a,b) # 对比 - arraywise

### 聚合函数

In [None]:
# 创建数组
a = np.arange(15).reshape(3, 5) #在 3 x 5 维中创建范围为 0-14 的数组
b = np.zeros((3,5)) # 使用 0 创建数组
c = np.ones( (2,3,4), dtype=np.int16 ) # 使用 1 创建数组并定义数据类型
d = np.ones((3,5))

In [None]:
a.sum() # Array-wise 和

In [None]:
a.min() # Array-wise 最小值

In [None]:
a.mean() # Array-wise 平均值

In [None]:
a.max(axis=0) # 数组行的最大值

In [None]:
np.std(a) # 标准差

### 子集、切片和索引

In [None]:
# 创建数组
a = np.arange(15).reshape(3, 5) #在 3 x 5 维中创建范围为 0-14 的数组
b = np.zeros((3,5)) # 使用 0 创建数组
c = np.ones( (2,3,4), dtype=np.int16 ) # 使用 1 创建数组并定义数据类型
d = np.ones((3,5))

In [None]:
a[1,2] # 选择第 1 行、第 2 列的元素

In [None]:
a[0:2] #选择索引 0 和 1 上的项目

In [None]:
a[:1] # 选择第 0 行的所有项目

In [None]:
a[-1:] # 选择最后一行的所有项目

In [None]:
a[a&lt;2] # 从 'a' 中选择小于 2 的元素

### 数组处理

In [None]:
# 创建数组
a = np.arange(15).reshape(3, 5) #在 3 x 5 维中创建范围为 0-14 的数组
b = np.zeros((3,5)) # 使用 0 创建数组
c = np.ones( (2,3,4), dtype=np.int16 ) # 使用 1 创建数组并定义数据类型
d = np.ones((3,5))

In [None]:
np.transpose(a) # 转置数组 'a'

In [None]:
a.ravel() # 展平数组

In [None]:
a.reshape(5,-2) # 重整但不更改数据

In [None]:
np.append(a,b) # 将项目追加到数组

In [None]:
np.concatenate((a,d), axis=0) # 连结数组

In [None]:
np.vsplit(a,3) # 在第三个索引处垂直拆分数组

In [None]:
np.hsplit(a,5) # 在第 5 个索引处水平拆分数组

<a id='section12'></a>

## Pandas

Pandas 是 BSD 许可的开放源代码库，为 Python 编程语言提供了高性能、易于使用的数据结构和数据分析工具。

Pandas DataFrame 是 Python 中复杂数据集合在内存中使用最广泛的表示形式。

In [None]:
# 使用 pip 安装 pandas、xlrd 和 openpyxl
!pip install pandas
!pip install xlrd openpyxl

In [None]:
# 导入 NumPy 和 Pandas 模块
import numpy as np
import pandas as pd

In [None]:
# 示例 dataframe df
df = pd.DataFrame({'num_legs': [2, 4, np.nan, 0],
                   'num_wings': [2, 0, 0, 0],
                   'num_specimen_seen': [10, np.nan, 1, 8]},
                   index=['falcon', 'dog', 'spider', 'fish'])
df # 显示 dataframe df

In [None]:
# 另一个示例 dataframe df1 - 使用带有日期时间索引和标记列的 NumPy 数组
df1 = pd.date_range('20130101', periods=6)
df1 = pd.DataFrame(np.random.randn(6, 4), index=df1, columns=list('ABCD'))
df1 # 显示 dataframe df1

### 查看数据

In [None]:
df1 = pd.date_range('20130101', periods=6)
df1 = pd.DataFrame(np.random.randn(6, 4), index=df1, columns=list('ABCD'))

In [None]:
df1.head(2) # 查看顶部数据

In [None]:
df1.tail(2) # 查看底部数据

In [None]:
df1.index # 显示索引列

In [None]:
df1.dtypes # 检查数据类型

In [None]:
df1.describe() # 显示数据的快速统计摘要

### 子集、切片和索引

In [None]:
df1 = pd.date_range('20130101', periods=6)
df1 = pd.DataFrame(np.random.randn(6, 4), index=df1, columns=list('ABCD'))

In [None]:
df1.T # 置换数据

In [None]:
df1.sort_index(axis=1, ascending=False) # 按轴排序

In [None]:
df1.sort_values(by='B') # 按值排序

In [None]:
df1['A'] # 选择列 A

In [None]:
df1[0:3] # 选择索引 0 到 2

In [None]:
df1['20130102':'20130104'] # 从匹配值的索引中选择

In [None]:
df1.loc[:, ['A', 'B']] # 通过标签在多轴上选择

In [None]:
df1.iloc[3] # 通过传递的整数的位置进行选择

In [None]:
df1[df1 > 0] # 从满足布尔运算条件的 DataFrame 中选择值

In [None]:
df2 = df1.copy() # 将 df1 数据集复制到 df2
df2['E'] = ['one', 'one', 'two', 'three', 'four', 'three'] # 添加带有值的 E 列
df2[df2['E'].isin(['two', 'four'])] # 使用 isin 方法进行筛选

### 数据缺失

Pandas 主要使用值 `np.nan` 来表示缺失数据。默认情况下，它不包括在计算中。

In [None]:
df = pd.DataFrame({'num_legs': [2, 4, np.nan, 0],
                   'num_wings': [2, 0, 0, 0],
                   'num_specimen_seen': [10, np.nan, 1, 8]},
                   index=['falcon', 'dog', 'spider', 'fish'])

In [None]:
df.dropna(how='any') # 删除所有缺失数据的行

In [None]:
df.dropna(how='any', axis=1) # 删除所有缺失数据的列

In [None]:
df.fillna(value=5) # 用值 5 填充缺失的数据

In [None]:
pd.isna(df) # 在缺失数据的位置获取布尔掩码

### 文件处理

In [None]:
df = pd.DataFrame({'num_legs': [2, 4, np.nan, 0],
                   'num_wings': [2, 0, 0, 0],
                   'num_specimen_seen': [10, np.nan, 1, 8]},
                   index=['falcon', 'dog', 'spider', 'fish'])

In [None]:
df.to_csv('foo.csv') # 写入 CSV 文件

In [None]:
pd.read_csv('foo.csv') # 从 CSV 文件读取

In [None]:
df.to_excel('foo.xlsx', sheet_name='Sheet1') # 写入 Microsoft Excel 文件

In [None]:
pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA']) # 从 Microsoft Excel 文件读取

### 绘制

In [None]:
# 使用 pip 安装 Matplotlib
!pip install matplotlib

In [None]:
from matplotlib import pyplot as plt # 导入 Matplotlib 模块

In [None]:
# 生成随机时间序列数据
ts = pd.Series(np.random.randn(1000),index=pd.date_range('1/1/2000', periods=1000)) 
ts.head()

In [None]:
ts = ts.cumsum()
ts.plot() # 绘制图表
plt.show()

In [None]:
# 在 DataFrame 上，plot() 方法可以方便地绘制带有标签的所有列
df4 = pd.DataFrame(np.random.randn(1000, 4), index=ts.index,columns=['A', 'B', 'C', 'D'])
df4 = df4.cumsum()
df4.head()

In [None]:
df4.plot()
plt.show()