# Python基础

## 1. 输出
Python通过`print`语句将程序变量输出到控制台。print可以接受多个任意类型的变量，并默认用空格将它们分隔开。输出的字符串默认以换行符（回车）结尾。

In [1]:
print("Hello", "world!")
print("Welcome to Fudan University!")

Hello world!
Welcome to Fudan University!


### 格式化输出
与C语言中的`printf`类似，`print`可以以格式化的字符串为输入。基本的格式为：
```python
print("格式化字符串" % (参数1, 参数2, ..., 参数n))
```
如：

In [2]:
i = 3
epoch = 0
running_loss = 42

print('epoch %d: batch %5d loss: %.3f' % (epoch+1, i+1, running_loss / 2000))

epoch 1: batch     4 loss: 0.021


格式化字符串中，形如`%d`、`%5d`、`%.3f`的串称为**占位符**，它的作用是告诉`print`后面跟的对应参数以什么样的形式输出。常见的占位符有如下几种：
|占位符|意义|例子|例子输出|
|---|---|---|---|
|`%d`|整数|`print("I am %d years old." % (18))`| `I am 18 years old.`|
|`%nd`|固定位数的整数|`print("I am %5d years old." % (18))`|`I am ###18 years old.`(`#`表示空格)|
|`%.nf`|保留`n`位小数|`print("Running loss: %.4f" % (0.34567))`|`Running loss: 0.3457`|
|`%s`|字符串|`print("My name is %s." % ("Alice"))`|`My name is Alice.`|

- 注意：格式化字符串中占位符的数量要与后接参数的数量`n`保持一致。

## 2. 变量、基本数据类型
变量(variable)用于存储值。与C语言不同，在Python中，变量赋值不需要指明类型，写法类似于一个方程：

`<变量名> = <变量值>`

In [3]:
x = y = 3
my_name = "Alice"
print(x, y, my_name)

3 3 Alice


**注意**：
- 变量名可以包括大小写字母、下划线（`_`）以及数字，但数字不能出现在开头。

Python中内置了多种数据类型。常用的基本数据类型有：
|名称|说明|例子|
|---|---|---|
|`int`|整数|`1024`|
|`float`|浮点数|`3.14`|
|`bool`|布尔值|`True`、`False`|
|`str`|字符串|`'Hello'`、`"World!"`|

下面我们分别介绍各个数据类型和它们的用法。

### `int`、`float`和`bool`
`int`和`float`都表示数字。Python支持这些类型的常用数学运算（加`+`、减`-`、乘`*`、除`/`、整除（也叫地板除）`//`、乘方`**`、取余`%`、大小比较。
注意：
- 对于除`/`，即使能够整除也会默认返回`float`类型。
- 一般只用整数之间的整除。整除会向下取整。
- 一般只用整数之间的取余。取余运算返回除法得到的余数。
- 整数和浮点数的运算会返回浮点数。
- 在Python中数学的大中小括号统一用小括号表示。

In [4]:
print("四则运算:", 3 + 4, 3 - 4, 3 * 4, 3 / 4)

print("除法运算:", 4 / 2, 4 / 3)

print("整除运算:", 4 // 2, 4 // 3, -4 // 3)

print("乘方运算:", (4 + 2) ** 2)

print("取余运算:", 4 % 2, 4 % 3) # 4 / 2 = 2...0, 4 % 3 = 1...1

四则运算: 7 -1 12 0.75
除法运算: 2.0 1.3333333333333333
整除运算: 2 1 -2
乘方运算: 36
取余运算: 0 1


`bool`可以是认为一种特殊的`int`。它只能取两个值：`True`和`False`（真/假）。因此，`bool`类型常用于逻辑判断。代码中我们一般不会主动声明`bool`型变量，它是在判断时隐式产生的。比较运算符有：
|Python写法|数学形式|
|---|---|
|`<`、`>`|$\lt$、$\gt$|
|`<=`、`>=`|$\le$、$\ge$|
|`!=`|$\ne$|
|`==`|$=$|

In [5]:
print(3 <= 4, 3 > 4, 3 == 3, 1 != 2)

True False True True


布尔值之间可以进行逻辑运算。逻辑运算有：与(`and`)、或(`or`)和非(`not`)：

In [6]:
print(1 < 2 and 2 < 3)

print(1 > 2 or 1 <= 3)

print(not (5 >= 3))

True
True
False


### 字符串`str`
字符串类型用于表示字符序列。它既可以用双引号`"..."`声明也可以用单引号`'...'`声明，二者是等价的。

In [7]:
print("Hello!", 'Hello!')

Hello! Hello!


`str`支持一些运算，如`+`和`*`：

In [8]:
print("Hello" + " world!")
print("Hello!" * 5)

Hello world!
Hello!Hello!Hello!Hello!Hello!


格式字符串（f-string）可以方便地格式化字符串。它的形式是在字符串引号前加一个`f`，并在需要格式化的地方用大括号包裹变量，如：

In [9]:
my_age = 18
my_name = "Alice"
print(f"My name is {my_name}, and I am {my_age} years old.")

My name is Alice, and I am 18 years old.


#### 转义符
转义符`\`（反斜线）让我们能够在字符串中加入特殊字符。常用的特殊字符有换行`\n`、制表符`\t`等。此外，对于一些字符（如单双引号），我们必须在前面加入转义符才能让Python识别。对于反斜线自身，我们也需要在它前面加入一个额外的转义符来表示反斜线。

In [10]:
print("Hello\tWorld!")

print("Hello\nWorld!")

print("He said: \"...\"")

save_path = "D:\\models\\"

print(save_path)

Hello	World!
Hello
World!
He said: "..."
D:\models\


可以将上述几个类型相互转换（但转换一定要有意义），如：

In [11]:
print(str(123))

print(float("3.14"))

print(int("     345 "))

123
3.14
345


## 3. 条件判断
条件判断能够根据表达式的真伪执行不同的对应操作。比如我们熟知的一元二次方程$ax^2+bx+c=0$有实数解的条件：$\Delta=b^2-4ac\ge0$，它可以用Python实现如下：

In [12]:
a = 1.0
b = 2.0
c = 1.0

delta = b * b - 4 * a * c

if delta > 0:
    print("方程有两个不同的实数解")
elif delta == 0:
    print("方程有一个实数解")
else:
    print("方程无实数解")

方程有一个实数解


判断语句的基本格式如下：
```python
if <条件1>:
    <条件1满足时执行的操作>
    ...
elif <条件2>:
    <条件1不满足，但条件2满足时执行的操作>
    ...
elif <条件3>：
    <条件1和2不满足，但条件3满足时执行的操作>
    ...
else:
    <上述条件均不满足时执行的操作>
```

注意：
- `elif`和`else`分支都是可选项。
- 与早期的语言不同，Python的代码块通过缩进（即某一行前面的空格）来实现。某个分支内的代码缩进要保持一致。

## 4. 容器数据类型
容器数据类型用于存储结构化的数据。下面是一些常用的容器数据类型：
|名称|说明|例子|
|---|---|---|
|`list`|列表|`[1, 1, 2, 3, 5]`、`["Hello", 1, True]`|
|`tuple`|元组|`(1, 2, 3)`、`("Yes", True)`|
|`dict`|字典|`{"name": "Alice", "score": 100}`|

下面我们分别介绍这些容器的用法。

### 列表(`list`)
列表用于存储有序的数据。比如我们想要存储一个斐波那契数列:
$$
F_1 = 1, F_2 = 1, F_n = F_{n-1} + F_{n-2} (n \ge 3)
$$

In [13]:
fib = [1, 1, 2, 3, 5, 8]
print(fib)

[1, 1, 2, 3, 5, 8]


可以通过索引（类似于数列的下标）取出列表中的对应项。注意：与大多数程序语言类似，列表的下标从**0**开始，即`fib[0]`表示`fib`的第1项：

In [14]:
print(fib[0], fib[1], fib[2])

1 1 2


Python支持负数下标，其意义为**倒数第几项**。如：

In [15]:
print(fib[-1], fib[-2])

8 5


也可以用索引对列表中的对应项赋值，如：

In [16]:
fib[0] = -1

print(fib)

[-1, 1, 2, 3, 5, 8]


大多数容器都可以用`len()`获取它的长度。比如，上面我们创建的列表长为6（从而，索引为0~5）：

In [17]:
print(len(fib))

6


如果不小心让下标超出了容器的长度，Python会在运行时报错：

In [18]:
print(fib[6])

IndexError: list index out of range

每个容器都内置了一些操作，这些操作可以修改容器、获取容器内的值等，比如对于列表，我们有下面的常用操作`append`，它在列表的最后增加一个元素：

In [19]:
fib.append(fib[-2] + fib[-1])

print(fib)

[-1, 1, 2, 3, 5, 8, 13]


列表还内置了一些方便的操作，这里我们不一一介绍。下面是一些提示：
- 可以使用`list()`或`[]`初始化一个空列表，如：`my_list = list()`或`my_list = []`
- 与C语言、Java等编程语言不同，Python列表可以存储非同种数据，如`["I am ", 18, "years old."]`
- 容器可以嵌套使用。比如，我们需要存储一个矩阵
$$
\begin{pmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix}
$$
那么在python中可以写作：
```python
matrix = [[1, 0, 0],
          [0, 1, 0],
          [0, 0, 1]]
```
这时，`matrix`的第1个元素(`matrix[0]`)也是一个列表，值为`[1, 0, 0]`；获取第2行第3个元素可以写作`matrix[1][2]`。

### 元组(tuple)
元组和列表一样，都用于存储有序的数据。但元组一旦初始化就无法修改,从而防止数据被意外地修改。比如，我们要存储一个一元二次方程组的系数$a,b,c$：

In [20]:
coefs = (1.0, 2.0, 1.0)

print(coefs, coefs[0], coefs[1], coefs[2])

(1.0, 2.0, 1.0) 1.0 2.0 1.0


下面是一些提示：
- 可以使用`tuple()`或`()`初始化一个空列表（尽管没什么意义，因为元组不能修改）；
- 如果要创建一个单元素元组，需要写成类似`(1, )`来与带括号的数学表达式`(1)`做区分；
- Python中可以使用解构赋值来方便地获取一部分容器（列表、元组）中的各个元素。在作业中有这样一行：
```python
(data, label) = trainset[10]
```
这行代码将`trainset[10]`的第0个元素和第1个元素分别赋值给`data`和`label`.它等价于：
```python
data = trainset[10][0]
label = trainset[10][1]
```

### 字典(dict)
字典用于快速地查找数据。我们在查字典时，也是需要先找到词，然后阅读词下面的解释。这个结构可以在Python中表示如下：

In [21]:
dictionary = {
    "abandon": "to leave sb, especially sb you are responsible for, with no intention of returning",
    "abnormal": "different from what is usual or expected, especially in a way that is worrying, harmful or not wanted"
}

print(dictionary["abandon"])

to leave sb, especially sb you are responsible for, with no intention of returning


在Python dict中，索引不一定是数字，而是存储时的键(key)。每一个表项由键(key)和值(value)组成，在上述例子中，第一个项的键是字符串类型`"abandon"`，对应的值就是`"abandon"`的解释。

同样可以使用索引为字典添加一个新表项：

In [22]:
dictionary["apple"] = "a round fruit with shiny red or green skin and firm white flesh"

print(dictionary["apple"])

a round fruit with shiny red or green skin and firm white flesh


## 5. 循环
循环用于完成某些重复的操作。假如我们不知道平方和公式，一个朴素的求法就是逐个累加：$S_n=1^2+2^2+\cdots+n^2.$
这个逻辑在Python中可实现如下：

In [23]:
n = 10
result = 0

for i in range(1, n + 1):
    result = result + i * i

print(result) # 1 + 2 + ... + 10

385


`for`的基本语法为
```py
for <变量> in <容器>:
    <语句>
    ...
```
这里的`range(start, end)`返回$[start, end)$中的整数，所以我们调用`range(1, n + 1)`返回`1, 2, ..., n`. `i`是一个循环中的临时变量，在每次循环时会自动更新到容器中的下一个值，不需要我们手动赋值。

对于上述的所有容器，我们都可以用`for`循环来遍历它们：

In [24]:
fib = [1, 1, 2, 3, 5, 8]

for item in fib:
    print(item)

1
1
2
3
5
8


In [25]:
coefs = (2.0, 3.0, 4.0)

for coef in coefs:
    print(coef)

2.0
3.0
4.0


对于`dict`，遍历的是它的键：

In [26]:
dictionary = {
    "abandon": "to leave sb, especially sb you are responsible for, with no intention of returning",
    "abnormal": "different from what is usual or expected, especially in a way that is worrying, harmful or not wanted"
}

for word in dictionary:
    print(f"{word}: {dictionary[word]}")

abandon: to leave sb, especially sb you are responsible for, with no intention of returning
abnormal: different from what is usual or expected, especially in a way that is worrying, harmful or not wanted


## 6. 函数(function)/方法(method)
函数用于将一组需要反复使用的语句打包，以简化代码、使程序更具有逻辑性。我们上面用过的`print`、`len`都是Python内置的一些函数；Python也提供了许多内置库，它们包含了一些没那么常用的函数，如开平方`sqrt`、取自然对数`log`等数学运算。为了调用这些库中的函数，我们需要使用`import`语句：

In [27]:
import math

print(math.sqrt(4.0))

print(math.log(1.0))

# 下面为等价写法: from <模块> import ...

from math import sqrt

print(sqrt(4.0))

2.0
0.0
2.0


当然，库中的函数不可能满足我们编程时的所有要求，这时我们可以根据自己的需求自定义函数。比如我们现在想计算平面中两个点$A=(x_1, y_1), B=(x_2, y_2)$之间的直线距离：
$$|AB|=\sqrt{(x_1-x_2)^2 + (y_1-y_2)^2}$$

这个计算可以打包成如下的函数：

In [28]:
import math

def distance(x1, y1, x2, y2):
    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)

A = (0, 0)
B = (1, 1)

print(distance(A[0], A[1], B[0], B[1]))

1.4142135623730951


函数的声明如下：

```python
def <函数名>(参数1, 参数2, ..., 参数n):
    <语句>
    ...
    return <返回值>
```

- **函数名**与变量的命名规则相同，一般体现这个函数的功能；
- **参数**为函数完成计算所需要的输入变量，比如上面计算距离的函数，它需要两个点的坐标作为输入；
- **返回值**为函数计算得到的结果。对于计算距离的函数，它返回一个`float`型变量表示两个点的距离。

### 默认参数
我们在高中使用的距离一般为欧几里得距离，计算方式为平方-求和-开根号；在一些应用场景中我们可能希望使用其它距离，比如如下定义的曼哈顿距离（也叫街区距离）：
$$|AB|=|x_1-x_2|+|y_1-y_2|$$

为了把上面这个计算封装成函数，我们自然可以再定义一个函数`manhattan_distance(x1, y1, x2, y2)`，但如果我们为每种距离都定义一个新的函数，有时会导致代码非常繁杂。这时，我们可以使用默认参数：

In [29]:
import math

def distance(x1, y1, x2, y2, measure="euclid"):
    if measure == "euclid":
        return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
    elif measure == "manhattan":
        return abs(x1 - x2) + abs(y1 - y2)

A = (0, 0)
B = (1, 1)

print(distance(A[0], A[1], B[0], B[1])) # 默认为欧几里得距离

print(distance(A[0], A[1], B[0], B[1], measure="manhattan")) # 配置使用曼哈顿距离

1.4142135623730951
2


默认参数需要**写在参数列表的最后**，与其它参数的不同点就是多了`=<默认值>`这一部分。当调用函数时，若不进行指定，则该参数会被设置为`<默认值>`。在作业中，我们也能看到一些默认参数的例子：

In [30]:
from torch.utils.data import DataLoader

trainloader = DataLoader(trainset, batch_size=batch_size, shuffle=True, num_workers=2)

NameError: name 'trainset' is not defined

从文档中（或者在IDE中鼠标悬停在定义上）我们可以看到这些默认参数的默认值（一部分）：
```python
class DataLoader(
    dataset: Dataset,
    batch_size: int | None = 1,
    shuffle: bool | None = None,
    num_workers: int = 0,
    ...
)
```
- `DataLoader`只有`dataset`是必填参数；
- 批量大小`batch_size`若不指明默认为1；
- 是否打乱数据`shuffle`默认为`None`（不打乱）；
- 加载进程数`num_workers`默认为0（默认只在主进程中加载）。

## 7. 类(class)
类是面向对象编程的重点。这里我们不过多涉及软件构造方面的讲解，我们从一个例子开始。假如我们希望存储一个人的某些信息(如姓名、身份证号)，我们就可以创建一个`Person`类：

In [None]:
class Person:
    def __init__(self, name, id_number):
        self.name = name
        self.id_number = id_number

alice = Person("Alice", "001")

print(alice.name)
print(alice.id_number)

类的定义与实例创建语法如下：
```python
class <类名>:
    def __init__(self, 参数1, 参数2, ..., 参数n):
        <语句>
        ...

<实例名> = <类名>(参数1, 参数2, ..., 参数n)
```

- 类名的命名要求与函数和变量一致；
- `__init__`称为类的**构造函数**，可以理解为一个特殊的函数，它通常对类所拥有的各个属性做初始化。对于`Person`这个类，类的属性有姓名`name`和身份证号`id_number`。
- 构造函数的第一个参数总为`self`，可以通过`self`保存类的属性。（`self.name = name`, `self.id_number = id_number`）
- 代码中的`alice = Person("Alice", "001")`将类进行**实例化**：类规定了人所应具备的属性（姓名、身份证号），相当于一种规范、抽象的概念；实例化创造了一个`Person`**实例**；实例名为`alice`。
- 调用构造函数进行实例化时忽视`self`这个参数，只需要传入参数1到参数n。
- 类的属性可以通过`<实例名>.<属性名>`获取。（如`alice.name`）

假设现在我们想打印一个字符串，模拟人的工作（比如输出`"<name> is working..."`，我们可以通过一个函数来实现：

In [31]:
class Person:
    def __init__(self, name, id_number):
        self.name = name
        self.id_number = id_number

def work(person):
    print(f"{person.name} is working...")

alice = Person("Alice", "001")
work(alice)

Alice is working...


出于代码的可维护性和安全性等考虑，更常见的做法是将这个函数封装在`Person`类中：

In [32]:
class Person:
    def __init__(self, name, id_number):
        self.name = name
        self.id_number = id_number
    
    def work(self):
        print(f"{self.name} is working...")

alice = Person("Alice", "001")
alice.work()

Alice is working...


在函数实现中，我们需要传入一个`Person`实例；当我们把函数放到类的内部时，这些属性可以通过`self`参数获得。当调用`alice.work()`这行代码时，可以理解为：函数内部的`self`被替换为了`alice`，从而能够获取`alice`的属性。

### 类的继承
假如在上述代码的基础上，我们又多了一个函数`eat()`表示人在吃饭：

In [33]:
class Person:
    def __init__(self, name, id_number):
        self.name = name
        self.id_number = id_number
    
    def work(self):
        print(f"{self.name} is working...")
    
    def eat(self):
        print(f"{self.name} is eating...")

现在我们有一个新需求：保存学生的信息。学生不仅要有姓名、身份证号，还要有学号。学生也会工作和吃饭，但学生的工作要更具体（即学习）。我们可以新定义一个类来实现这个需求：

In [34]:
class Student:
    def __init__(self, name, id_number, student_id):
        self.name = name
        self.id_number = id_number
        self.student_id = student_id
    
    def work(self):
        print(f"{self.name} is learning...")
    
    def eat(self):
        print(f"{self.name} is eating...")

alice = Student("Alice", "001", "fdu-001")
alice.work()
alice.eat()

Alice is learning...
Alice is eating...


这时我们发现，`eat`这个函数与`Person`中完全一样，我们没有必要重新定义一次这个函数。面向对象的编程语言提供了继承来解决各种代码维护的问题。使用继承，我们可以这样完成上面的需求：

In [35]:
class Student(Person):
    def __init__(self, name, id_number, student_id):
        self.name = name
        self.id_number = id_number
        self.student_id = student_id
    
    def work(self):
        print(f"{self.name} is learning...")

bob = Student("Bob", "002", "fdu-002")
bob.work()
bob.eat()

Bob is learning...
Bob is eating...


- 通过将类的定义改为`class Student(Person)`，**子类**`Student`**继承**了**父类**`Person`。继承允许我们在原有的类基础上，只修改那些我们想改变的功能，而保留原有的功能，这样我们就不需要反复写同样的代码了；
- 在上面的例子中，不需要变动的功能是`eat`，在`Student`中我们没有定义`eat`，但也成功调用了这个函数（因为它继承自父类的`eat`）。
- 修改想要改变的功能即为**重写**，在上面的例子中我们重写了构造函数以及`work`函数。
- 子类也能够增加父类中没有的新函数以适应更具体的需求。

最后我们通过一个例子来解释pytorch中的继承：考虑在`Person`中新增加一个函数`daily_life`来表示一个人的日常生活。对于一个`Person`, `daily_life`可能实现如下：

In [36]:
class Person:
    def __init__(self, name, id_number):
        self.name = name
        self.id_number = id_number
    
    def work(self):
        print(f"{self.name} is working...")
    
    def eat(self):
        print(f"{self.name} is eating...")
    
    def daily_life(self):
        self.eat()
        self.work()
        self.eat()
        self.work()
        self.eat()

alice = Person("Alice", "001")
alice.daily_life()

Alice is eating...
Alice is working...
Alice is eating...
Alice is working...
Alice is eating...


对于学生`Student`类，我们仍然继承`Person`类。因此，对于一个学生，调用他的`daily_life`会是这样的：

In [37]:
class Student(Person):
    def __init__(self, name, id_number, student_id):
        self.name = name
        self.id_number = id_number
        self.student_id = student_id
    
    def work(self):
        print(f"{self.name} is learning...")

bob = Student("Bob", "002", "fdu-002")
bob.daily_life()

Bob is eating...
Bob is learning...
Bob is eating...
Bob is learning...
Bob is eating...


可以看到，`bob.daily_life`中输出的是`Bob is learning...`，而不是父类中`work()`输出的`Bob is working...`。这说明子类的实例会优先运行自己被重写后的函数（这一特性被称为**多态**）。对于`daily_life`这个函数而言，它的流程是固定的：`eat() -> work() -> eat() -> work() -> eat()`.但由于多态特性，对于不同的子类，`work()`具体执行的代码可能是不同的。

在作业中，我们涉及的继承和多态在神经网络定义处：
```python
class Net(nn.Module):
    def __init__(self):
        # nn.Module子类的函数必须在构造函数中执行父类的构造函数
        super(Net, self).__init__()

        # 卷积层 '3'表示输入图片为单通道, '6'表示输出通道数，'5'表示卷积核为5*5
        self.conv1 = nn.Conv2d(3, 6, 5) 
        # 卷积层
        self.conv2 = nn.Conv2d(6, 16, 5) 
        # 仿射层/全连接层，y = Wx + b
        self.fc1   = nn.Linear(16*5*5, 120) 
        self.fc2   = nn.Linear(120, 84)
        self.fc3   = nn.Linear(84, 10)

    def forward(self, x): 
        # 卷积 -> 激活 -> 池化 (relu激活函数不改变输入的形状)
        # [batch size, 3, 32, 32] -- conv1 --> [batch size, 6, 28, 28] -- maxpool --> [batch size, 6, 14, 14]
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # [batch size, 6, 14, 14] -- conv2 --> [batch size, 16, 10, 10] --> maxpool --> [batch size, 16, 5, 5]
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        # 把 16 * 5 * 5 的特征图展平，变为 [batch size, 16 * 5 * 5]，以送入全连接层
        x = x.view(x.size()[0], -1) 
        # [batch size, 16 * 5 * 5] -- fc1 --> [batch size, 120]
        x = F.relu(self.fc1(x))
        # [batch size, 120] -- fc2 --> [batch size, 84]
        x = F.relu(self.fc2(x))
        # [batch size, 84] -- fc3 --> [batch size, 10]
        x = self.fc3(x)        
        return x
```
可以看到，`Net`类继承自`nn.Module`，这是pytorch库中表示神经网络的一个通用父类。`forward`函数就利用了多态特性：在调用神经网络时，有许多定义在`nn.Module`父类中的准备工作，但我们不需要关心这些准备工作；我们需要关注的就是子类中重写的`forward`函数。只要我们重写了`forward`函数，训练神经网络就像上面例子中的`daily_life`一样，在固定的流程中执行，但不同的子类`forward`的具体实现不同，从而实现了自定义神经网络。

# 2. linux基础命令
在Windows这样的具有图形用户界面的操作系统中，我们可以通过鼠标点击等方式选择各种操作（创建文件夹、复制粘贴）；但在服务器的Linux操作系统上，我们只有一个命令行窗口，没法简单地实现上述操作。在linux中，各种操作都通过输入命令实现。

## 文件路径
我们首先介绍文件路径。文件路径分为**绝对路径**和**相对路径**，前者会随着操作系统略有不同，例如Windows下的绝对路径：
```sh
C:\Program Files # 指向C盘下Program Files这个文件夹
C:\Program Files\1.txt # 指向C盘下Program Files文件夹中的1.txt这个文件

C:/Program Files # 等价
C:/Program Files/1.txt # 等价
```
linux下的绝对路径会以"/"开头，如
```sh
/share/vhome # 指向根目录share文件夹中vhome文件夹
/share/vhome/1.txt # 指向vhome文件夹中的1.txt文件
```
相对路径在各个系统下一般可以通用，比如
```sh
../log/ # 指向当前文件夹上一层文件夹中的log文件夹
./models/ # 指向当前文件夹中models文件夹
models/ # 与上一行等价
./models/checkpoint.pt # 指向当前文件夹中models文件夹下的checkpoint.pt文件
```
在相对路径表示法中，`..`表示上一层目录；`.`表示当前目录，也可省略。
## `pwd`命令
`pwd`是print working directory的缩写，打印当前所在目录。
## `cd`命令
`cd`是change directory的缩写，它的作用是切换当前目录到指定目录。如：
```sh
cd ./models/
cd /share/vhome/
```
执行`cd`后，`.`表示的意义也会随之改变。
## `ls`命令
`ls`是list的缩写，它的作用是列出当前目录下的所有文件。由于服务器自带一个简单的图形界面，实验中应该用不到。
## `cp`命令
`cp`是copy的缩写，即复制文件到指定位置。如：
```sh
cp ./models/checkpoint.pt ./
```
即把当前目录`models`文件夹下的`checkpoint.pt`复制到当前文件夹下。
## `mv`命令
`mv`即move，与`cp`用法类似。功能类似于剪切。
## `rm`命令
`rm`即remove，删除文件。例：
```sh
rm 1.txt # 删除当前文件夹下1.txt这个文件
rm -rf models # 删除当前文件夹下models这个文件夹，及其中的所有文件
```
`-rf`选项用于递归（逐层）地删除文件夹下的所有内容。
## `mkdir`命令
即make directory，创建文件夹。例：
```sh
mkdir models # 在当前文件夹下创建models文件夹
```