# Lab1:认识pytorch包的文件结构

### 基础知识：
需要知道python的简单语法，包的概念，不太了解也问题不大

### 目标

简单了解pytorch的目录结构，了解如何构建简化版pytorch的目录结构，知道如何进行单元测试

![](../.assets/mytorch_structure.png)

### 如何学习

问题：是否需要看懂每一行代码，学懂每一个语法

答案：完全不需要，因为大厂实习、工作、大型项目都是做填空/改错的活，所以只需要关注要点即可。

### 任务：构建一个自己的小型pip包

思考: 假设要构建一个简化版pytorch，首先要写的代码是什么

【答案：包的结构代码】

思考：一个pip包关键要有哪些东西

【答案：setup, init文件】

TODO：创建一个`example\my_package`的包，结构如下：
```
├─my_package
|  ├─setup.py
│  └─packageA
|      ├─file1.py (有greet函数)
|      ├─__init__.py
```

使用可编辑模式安装`my_package`，之后在`example\test_my_package.py`当中测试`packageA.greet()`

提示：
1. setup.py文件中可以用`from setuptools import setup`引入setup，函数参数:name="包名", version=0.1, packages=["子包名"]
2. 每一个包都有一个__init__.py文件，里面引入的东西可以被外部访问
3. .表示当前文件夹，..表示上一级文件夹
4. 可编辑模式安装指令是`pip install -e`


TODO: 在`packageA`当中增加一个子包`packageB`，结构如下:

```
├─my_package
|  ├─setup.py
│  └─packageA
│      ├─packageB
|      |  ├─file2.py (有hello、bye函数)
|      |  ├─__init__.py
|      ├─file1.py (有greet函数)
|      ├─__init__.py
```

测试`packageA.packageB.hello()或bye()函数`


TODO: 添加一行代码，使得可以直接测试：`packageA.hello()`

TODO: 添加代码，使得可以`from packageA import *`引入hello, greet, bye函数

提示. import *的内容由`__all__ = ["?", "?"]`指定

In [1]:
# 展示一下pytorch的包结构
import torch
from torch import nn

nn.Linear(10, 5)
nn.ReLU()

print(torch.__version__) # 2.5.1
print(torch.__file__) # d:\conda_env\pytorch-cuda\Lib\site-packages\torch\__init__.py
print(torch.utils.__file__) # d:\conda_env\pytorch-cuda\Lib\site-packages\torch\utils\__init__.py



2.5.1
d:\conda_env\pytorch-cuda\Lib\site-packages\torch\__init__.py
d:\conda_env\pytorch-cuda\Lib\site-packages\torch\utils\__init__.py


### 任务：简单了解pytorch的文件结构

问题：`print(包.__file__)`打开的是什么文件？

【答案：安装后，这个包下面的`__init__.py`文件】

问题：通过pip install安装的pytorch和pip install -e安装的mytorch有什么区别

【答案：没有加e的话，pytorch包代码会被拷贝到Python环境（我使用了conda所以是conda中的python环境）的site-packages目录下，而加了e不拷贝，直接链接到原代码位置】

问题：mytorch安装的时候为什么要加e

【答案：因为修改可以立即生效，否则写一次代码要安装一次包太麻烦了】

问题：`torch.__version__`来自于哪里？

【答案：来自于torch\version.py。`torch\__init__.py`当中引入了__version__,就可以用"包.属性"打印】

### 任务：理解MyTorch这个项目

```
├── exercise/
│   ├── mytorch/    # 在这里写TODO实现算子
│   ├── test/       # 在这里写TODO实现测试
│   ├── Lab1.ipynb  # 在这里找到TODO位置/回答问题
|   └──example      # 在这里写TODO理解项目结构
│   ...
└── solution/       # 标准答案
    ...
```

安装标准答案的pytorch:
```shell
cd MyTorch\solution
pip install -e mytorch
```


问题：MyTorch中的包结构是什么样的？为什么这么设计？

【答案：setup安装了同级的mytorch包，其中有mynn, myutils子包。因为仿照了pytorch，并进行了简化】


问题：MyTorch当中如果要进行单独测试，应该怎么做？

【答案：进入到某个测试文件所在文件夹(同理，不要在其他路径运行)，单独运行这个测试文件即可】


TODO：去到test\mytorch\test_mytorch_info.py打印mytorch的版本号


问题：如果想要修改mytorch的版本号，需要去哪里修改? 修改之之后为什么能立即生效?

【答案：mytorch的__init__.py文件】


问题：test\mlp\test_linear.py当中为什么可以from mytorch.mynn import CustomLinear

【答案：因为mytorch当中有一个子包mynn，所以可以用mytorch.mynn, 因为mynn的__init__.py文件引入了CustomLinear所以可以从mynn import CustomLinear】


总结：pytorch还有很多内容无法全部概览

### 任务：了解python测试框架unittest

目标:填写TODO之后，需要通过4个测试

文件结构

```
unittest
├─math_tests
│  └─__pycache__
└─string_tests
    └─__pycache__
```

简而言之就是定义了数学和字符串的两种测试，在根目录的test_runner.py当中调用

问题: example\unittest\test_runner.py代码当中测试了哪些文件，有多少个测试

【答案：两个文件夹下的3个文件，总共有4个测试，每个测试中可以有多个assert】

现在测试没有通过：

![](../.assets/example_unittest_fail.png)


TODO：修改example\unittest\string_tests\test_length.py中的TODO，使得assert断言通过


通过之后应该是这样

![](../.assets/example_unittest.png)


问题：unittest当中的verbosity是什么意思

【答案：打印内容有多详细的意思，数字大就详细，可以是0，1，2】