# Python项目结构建议

一般我们写python项目代码，往往会有项目业务代码，工具代码，配置文件，安装文件，相关组件包requirement.txt文件。如果做数据挖掘与分析，往往还有数据输入文件以及数据输出文件。

如果将这些文件都放在一个目录下，将使得项目文件非常混乱，难于管理。

以下是项目结构组成的建议

## 主要代码结构

```
myproject/
|-- config/
|   |-- public
|   |   |-- log.config
|   |-- smallbiz
|   |   |-- smallbiz.json
|   |-- bigbiz
|   |   |-- bigbiz.json
|
|-- smallbiz/
|   |-- tests/
|   |   |-- __init__.py
|   |   |-- test_main.py
|   |
|   |-- __init__.py
|   |-- main.py
|
|-- bigbiz/
|   |-- tests/
|   |   |-- __init__.py
|   |   |-- test_main.py
|   |
|   |-- __init__.py
|   |-- main.py
|
|-- util/
|   |-- public/
|   |   |-- __init__.py
|   |   |-- emailutil.py
|   |   |-- logutil.py
|   |   |-- encryptutil.py
|   |-- smallbiz/
|   |   |-- __init__.py
|   |   |-- smallbizutil.py
|   |-- bigbiz/
|   |   |-- __init__.py
|   |   |-- bigbizutil.py
|   |-- __init__.py
|
|-- docs/
|   |-- smallbiz.md
|   |-- bigbiz.md
|
|-- setup.py
|-- requirements.txt
|-- README.md
```

如上所示，假定一个项目有两个密切相关的业务，可以分别建一个代码文件夹。

配置文件部分，公用与业务配置分开；

工具模块部分，公用与业务工具模块分开；

此外可以专门建立一个说明文档文件夹，分别介绍各个业务的实现。

setup.py是组件包的安装文件

requirement.txt放置需要的python包，如

```
Keras>=2.0.8
numpy>=1.15.2
subword-nmt>=0.3.5
tqdm>=4.26.0
h5py>=2.8.0
```
然后通过：

```pip install -r example/requirements.txt```进行安装

README.md是项目总体说明文档，现在都流行markdown写文档，建议跟上这个趋势。

## 相关数据以及输出文件目录结构推荐

如果做数据挖掘或机器学习，自然会接触很多数据文件或模型文件，甚至还有大量的日志文件。

因为往往这些文件比较大，而且琐碎，所以不建议与代码目录放在一起。

毕竟传到git不方便，而且使得项目特别臃肿，一般将数据文件或模型的下载路径，配置在配置文件中，然后按需下载，并且下载到此处描述的数据文件夹里。

建议的目录结构：

```
myprojectrelatedfiles/
|-- log/
|-- model/
|   |-- public/
|   |   |-- word2vec.h5
|   |-- smallbiz/
|   |   |-- traindata/
|   |   |   |-- smallbizdata.csv
|   |   |-- models
|   |   |   |-- smallbizlstm.h5
|   |   |   |-- smallbizlstm.json
|   |   |   |-- smallbizlstm.yaml
|   |   |   |-- smallbizlstm.weight.h5
|   |-- bigbiz/
|   |   |-- traindata/
|   |   |   |-- bigbizdata.csv
|   |   |-- models
|   |   |   |-- bigbizlstm.h5
|   |   |   |-- bigbizlstm.json
|   |   |   |-- bigbizlstm.yaml
|   |   |   |-- bigbizlstm.weight.h5
|-- data/
|   |-- input/
|   |   |-- smallbiz/
|   |   |   |-- testdata.csv
|   |   |-- bigbiz/
|   |   |   |-- testdata.csv
|   |-- output/
|   |   |-- smallbiz/
|   |   |   |-- runmodelresult.csv
|   |   |-- bigbiz
|   |   |   |-- runmodelresult.csv
```