# chatterbot源码解析

## 第一步：目录结构

### 文件夹
- chatterbot 主程序
    - ext
    - input
    - output
    - storage
    
    - \__init__.py
    - \__main__.py
    - adapters.py
    - chatterbot.py
    - comparisons.py
    - constants.py
    - conversation.py
    - corpus.py
    - filters.py
    - parsing.py
    - preprocessors.py
    - response_selection.py
    - trainers.py
    - utils.py
- docs 各类文档说明
- examples 示例
- graphics 图像
- tests 测试
- tests_django django测试

### 文件
- .codeclimate.yml
- .gitignore
- .travis.yml
- LICENSE 
- READEME.md
- requirements.txt
- runtests.py
- setup.cfg
- setup.py
- tox.ini

下面开始主要拆解主目录的结构和内容。

### 1. \__init__.py文件的解码

In [None]:
"""
ChatterBot is a machine learning, conversational dialog engine.
"""

from .chatterbot import ChatBot  # 引入主程序

__version__ = '0.8.7' # 版本号
__author__ = 'Gunther Cox ' # 作者
__email__ = 'gunthercx@gmail.com' # 邮件地址
__url__ = 'https://github.com/gunthercox/ChatterBot' # url

__all__ = ('ChatBot',)

一般来说新建的一个包下，必然会有一个\__init__文件？那么这个文件到底邮有和作用呢?

总结几点如下： 

  1.\__init__文件在包下，其中定义了包的属性，方法；必须要有这个文件，如果没有的话，这个包就只是一个目录（不信你删除试试）;

  2.其内容可以为空，但是必须存在，当你引包中的模块是，实际上引的是\__init__文件；

  3.\__init__.py 控制着包的导入行为。假如 __init__.py 为空，那么仅仅导入包是什么都做不了的。

  4.\__init__.py 中有个\__all__的属性，可以在其中加入模块名，然后在导入，相当于from pacakage import *
 

In [9]:
# 导入真实的chatterbot模块内容
from chatterbot import ChatBot
from chatterbot import *

In [10]:
# 导入rebuild的模块信息
from chatterbot_r import *

ModuleNotFoundError: No module named 'chatterbot_r.chatterbot'

由于chatterbot_r.chatterbot文件不存在，所以转向chatterbot文件的源码解析，并且存储的名称后面加上'_r'。

### 2.chatterbot.chatterbot.py文件解析

chatterbot.chatterbot.ChatBot类

ChatBot类初始化时，需要生成指定的（默认的）的Storage, Input, Output Adapter类，用于指定不同的服务。

MultiLogicAdapter用于调整

utils.validate_adapter_class用于检测验证Adapter类的有效性

filters

preprocessors 预处理

trainer 训练

logger

read_only 是否只读模式，如果不是，则接受用户的query，存储，再学习。



chatterbot.chatterbot.ChatBot类的方法
- initialze()
- get_response(input_item, conversation_id=None) 根据输入，返回输出
- generate_response(input_statement, conversation_id)
- set_trainer(training_class, **kwargs)
- tain()

### 3. 解析storage adapter的源码

\__init__.py文件

In [None]:
from .storage_adapter import StorageAdapter
from .django_storage import DjangoStorageAdapter
from .mongodb import MongoDatabaseAdapter
from .sql_storage import SQLStorageAdapter


__all__ = (
    'StorageAdapter',
    'DjangoStorageAdapter',
    'MongoDatabaseAdapter',
    'SQLStorageAdapter',
)

In [None]:
chatterbot.chatterbot.storage目录下，主要有四个文件，每个文件一个类

chatterbot.chatterbot.storage.storage_adapter.StorageAdapter
chatterbot.chatterbot