GitHub

根据自己的实际情况，对bert的代码进行了清理重构

data 目录下保存训练，验证，测试数据
- train.csv
- valid.csv
- test.csv
数据格式为：id, content, label
task.py是数据读取处理脚本
common_tool.py是公共函数包，为方便服务打包最小依赖而独立出来
model 目录下存放google发布的中文预训练模型，有以下几个文件
- bert_config.json
- bert_model.ckpt.data-00000-of-00001
- bert_model.ckpt.index
- bert_model.ckpt.meta
- vocab.txt
saved_model 目录保存训练后生成的saved_model模型供服务部署使用
output 目录保存训练，测试过程中的输出
执行方法：
- python run_classifier.py
- 如需修改参数可以参考run.sh脚本内容，
模型发布：
- build.sh
- 该脚本生成两个docker镜像
  - 一个是tensorflow_serving模型推断服务
  - 一个是flask的web接口服务

Name		Name	Last commit message	Last commit date
Latest commit History 119 Commits
.idea		.idea
build		build
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
app.py		app.py
app_test.py		app_test.py
build.sh		build.sh
common_tool.py		common_tool.py
modeling.py		modeling.py
modeling_test.py		modeling_test.py
optimization.py		optimization.py
optimization_test.py		optimization_test.py
requirements.txt		requirements.txt
result_analysis.py		result_analysis.py
run.sh		run.sh
run_classifier.py		run_classifier.py
sample_text.txt		sample_text.txt
saved_model_test.py		saved_model_test.py
task.py		task.py
task_test.py		task_test.py
tokenization.py		tokenization.py
tokenization_test.py		tokenization_test.py
vocab.txt		vocab.txt

Provide feedback