OCR识别Demo

环境

System: Ubuntu 20.04 LTS
Go version: go 1.14/4
tesseract: 4.1.1
"github.com/otiai10/gosseract/v2"
Mysql server 8.0

准备工作

准备了OCR基础库, 中文, 英文, 日语 (当然也可以自己添加别的啦~) 在Ubuntu 18.04, 20.04上均可以正常运行

sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
sudo apt install tesseract-ocr-chi-sim tesseract-ocr-chi-sim-vert tesseract-ocr-eng tesseract-ocr-jpn tesseract-ocr-jpn-vert

实现功能

支持多语言, 比如: 有一张图片, 里面同时有中文, 英文, 日文, 可以一起检索, 一起输出 (使用rune, 也就是int32 , 也是mysql中的utf8mb4)
用户在识别的时候自己输入一个标识符(userId), 日后可以检索自己的历史记录(有可能和别人的标识符重合, 从而检索出别人的结果, 后续可以做成登陆的形式来避免此类情况)
用户在使用服务时会提示是否将自己的图片资源保留在服务器上, 图片使用ksuid命名, 系统匿名使用. 可以供系统对比图片识别结果和实际结果的差异, 提升服务质量, 当然, 这个是用户可选的
用户可以指定tesseract支持的其他语言, 比如: 俄语, 法语etc
使用fileType来识别文件类型, 不依赖拓展名
剔除无用字符, 例如: \n, \r, [Space]

接口设计

上传图片并获取识别结果

Method: POST

URL: /ocr

Content-Type: multipart/form-data

imgFile: [file] binary // 非空
userId: userID string // 可选, 如果用户需要保存自己之前的记录, 就填写一下, 后续可以根据userId去查找自己之前的记录 
isAgree: string // 可选
wantRecognizeLans // 可选

查询历史识别结果

Method: GET

URL: /query
```
userId: string // 可选
```

线上实验环境地址

提示: 服务器位于AWS Lightsail服务器, 速度会较慢, 请耐心等待, 界面太丑了, 我会后续完善一下下😁

点击进入

后续安排

前端美化
Docker化

Docker 使用指南

根据数据和应用互相隔离的原则, 使用两个容器, 一个mysql容器, 另外一个则是应用容器使用方法如下: 首先, 确保本机安装docker环境在./mysql/dockerScript/ 目录下, 运行runmysqlOCR.sh 脚本, 执行之后使用docker inspect ocrmysql拿到容器的地址, 然后填写到mysql/mysql_config.json文件的ip地址中, 容器暴露到本地的端口默认是3310, 觉得不爽在mysql/dockerScript/runmysqlOCR.sh中改成自己想要的就好了在./下, 运行build.sh脚本, 即可在本地http://0.0.0.0:4001访问哟~
测试代码

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
handleImage		handleImage
mysql		mysql
public		public
template		template
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
build.sh		build.sh
go.mod		go.mod
go.sum		go.sum
main.go		main.go

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OCR识别Demo

环境

准备工作

实现功能

接口设计

线上实验环境地址

后续安排

About

Releases

Packages

Languages

rogerBridge/ocr-demo

Folders and files

Latest commit

History

Repository files navigation

OCR识别Demo

环境

准备工作

实现功能

接口设计

线上实验环境地址

后续安排

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages