识别并统计健康码截图中的个人信息
-
2022-5-3:
Alpha v0.1.0:
构造了对本地图片处理的可用脚本
接下来将尝试分割
baidu-ocr.py
:healthcode-ocr.conf
为配置文件:提供key
文件路径、输入文件路径、输入文件类型png/jpg
、输出文件路径、输出文件名- 通过
main.py
加载配置文件、调用baidu-ocr.py
识别图片得到结果。
-
2022-5-2:
利用本地文件尝试调用了
baidu-ocr SDK
,识别准确率良好输出结果格式化为
result.xls
文件 -
2022-4-13:
OCR_baidu.py
报错:ModuleNotFoundError: No module named 'chardet'
,执行命令pip install chardet
解决。 -
2022-4-12:
建立新的工作分支
baidu-ocr
暂停
main
分支中根据pytesseract-ocr
搭建OCR
引擎工作获取
baidu-aip
调用接口申请百度
OCR
免费测试资源
-
安装百度官方
OCR
依赖包baidu-aip
、chardet
pip install baidu-aip pip install chardet
-
根据提示安装其他依赖包