一个功能强大的在线图片文字、表格、手写识别工具,支持多种OCR引擎和导出格式。
- 支持JPG、PNG、BMP格式图片
- 拖拽上传和点击选择
- 实时图片预览
- 简体中文、繁体中文
- 英语、日语、韩语
- 俄语、法语、德语、西班牙语
- 文字识别:普通印刷文字
- 表格识别:提取表格数据
- 手写识别:AI增强手写文字识别
- 本地引擎 (Tesseract.js) - 浏览器端,完全免费
- Python后端 - 免费开源库(EasyOCR、PaddleOCR)
- 百度OCR API - 商业级识别精度
- 其他云端AI - 自定义API端点
- 多种格式:TXT、DOCX、PDF、JSON、HTML、Markdown
- 表格导出:CSV、Excel、JSON、HTML、SQL
- 历史记录:自动保存识别记录
- 本地存储:设置和记录保存在浏览器
- 自动提取网址和API端点
- 网址分类和快速操作
- API端点测试功能
# 克隆项目
git clone https://github.com/bullshitAI52/ocr-tool.git
cd ocr-tool
# 或者直接下载ZIP
# 访问 https://github.com/bullshitAI52/ocr-tool 点击 "Code" -> "Download ZIP"# 给安装脚本执行权限
chmod +x install.sh
# 运行安装脚本
./install.sh- Fork本仓库到你的GitHub账户
- 进入仓库设置 -> Pages
- 选择部署源为
main分支,根目录/ - 点击保存,等待部署完成
- 访问
https://你的用户名.github.io/ocr-tool
# 构建Docker镜像
docker build -t ocr-tool .
# 运行容器
docker run -p 5000:5000 ocr-tool
# 或者使用docker-compose
docker-compose up直接双击打开 index.html 即可使用本地Tesseract引擎。
# 安装依赖
pip install -r requirements.txt
# 启动服务器
python server.py
# 访问工具
打开浏览器访问 http://localhost:5000- 访问百度AI开放平台注册账号
- 创建OCR应用获取API Key和Secret Key
- 在工具设置中配置
ocr-tool/
├── index.html # 主界面
├── style.css # 样式表
├── script.js # 前端逻辑
├── server.py # Python后端服务器
├── requirements.txt # Python依赖
├── README.md # 说明文档
└── ocr_history/ # 历史记录目录(自动创建)
- EasyOCR:支持80+种语言,安装简单
- PaddleOCR:百度开源,中文识别优秀
- OCR.space:免费API,每月500次调用
POST /ocr- 执行OCR识别GET /history- 获取历史记录POST /export- 导出结果GET /health- 健康检查GET /config- 配置管理
- 优先使用本地引擎:完全免费,保护隐私
- Python后端备用:免费开源库,识别效果好
- 百度OCR专业场景:需要高精度时使用
- 其他AI最后选择:复杂场景或需要特定功能
- 印刷文字:使用本地引擎或Python后端
- 手写文字:使用Python后端(EasyOCR)或百度OCR
- 复杂表格:使用表格识别模式
- 批量处理:保存历史记录,批量导出
# 克隆项目
git clone <repository-url>
cd ocr-tool
# 安装Python依赖
pip install -r requirements.txt
# 启动服务器
python server.py# 构建镜像
docker build -t ocr-tool .
# 运行容器
docker run -p 5000:5000 ocr-tool- 将项目上传到服务器
- 安装Python和依赖
- 使用systemd或supervisor管理进程
- 配置Nginx反向代理
- 本地处理:图片在浏览器中处理,不上传
- Python后端:图片仅发送到本地服务器
- 云端API:需要用户明确配置和同意
- 所有设置保存在浏览器本地存储
- 可随时清除或重置
- 不收集用户数据
- 在
server.py中添加新的识别函数 - 更新前端引擎选择界面
- 添加对应的配置选项
- 在
server.py的export函数中添加格式处理 - 更新前端导出下拉菜单
- 添加对应的MIME类型处理
- 修改
style.css文件 - 所有组件都有明确的CSS类名
- 支持响应式设计
本项目基于MIT许可证开源,可自由使用和修改。
欢迎提交Issue和Pull Request!
如有问题或建议,请:
- 查看本README文档
- 检查浏览器控制台错误
- 提交GitHub Issue
提示:首次使用Python后端时,OCR库可能需要下载模型文件,请确保网络连接正常。