Skip to content

wwzhg77777/convertPDF

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 

Repository files navigation

README.md



应用环境

Windows系统下 x64x86平台


目录结构

源代码目录结构:

convertPDF
 |——— api
      |——— index.php    # 后端php代码
 |
 |——— src
      |——— app.ini      # 存放Ocr接口的用户参数和后端的api接口地址
      |——— myConvert.py # PDF转图片,PDF转文字的模块
      |——— pdf_Ocr.py   # PDF转图片文字识别模块
      |——— tkPDF.py     # 主程序入口文件

执行文件的目录结构:

—— src  (x64 or x86)
 |——— app.ini   # 存放Ocr接口的用户参数和后端的api接口地址
 |——— tkPDF.exe # 主程序入口
 |

主程序生成步骤

 src目录下执行pyinstaller -F -w .\tkPDF.py生成主程序tkPDF.exe  复制src目录下的app.ini到主程序目录。app.ini内容需要自行补充完整。百度AI申请地址入口

app.ini

[SERVER]
url=....

[APP_INFO]
app_id=....
api_key=....
secret_key=....

开发环境

Python版本: 3.8.6  (Python3及以上版本均可)

Python第三方包: tkinter, pyinstaller, baidu-aip, pdfminer, pdfminer3k, fitz, requests

MySQL数据表结构

 后端2张表: index记录了百度AI用户的Ocr接口免费次数 record记录用户的上传文件

pdfrecord数据库结构如下:

pdfrecord.index

列名 数据类型 长度 主键 外键 允许空 默认值 说明
id int 4 唯一标识
app_id varchar 30 Ocr的APP_ID
type varchar 30 Ocr的类型
count int 8 Ocr的次数
unix_time int 11 10位UNIX时间戳

pdfrecord.record

列名 数据类型 长度 主键 外键 允许空 默认值 说明
id int 4 唯一标识
filename varchar 50 文件名称
filesize varchar 20 文件大小(Mb)
app_id varchar 30 Ocr的APP_ID
type varchar 30 Ocr的类型
unix_time int 11 10位UNIX时间戳

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published