Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

电子发票提取助手 #4605

Open
zippo-zu opened this issue Jun 10, 2024 · 3 comments
Open

电子发票提取助手 #4605

zippo-zu opened this issue Jun 10, 2024 · 3 comments
Labels

Comments

@zippo-zu
Copy link

zippo-zu commented Jun 10, 2024

由于工作的需求,企业报账报税,客户开过来的发票格式各异,然后报账的时候,又需要讲发票整理到一个excel中,于是常规的思路就是人工一张一张的手动录入,录入的工作又费时间,又没有什么技术含量。而且手动录入还经常会录入错误,基于以上的痛点,又随着电子发票时代的到来,电子发票已经成为主流趋势,以后纸质发票将会逐渐退出历史舞台。于是我分析电子发票的数据格式、存储格式,发票电子发票未来的交付形式将以pdf格式为主。
于是我就开发了一个基于pdf格式的电子发票的批量提取到excel的小工具,用户只需要将自己需要提取的电子发票打包成压缩包,一键提交给发票提取助手,发票提取助手就会返回一个excel表格,表格中包含了电子发票中的关键信息,发票号码、项目类目、税额、税率、价税合计等相关信息。这一工具大大提供了工作效率,以前需要几个小时的手动录入发票的工作,现在只需要几分钟就可以完成。是一个不错的提效小工具,欢迎大家试用。 https://airegex.cn/
目前训练的发票样本有限,有些特殊格式的发票可能提取失败,提取失败的可以联系开发者,完善电子发票样本数据。在线发票提取工具,并没有做任何的存储发票的行为。所以你不用担心发票信息泄露,未来也不会去存储。都是基于二进制流实时处理,实时返回。所以一次不能支持大批量的发票提取,但是也足够用了。
在隐私数据和实用性上,只能这样做一个权衡了。

@M69W
Copy link

M69W commented Jun 11, 2024

支持离线使用不?就是打开后对应的页面后断网使用

@ruanyf ruanyf added the weekly label Jun 11, 2024
@zippo-zu
Copy link
Author

支持离线使用不?就是打开后对应的页面后断网使用

不支持,但是网站本身没有做任何的存储逻辑,都是基于流的转换。担心隐私数据的问题的话,网站本身你不用担心。但是网络劫持这些的话,我觉得还好。

@1night2zero
Copy link

有开源仓库吗

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

4 participants