Skip to content

处理从中英文文献中复制文本时全角半角混乱、多余换行、多余空格问题

Notifications You must be signed in to change notification settings

Mo-Dabao/ChinglishCopier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

文献复制工具

用tkinter搭建的一个用于复制中英文文献文本内容的小程序。

用Pyinstaller打包的可执行程序(百度网盘链接)。


目的

为了解决从pdf等格式的中文文献中复制粘贴常会出现的一些问题:

  • 数字、字母等非中文字符变成全角字符
  • 产生多余的空格、换行
  • 中、英文标点(全、半角)混乱
  • 英文上下文中的标点后缺空格

直接复制.gif

实现

  • 删除多余的空白符(换行、空格、制表等)
  • 英文、数字、部分标点符号的全角字符换成半角字符
  • 修正误判为中文标点(,;:!?)的英文标点字符
  • 英文标点后确保一个空格

使用工具.gif

程序结构

程序主要结构有两个模块:
├── organize.py
└── gui_tkinter.py

organize.py负责逻辑操作:遍历复制的字符串按照条件整理。
gui_tkinter.py负责GUI的搭建。

这个程序从2018年开始断断续续当Python练手的项目在做,基本实现了既定目标——但是我已经不需要写课程报告了,只能在摘录文献记笔记的时候用一用了。千万不要用于论文中,复制一时爽,一直复制一直爽!

时间 备注
2018-10-04 创建
2018-10-26 优化空格、换行的删除逻辑;优化代码风格
2019-02-22 重构,优化中英文标点和空格的判断逻辑,
界面和逻辑分离;新增菜单栏,去掉广告窗口

喜欢的话请关注吧,天晓得还会更新什么好玩儿的东西:

碎积云.png

About

处理从中英文文献中复制文本时全角半角混乱、多余换行、多余空格问题

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages