Ocr_with_paddle

Algorítimo desenvolvido em Python através da IDE JupyterNotebook que utiliza o reconhecimento óptico de caracteres (OCR) para extrair informações de documentos pessoais (RG e CNH) e fazer correções ortográficas nas informações extraídas.

Instalação

Antes de executar o programa, é necessário instalar as seguintes bibliotecas:

paddlepaddle==2.2.2 https://mirror.baidu.com/pypi/simple
paddleocr
symspellpy
pyspellchecker
opencv-python

Você pode instalá-las usando o gerenciador de pacotes pip:

!python -m pip install paddlepaddle==2.2.2 -i https://mirror.baidu.com/pypi/simple
!pip install paddleocr
!python -m pip install -U symspellpy
!pip install pyspellchecker
!pip install opencv-python

Como usar

# clonar repositório
git clone https://github.com/Cinthiacs/Ocr_with_paddle.git

Para usar o programa, execute o arquivo "Ocr_paddlepaddle.ipynb" em uma IDE Jupyter.
Ao executar, ele lerá uma lista de nomes e sobrenomes em formato de texto e os converterá em um arquivo CSV. Em seguida, o programa lê duas imagens: uma CNH e um RG.
O OCR Paddle é usado para extrair informações dessas imagens.
Extrai as informações de texto como CPF, nome, data de nascimento, data de emissão, naturalidade e filiação das imagens. Em seguida, é usada a biblioteca PySpellChecker em português "pt" para corrigir possíveis erros ortográficos nas informações extraídas.
O programa imprime as informações extraídas e as correções ortográficas na saída do console.

Contribuição

Sinta-se livre para contribuir para este projeto enviando pull requests.

Autora

Cinthia Cavalheiro.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
CNH_fake.jpg		CNH_fake.jpg
Ocr_paddlepaddle.ipynb		Ocr_paddlepaddle.ipynb
README.md		README.md
Rg_fake.png		Rg_fake.png
base_dados_br.csv		base_dados_br.csv
lista_nomes_sobrenomes.txt		lista_nomes_sobrenomes.txt
nomes.csv.gz		nomes.csv.gz

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CNH_fake.jpg

CNH_fake.jpg

Ocr_paddlepaddle.ipynb

Ocr_paddlepaddle.ipynb

README.md

README.md

Rg_fake.png

Rg_fake.png

base_dados_br.csv

base_dados_br.csv

lista_nomes_sobrenomes.txt

lista_nomes_sobrenomes.txt

nomes.csv.gz

nomes.csv.gz

Repository files navigation

Ocr_with_paddle

Instalação

Você pode instalá-las usando o gerenciador de pacotes pip:

Como usar

Contribuição

Autora

About

Releases

Packages

Languages

Cinthiacs/Ocr_with_paddle

Folders and files

Latest commit

History

Repository files navigation

Ocr_with_paddle

Instalação

Você pode instalá-las usando o gerenciador de pacotes pip:

Como usar

Contribuição

Autora

About

Resources

Stars

Watchers

Forks

Languages