# Curso de Visão Computacional

## Aula 1 - Entendendo o problema

### Preparando o ambiente

Para o curso de visão computacional, vamos utilizar a biblioteca OpenCV e a interface pytesseract, que interage com o Tesseract da Google. Para instalar o OpenCV, basta executar o comando abaixo:

```bash
pip install opencv-python
```
Para instalar o pytesseract, basta executar o comando abaixo:

```bash
pip install pytesseract
```


### Exemplo de uso

Vamos utilizar o pytesseract para extrair o texto de uma imagem. Para isso, vamos utilizar a imagem abaixo:

![Trecho do livro "The Witcher"](imagens/trecho_livro.png)

In [1]:
# Importando as bibliotecas necessárias
import os
import cv2
import pytesseract

# Carregando a imagem
image_file_path = os.getcwd() + '\\imagens\\trecho_livro.png'
image = cv2.imread(image_file_path)

# Exibindo a imagem
cv2.imshow('image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

Com o Tesseract é possível extrair o texto da imagem. Para isso, vamos utilizar o método `image_to_string` do pytesseract. O código abaixo extrai o texto da imagem e imprime na tela.

In [2]:
texto = pytesseract.image_to_string(image)
print(texto)

— Um mal é um mal, Stregobor — retrucou seriamente 0 bry.
xo, pondo-se de pé. — Menor, maior, médio, tanto faz... A
porgdes sao convencionadas e as fronteiras, imprecisas.
um santo eremita e nao pratiquei apenas 0 bem ao longo de mi-
nha vida. Mas, se me couber escolher entre dois males, prefiro

abster-me por completo da escolha. Esta na hora de ir embora.
Ver-nos-emos amanha.

 

S Dro-

40 SOU

 

 


Através do output acima podemos perceber que o Tesseract não extraiu de maneira tão eficiente o texto da imagem. Para melhorarmos a sua eficiência podemos passar alguns parâmetros para o método `image_to_string`:

1. `tessdata-dir`: Diretório onde estão os arquivos de treinamento do Tesseract.
2. `psm`: Modo de segmentação de página. O valor 6 é utilizado para segmentação de bloco de texto.

In [6]:
tesseract_config = "--tessdata-dir tessdata --psm 6"

texto = pytesseract.image_to_string(image, config=tesseract_config, lang="por")
print(texto)

— Um mal é um mal, Stregobor — retrucou seriamente o bry-
xo, pondo-se de pé. — Menor, maior, médio, tanto faz... As pro-
porções são convencionadas e as fronteiras, imprecisas. Não sou
um santo eremita e não pratiquei apenas o bem ao longo de mi-
nha vida. Mas, se me couber escolher entre dois males, prefiro
abster-me por completo da escolha. Está na hora de ir embora. |
Ver-nos-emos amanhã. |


### Trabalhando com placas de veículos

Vamos utilizar o pytesseract para extrair o texto de uma placa de veículo. Para isso, vamos utilizar a imagem abaixo:

![Placa de veículo](imagens/placa_carro1.png)