<h1>PROCESSAMENTO DIGITAL DE IMAGENS - PDI</h1>
<h3>INTRODUÇÃO</h3>
<h5>Imagem:</h5>
<p>Uma imagem é aquilo que vemos que representa algo(pode ser um desenho, registro foto-mecânico ou até mesmo pensamento). A imagem é uma função f(x, y) e antes da captura é considerada contínua em espaço e amplitude.</p>
<p>A imagem digital é uma matriz bidimensional, onde cada elemento ("quadradinho") representa um pixel. O pixel assume um valor, que basicamente, representa o quanto de luminosidade aquele ponto está recebendo.</p>
<p>Formatos comuns de imagem:
<ul>
    <li>1 valor por pixel ( 1 matriz - Imagem em escala de cinza)</li>
    <li>3 valores por pixel (possui 3 matrizes onde cada uma representa uma cor - vermelho, verde e azul - RGB)</li>
    <li>4 valor por pixel (RGB + Alpha/ Opacidade)</li>
</ul>
</p>
<h5>Processamento Digital de Imagens:</h5>
<p>O Processamento Digital de Imagens consiste em melhorar alguma imagem, mas melhorada de acordo com o que se quer analisar. Em cada caso utilizamos técnicas específicas. O que pode ser bom para um, pode ser ruim para outro.</p>
<ul>
    <p>Classificação:</p>
    <li>Entrada e saída imagens - Processamento Digital de Imagens</li>
    <li>Entrada imagem e saída 'modelo/ atributos' - Visão Computacional</li>
    <li>Entrada 'modelo/ atributos' e saída imagem - Computação Gráfica</li>
    <li>Entrada 'modelo/ atributos' e saída 'modelo/ atributos' - Geometria Computacional</li>
</ul>
<h5>Como as imagens são formadas:</h5>
<p>As imagens podem ser formadas de diversas maneiras.<br>
A mais comum é a partir de ondas do Espectro Eletromagnético.
São ondas sinusoidais que variam no comprimento.<br>
Existem as seguintes bandas: Gamma; Raio-X; Ultravioleta; Visível; Infravermelho; Microondas; Rádio. <br>
A parte que nós seres humanos enxergamos é muito pequena. Além disso, algumas bandas são prejudiciais aos seres humanos.
<ul>
    Algumas outras formas de gerar imagens são:
    <li>Energia Acústica (ultrassom)</li>
    <li>Imagens sintéticas geradas pelo computador</li>
</ul></p>
<h5>Aquisição de Imagens:</h5>
<p>Para a imagem ser gerada, precisa de dispositivos sensíveis à energia que está gerando e sensores (podem ser individuais, em linha(utilizada em scanners) ou em área/ matriz (mais utilizada em câmeras)).</p>

<ol>
Os passos para a aquisição da imagem são:
    <li>O objeto é iluminado</li>
    <li>Os feixes de luz batem no objeto</li>
    <li>Alguns eixos de luz são refletidos e passam pelos sensores</li>
    <li>Ocorre a digitalização da imagem</li>
</ol>
<h5>Amostragem e Quantização</h5>
<p>Amostragem é a digitalização do espaço/ coordenas.</p>
<p>Quantização é a digitalização da amplitude/ intensidades.</p>
<p>Em geral uma imagem em escala de cinza possui 256 níveis de intensidade, variam de 0 (preto) até 255(branco) e possuem 8 bits de intensidade, pois 2^8 = 256.</p>
<p>Quanto mais amostras, ou seja, mais pixels, melhor a qualidade da imagem.</p>
<p>Quanto mais níveis de intensidade, também, melhor a qualidade da imagem. Mas em geral 8 bits de intensidade já são mais que suficiente para nós humanos.</p>
<p>As imagens possuem Mlinhas e Ncolunas. Para calcular quantos bits são necessários para armazenar a imagem: Mlinhas x Ncolunas x nº de bits de intensidade.</p>
<h5>Relacionamento de pixels</h5>
<p>Os pixels se relacionam entre si. Possuem <b>Vizinhança</b>.</p>
<ul>
    Existe alguns tipos de vizinhança, dado um pixel p(x, y):
    <li>N4(p) = f(x, y-1); f(x, y+1), f(x-1, y), f(x+1, y)</li>
    <li>Nd(p) = f(x-1, y-1); f(x-1, y+1); f(x+1, y-1); f(x+1, y+1)</li>
    <li>N8(p) = f(x, y-1); f(x, y+1), f(x-1, y), f(x+1, y); f(x-1, y-1); f(x-1, y+1); f(x+1, y-1); f(x+1, y+1)</li>
</ul>
<h5>Etapas presentes no PDI e Visão Computacional:</h5>
<ol>
    <li><b>Aquisição da Imagem</b> - etapa de capturas de imagens.</li>
    <li><b>Melhoramento</b> - Processos como redução de ruído, ajuste de brilho e contraste para aprimorar a qualidade visual da imagem.</li>
    <li><b>Filtragem</b> - Aplicação de filtros para realçar detalhes específicos, como bordas e texturas, ou para suavizar a imagem.</li>
    <li><b>Compressão</b> - modificar o tamanho da imagem, pode ser útil para armazenar ou encaminhar a imagem.</li>
    <li><b>Segmentação</b> - segmentar/ dividir a imagem em partes.</li>
    <li><b>Representação e Descrição</b> - Transformação da imagem segmentada em uma forma que possa ser analisada quantitativamente.</li>
    <li><b>Reconhecimento</b> - Utilização de algoritmos, frequentemente baseados em Inteligência Artificial, para identificar e classificar objetos ou padrões na imagem.</li>
</ol>

OBS.: Utilizarei a linguagealgumas bibliotecas externas, principalmente OpenCV e NumPy, mas caso utilize outras aviso no decorrer do material.o material.
As imagens que utilizarei estão na página do GitHub do OpenCV: https://github.com/opencv/opencv

In [6]:
#instalar a biblioteca opencv
!pip install opencv-python



In [2]:
#importar algumas bibliotecas necessárias
import cv2 as cv 
import os

<h3>LER IMAGEM</h3>

In [3]:
#o caminho de onde estão as imagens na minha máquina
os.chdir("C:/Users/edub_/OneDrive/Área de Trabalho/PDI - IC/conteudo_p_teste")

#arquivo que usarei agora
nome_img = "lena.jpg"

#ler a imagem em escala de cinza
#cv.imread("nome_arquivo", flag)  -> a flag pode ser: 1(colorida); 0(escala de cinza); -1(sem mudar, pega inclusive opacidade)
img = cv.imread(nome_img, 0)

In [4]:
#mostrando como uma imagem fica armazenda/ é lida (forma de matriz):
print(img)

[[163 162 161 ... 170 154 130]
 [162 162 162 ... 173 155 126]
 [162 162 163 ... 170 155 128]
 ...
 [ 43  42  51 ... 103 101  99]
 [ 41  42  55 ... 103 105 106]
 [ 42  44  57 ... 102 106 109]]


<h3>MOSTRAR E SALVAR IMAGEM</h3>

In [5]:
#MOSTRAR
#cv.imshow("nomeTela", arquivo_mostrar)
cv.imshow("imagem_lena", img)
#utilizamos cv.waitKey(tempo) para determinarmos quanto tempo queremos que a imagem apareça, mas se colocarmos 0 a imagem é exibida até o usuário fechar
k = cv.waitKey(0)

#SALVAR
#cv.imwrite("nomeParaSalvar.extensao", arquivo)
#podemos utilizar ord(caracter") -> para salvar apenas quando o usuario apertar determinada tecla
if k == ord('s'):
    cv.imwrite("img_lena_copia.jpg", img)

#para garatir que todas as páginas foram fechadas
cv.destroyAllWindows()