# Descrição dos dados
**Tipos de Dados**

As imagens estão no formato png, geojson e tif

**Dimensões das Imagens**

As imagens originais têm dimensões de 1200x1200 pixels.
Após o pré-processamento, as imagens serão redimensionadas para 120x120 pixels.

**Número de Imagens**

Atualmente, existem 15 imagens disponíveis.
Planeja-se adicionar mais 10 imagens rotuladas.

In [None]:
import cv2
import matplotlib.pyplot as plt

image_paths = [
    '../docs/Images/614_2020-5-27_S2L1C_22JCP_TCI.png',
    '../docs/Images/614_2020-5-27_S2L1C_22JCP.png',
    '../docs//Images/614.png'
]

image_titles = [
    'Imagem original',
    'Imagem com máscara aplicada',
    'Imagem mostrando somente a aplicação da máscacra'
]

fig, axs = plt.subplots(1, 3, figsize=(15, 5))

for ax, img_path, title in zip(axs, image_paths, image_titles):
    img = cv2.imread(img_path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    ax.imshow(img)
    ax.set_title(title)
    ax.axis('off')

plt.tight_layout()
plt.show()


# Possíveis Vieses
O conjunto de dados disponível para treinamento não é representativo das características específicas dos talhões na região Sul do Brasil. Algumas limitações importantes incluem:

**Regiões Planas contra montanhosas**

A maioria das regiões com talhões de agricultura encontrados no Brasil e no dataset disponibilizado são planas, enquanto na região Sul, há muitas áreas montanhosas, e o dataset não é capaz de representar bem este outlier.

**Limites dos Talhões**

O conjunto de dados é composto por imagens do Brasil todo, onde os talhões são majoritariamente demarcados de forma padronizada, normalmente em forma de quadrado ou retângulo, o que não reflete a realidade encontrada nas regiões do Sul do Brasil.

# Mitigação de Vieses
Para mitigar os impactos que os viéses acima podem causar, serão aplicadas as seguintes medidas:

**Rotulagem de Imagens do Sul do Brasil**

Como medida inicial, para equilibrar a quantidade de diferentes tipos de dados, os esforços da equipe serão dedicados principalmente a rotular imagens da região Sul do Brasil, onde há maior dificuldade na identificação de talhões. Esses dados rotulados serão essenciais para treinar o modelo com exemplos mais representativos.

**Aplicação de Filtros**

Para mitigar os desafios associados à detecção de talhões em regiões montanhosas, serão aplicados filtros e pré-processamentos nas imagens, como por exemplo, filtros com variações na iluminação e equalizações de histogramas.

**Reforço da Importância dos Limites Demarcados**

Para destacar a importância dos limites demarcados dos talhões nas imagens, aplicaremos filtros e técnicas de realce de bordas. Isso ajudará o modelo a focalizar e dar mais peso aos limites dos talhões durante o processo de detecção e segmentação, permitindo uma identificação mais precisa e robusta, e possibilitando uma identificação mais fácil para talhões não padronizados, como os da região Sul do Brasil.

**Data Augmentation**

Por fim, para aumentar a variedade e quantidade de dados, aplicaremos técnicas de data augmentation. Isso incluirá rotações, ampliações, espelhamentos e outras transformações nas imagens existentes para gerar novas instâncias de dados de treinamento. Essas técnicas ajudarão a ampliar o conjunto de dados e a capturar uma gama mais ampla de variações nos talhões.

# Análise da imagem:

**Histograma de Cores**
Um histograma de cores é uma representação visual da distribuição das cores em uma imagem. Basicamente, ele mostra quantas vezes cada cor aparece na imagem. Isso é útil para entender a composição cromática de uma imagem e pode ser usado em uma variedade de aplicações, como reconhecimento de objetos, classificação de imagens e segmentação de imagens.

**Histograma de Gradientes Orientados**
O histograma de gradientes orientados é uma técnica popular em visão computacional para detectar objetos em uma imagem. Ele funciona calculando a magnitude e a direção dos gradientes de intensidade em pequenas regiões da imagem e construindo um histograma dessas direções.

**Filtro para Detecção de Bordas**
Um filtro para detecção de bordas é uma técnica de processamento de imagem que destaca as bordas ou transições de intensidade em uma imagem. Existem vários tipos de filtros para detecção de bordas, como o filtro de Sobel, o filtro de Prewitt e o filtro de Canny. Esses filtros são aplicados convolvendo a imagem original com um kernel específico que realça as mudanças abruptas de intensidade, indicativas de bordas.


In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

def plot_color_histogram(image, ax):
    color = ('b','g','r')
    for i,col in enumerate(color):
        hist = cv2.calcHist([image],[i],None,[256],[0,256])
        ax.plot(hist,color = col)
        ax.set_xlim([0,256])
    ax.set_title('Histograma de cores')
    ax.set_xlabel('Bins')
    ax.set_ylabel('Quantidade de Pixels')

def plot_hog(image, ax):
    hog = cv2.HOGDescriptor()
    h = hog.compute(image)
    ax.hist(h, bins=9)
    ax.set_title('Histograma de gradientes orientados')
    ax.set_xlabel('Bins')
    ax.set_ylabel('Quantidade de Gradientes')

def plot_edges(image, ax):
    edges = cv2.Canny(image,100,200)
    ax.imshow(edges,cmap = 'gray')
    ax.set_title('Filtro de Canny')

def apply_filters(image_path):
    image = cv2.imread(image_path)
    gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    fig, axs = plt.subplots(1, 3, figsize=(15, 5))

    plot_color_histogram(image, axs[0])
    plot_hog(image, axs[1])
    plot_edges(gray_image, axs[2])

    plt.tight_layout()
    plt.show()

image_path = 'PATH'
apply_filters(image_path)
