# Sprint 1

## 1. Descrição da fonte de dados com justificativa para escolha da base de dados

## Descrição da Plataforma Sentinel Hub

O **Sentinel Hub** é uma plataforma baseada em nuvem projetada para facilitar o acesso, o processamento e a análise de grandes quantidades de dados de observação da Terra. Ela suporta imagens de uma variedade de satélites, incluindo os satélites Sentinel, parte do programa Copernicus da União Europeia. Estes satélites fornecem dados atualizados regularmente, cobrindo uma ampla gama de bandas espectrais, essenciais para aplicações que vão desde monitoramento agrícola até gestão de desastres naturais.

### Principais Recursos e Funcionalidades

- **Acesso Facilitado aos Dados**: O Sentinel Hub oferece acesso simplificado a um vasto acervo de dados de satélite, permitindo análises em tempo real e históricas.
- **Processamento na Nuvem**: A capacidade de processar dados diretamente na nuvem elimina a necessidade de infraestrutura local pesada, tornando a plataforma acessível para organizações de todos os portes.
- **APIs Flexíveis**: Com APIs robustas, o Sentinel Hub permite a automatização do acesso e processamento de dados, facilitando a integração com pipelines de dados e aplicativos existentes.
- **Customização de Processamento de Imagens**: Usuários podem personalizar scripts de processamento para extrair informações específicas das imagens, adequadas a necessidades particulares de cada projeto.
- **Atualizações Frequentes e Histórico de Dados**: O serviço mantém um histórico extenso e realiza atualizações frequentes, crucial para estudos de longo prazo e monitoramento contínuo.

### Vantagens do Uso do Sentinel Hub como Base de Dados

- **Escalabilidade**: A arquitetura baseada em nuvem do Sentinel Hub suporta o processamento de grandes volumes de dados de maneira eficiente.
- **Flexibilidade e Integração**: As APIs facilitam a integração com outros sistemas e ferramentas, suportando uma arquitetura de sistema diversificada.
- **Custo-Efetividade**: Reduzindo a necessidade de infraestrutura de hardware e manutenção, o Sentinel Hub oferece uma solução econômica para processamento e análise de dados.
- **Acesso Democrático a Dados de Alta Qualidade**: A combinação de acesso aberto aos dados do Copernicus e as ferramentas avançadas do Sentinel Hub democratiza o acesso a informações de alta qualidade para uma vasta gama de usuários.

Portanto, concluímos que o Sentinel Hub se destaca como uma ótima escolha para a segmentação de talhões por meio de visão computacional, pois nos permite um acesso rápido, processamento eficiente e análises profundas de dados de observação da Terra, através de uma plataforma robusta e versátil.


### Descrição da escolha de imagens na base de dados do Sentinel

![Relevo da Região Sul](./assets/img/sentinel-image1-regiao-sul.jpg)


A primeira imagem exibida retrata uma porção de terra na região do Rio Grande do Sul, evidenciando uma distribuição considerável de talhões agrícolas. Observa-se que a maioria dos talhões exibe uma forma retangular, essa é uma característica comum em práticas de agricultura de larga escala. Entretanto, é visto que esses talhões possuem dimensões reduzidas (são diversos talhões em uma única imagem), o que pode acarretar dificuldades na identificação individual de cada unidade de cultivo. Essa alta densidade e extensão dos talhões contribuem para a complexidade do processo de identificação.

A abordagem proposta visa utilizar esta imagem como uma das muitas para treinar a rede neural a reconhecer os talhões agrícolas. A inclusão de uma quantidade significativa de talhões na imagem é estratégica, pois proporciona à rede neural uma exposição mais abrangente a diferentes configurações e padrões de talhões. A preferência por uma maior quantidade de talhões na imagem decorre da necessidade de garantir que a rede neural seja capaz de identificar os talhões de forma precisa e individualizada, minimizando tanto os falsos positivos quanto os falsos negativos.

Os falsos positivos ocorrem quando a rede neural identifica erroneamente um objeto como sendo um talhão, enquanto os falsos negativos ocorrem quando a rede deixa de identificar um talhão existente na imagem. Ao expor a rede neural a uma variedade de cenários com um grande número de talhões, busca-se mitigar a incidência desses erros (principalmente os falsos negativos), possibilitando um treinamento mais eficiente e preciso da rede para a tarefa de identificação de talhões agrícolas. A consideração desses conceitos de falsos positivos e falsos negativos é essencial para garantir a robustez e a confiabilidade do modelo de identificação de talhões agrícolas.

![Relevo da Região Sul](./assets/img/sentinel-image2-regiao-sul.jpg)

A segunda imagem exibida retrata uma porção de terra na região do Rio Grande do Sul, evidenciando uma distribuição reduzida de talhões agrícolas em comparação com a imagem anterior. No entanto, observa-se uma maior diversidade de tamanhos e formatos de talhões presentes nesta imagem. Ao contrário da imagem anterior, onde a maioria dos talhões apresentava uma forma retangular e dimensões relativamente uniformes, nesta imagem os talhões exibem uma variedade de formas e tamanhos, incluindo formas irregulares e tamanhos variados.

A abordagem proposta visa utilizar esta imagem para expandir o conjunto de dados de treinamento do modelo, permitindo que ele seja exposto a uma maior diversidade de padrões de talhões. A inclusão de talhões com diferentes tamanhos e formatos é estratégica, pois capacita o modelo a reconhecer e identificar talhões que possuam características distintas dos padrões convencionais. Isso é fundamental para garantir que o modelo seja capaz de lidar eficientemente com a variedade de talhões encontrados na prática agrícola, incluindo talhões com formatos irregulares e tamanhos não padronizados.


A ideia da base de dados é visa criar um conjunto diversificado de imagens representativas dos cenários agrícolas no Rio Grande do Sul. Isso inclui diferentes tipos de culturas, condições de solo e práticas de cultivo. A seleção estratégica das imagens considera a variedade de padrões de talhões, abrangendo tamanhos, formas e arranjos diversos. Durante o treinamento, o modelo aprende com exemplos anteriores, identificando padrões visuais para associar com a presença de talhões, garantindo sua capacidade de identificar talhões com precisão em novas imagens. Esse processo permite o desenvolvimento de um modelo robusto e preciso de identificação de talhões agrícolas na região sul.



## 2. Pipeline de processamento e preparação de dados de imagens para treinamento

In [None]:
!pip install seaborn

In [None]:
!pip install opencv-python

### 2.1 Descompactando pastas zipadas

In [None]:
import os

# Lista os arquivos e diretórios na pasta atual
conteudos = os.listdir('.')

# Imprime os conteúdos
for item in conteudos:
    print(item)


In [None]:
import os
import zipfile

# Caminho para a pasta onde estão os arquivos zip
path = 'data/'

# Lista todos os arquivos na pasta especificada
files = os.listdir(path)

# Filtra e descompacta apenas os arquivos zip
for file in files:
    if file.endswith('.zip'):
        zip_path = os.path.join(path, file)
        with zipfile.ZipFile(zip_path, 'r') as zip_ref:
            zip_ref.extractall(path)
        print(f'Descompactado: {file}')

# Remove os arquivos zip após descompactá-los
for file in files:
    if file.endswith('.zip'):
        os.remove(os.path.join(path, file))
        print(f'Removido: {file}')


### 2.2 Pipeline de dados

In [None]:
# Importing useful libraries

import cv2
import numpy as np
import os
from osgeo import gdal
from sklearn.preprocessing import MinMaxScaler
from sklearn.cluster import KMeans
from sklearn.ensemble import RandomForestClassifier
import matplotlib.pyplot as plt
from scipy.ndimage import generic_filter
from scipy import ndimage
from scipy.stats import mode
import matplotlib.pyplot as plt
from sklearn.preprocessing import RobustScaler

### Função para Carregar e Redimensionar Bandas Espectrais

A função load_and_resize_images carrega e redimensiona imagens .tif em um diretório especificado, ajustando-as para um tamanho padrão (1200, 1200) para garantir consistência na análise de imagens de satélite.

In [None]:

# Helper function to load and resize spectral bands
def load_and_resize_images(folder_path, target_size=(1200, 1200)):
    images = {}
    for filename in os.listdir(folder_path):
        if filename.endswith(".tif"):
            band = filename.split('.')[0]
            img_path = os.path.join(folder_path, filename)
            img = gdal.Open(img_path)
            array = img.ReadAsArray()
            resized = cv2.resize(array, target_size, interpolation=cv2.INTER_LINEAR)
            images[band] = resized
    return images



### Função para Correção Atmosférica

A função `atmospheric_correction` aplica uma correção radiométrica simples a arrays de bandas de imagens, dividindo cada banda pelo seu valor máximo para minimizar efeitos atmosféricos e melhorar a análise de dados de satélite.

In [None]:
# Atmospheric correction to remove atmospheric effects
def atmospheric_correction(band_array):
    # Simple example of a radiometric correction
    corrected_band = band_array / (band_array.max() + 1e-10)
    return corrected_band



### Função para Calcular Índices de Vegetação

A função `calculate_vegetation_indices` calcula índices de vegetação, incluindo NDVI, EVI e GNDVI, utilizando bandas espectrais específicas de imagens de satélite. A função garante a presença de todas as bandas necessárias e aplica correções baseadas em valores específicos para melhorar a identificação e análise da vegetação.

In [None]:
def calculate_vegetation_indices(images):
    required_bands = ['b8', 'b4', 'b2', 'b3']
    if all(band in images for band in required_bands):
        nir = images['b8'].astype(float)
        red = images['b4'].astype(float)
        green = images['b3'].astype(float)
        blue = images['b2'].astype(float)

        # Calculating NDVI
        ndvi = (nir - red) / (nir + red + 1e-10)


        # Calculating GNDVI and applying thresholds
        gndvi = (nir - green) / (nir + green + 1e-10)


        return {'NDVI': ndvi, 'GNDVI': gndvi}
    else:
        missing = [band for band in required_bands if band not in images]
        print(f"Missing required bands: {missing}")
        return None


### Função para Processar Imagens de Satélite

A função `process_images` automatiza o processamento das imagens de satélite.

1. **Carregamento e Redimensionamento de Imagens**: As imagens são carregadas e redimensionadas para um tamanho padrão a partir dos diretórios especificados.
2. **Correção Atmosférica**: Aplica uma correção atmosférica básica em cada banda espectral das imagens.
3. **Cálculo de Índices de Vegetação**: Calcula índices como NDVI a partir das bandas corrigidas.
7. **Visualização**:
   - Exibe as imagens RGB filtradas e suas bordas para avaliação visual.


In [None]:


def process_images():
    data_dir = "./data/dataset_inteli/images"  # Base directory for spectral images
    rgb_dir = "./data/dataset_inteli/tci_pngs"  # Directory containing RGB images

    for folder_name in sorted(os.listdir(data_dir)):
        folder_path = os.path.join(data_dir, folder_name)
        if os.path.isdir(folder_path) and folder_name != '.ipynb_checkpoints':
            print(f"Processing folder: {folder_path}")
            images = load_and_resize_images(folder_path)

            if not all(band in images for band in ['b4', 'b8', 'b2', 'b3']):
                print(f"Missing required bands in {folder_name}, skipping this folder.")
                continue

            # Process vegetation indices and segmentation
            corrected_images = {band: atmospheric_correction(images[band]) for band in images}
            indices = calculate_vegetation_indices(corrected_images)
            normalized = cv2.normalize(indices, None, alpha=0, beta=1, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_32F)


            # Visualization
            plt.figure(figsize=(10, 5))
            plt.subplot(1, 2, 1)
            plt.imshow(cv2.cvtColor(normalized, cv2.COLOR_BGR2RGB))
            plt.title('Filtered RGB Image')
            plt.subplot(1, 2, 2)
            plt.imshow(edges, cmap='gray')
            plt.title('Edges of Filtered Image')
            plt.show()

process_images()


## 3. Base de dados de imagens processadas com uma análise exploratória sobre a base obtida

In [None]:
pip install -U scikit-learn

In [None]:

from IPython.display import display, Image
import random
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import os
import cv2
import numpy as np

In [None]:

def display_images(directory):

    """
    Exibe três imagens aleatórias de um diretório.

    Args:
    - directory: String. Caminho do diretório onde as imagens estão armazenadas.
    """

    images = [img for img in os.listdir(directory) if img.endswith('.png')]
    selected_images = random.sample(images, min(len(images), 3))  # Escolhe 3 imagens aleatórias

    for img_name in selected_images:
        img_path = os.path.join(directory, img_name)
        print(f"Displaying Image: {img_name}")
        display(Image(filename=img_path))

display_images('./data/dataset_inteli/tci_pngs')

In [None]:
def plot_brightness_distribution(directory):

    """
    Plota a distribuição do brilho das imagens.

    Args:
    - directory: String. Caminho do diretório onde as imagens estão armazenadas.
    """

    brightness_values = []

    for img_file in os.listdir(directory):
        if img_file.endswith('.png'):
            img_path = os.path.join(directory, img_file)
            img = cv2.imread(img_path)
            hsv_img = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
            brightness = hsv_img[:, :, 2].flatten()
            brightness_values.extend(brightness)

    plt.figure(figsize=(10, 5))
    plt.hist(brightness_values, bins=256, color='gold', alpha=0.7)
    plt.title('Distribuição de Brilho')
    plt.xlabel('Brilho')
    plt.ylabel('Frequência')
    plt.show()

plot_brightness_distribution('./data/dataset_inteli/tci_pngs')

In [None]:
def plot_color_histograms(directory):

    """
    Calcula e plota os histogramas de cores para os canais RGB.

    Args:
    - directory: Caminho do diretório onde as imagens estão armazenadas.
    """

    color_data = {'Red': [], 'Green': [], 'Blue': []}

    for img_name in os.listdir(directory):
        if img_name.endswith('.png'):
            img_path = os.path.join(directory, img_name)
            img = cv2.imread(img_path)
            if img is not None:
                for i, color in enumerate(['Blue', 'Green', 'Red']):
                    hist = cv2.calcHist([img], [i], None, [256], [0, 256])
                    color_data[color].extend(hist.flatten())

    # Plota os histogramas de cor
    plt.figure(figsize=(15, 5))
    for i, color in enumerate(['Blue', 'Green', 'Red']):
        plt.subplot(1, 3, i + 1)
        plt.plot(color_data[color], color=color.lower())
        plt.title(f'{color} Channel Histogram')
        plt.xlabel('Intensidade de Cor')
        plt.ylabel('Frequência')
        plt.xlim([0, 256])
    plt.show()

plot_color_histograms('./data/dataset_inteli/tci_pngs')

In [None]:
def plot_pixel_intensity_distribution(directory):

    """
    Gera um histograma da distribuição de intensidade de pixel das imagens.

    Args:
    - directory: Caminho do diretório onde as imagens estão armazenadas.
    """

    intensidades = []
    # Itera sobre cada arquivo no diretório especificado
    for img_name in os.listdir(directory):
        if img_name.endswith('.png'):
            img_path = os.path.join(directory, img_name)
            # Carrega a imagem em escala de cinza
            img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
            if img is not None:
                # Extrai e armazena todos os valores de pixel da imagem
                intensidades.extend(img.ravel())

    # Cria um histograma com a distribuição dos valores de pixel
    plt.figure(figsize=(8, 6))
    plt.hist(intensidades, bins=256, color='gray', alpha=0.7)
    plt.title('Distribuição de Intensidade de Pixel')
    plt.xlabel('Intensidade')
    plt.ylabel('Frequência')
    plt.show()

plot_pixel_intensity_distribution('./data/dataset_inteli/tci_pngs')

In [None]:
def plot_color_channel_correlation(directory):

    """
    Gera um mapa de calor da correlação entre os canais de cores das imagens.

    Args:
    - directory: Caminho do diretório onde as imagens estão armazenadas.
    """

    data = []
    # Itera sobre cada arquivo no diretório
    for img_name in os.listdir(directory):
        if img_name.endswith('.png'):
            img_path = os.path.join(directory, img_name)
            # Carrega a imagem em colorido
            img = cv2.imread(img_path)
            if img is not None:
                # Calcula e armazena as médias dos valores dos canais RGB
                mean_colors = cv2.mean(img)[:3]  # Ignora o canal alpha se houver
                data.append(mean_colors)

    # Cria um DataFrame com os dados coletados
    df = pd.DataFrame(data, columns=['Blue', 'Green', 'Red'])
    # Calcula a matriz de correlação
    correlation_matrix = df.corr()

    # Visualiza a matriz de correlação com um mapa de calor
    sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
    plt.title('Correlação entre Canais de Cores')
    plt.show()

plot_color_channel_correlation('./data/dataset_inteli/tci_pngs')

In [None]:
def plot_saturation_distribution(directory):

    """
    Plota a distribuição da saturação das imagens.

    Args:
    - directory: String. Caminho do diretório onde as imagens estão armazenadas.
    """

    saturation_values = []

    for img_file in os.listdir(directory):
        if img_file.endswith('.png'):
            img_path = os.path.join(directory, img_file)
            img = cv2.imread(img_path)
            hsv_img = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
            saturation = hsv_img[:, :, 1].flatten()
            saturation_values.extend(saturation)

    plt.figure(figsize=(10, 5))
    plt.hist(saturation_values, bins=256, color='green', alpha=0.7)
    plt.title('Distribuição de Saturação')
    plt.xlabel('Saturação')
    plt.ylabel('Frequência')
    plt.show()

plot_saturation_distribution('./data/dataset_inteli/tci_pngs')

In [None]:
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

def plot_color_variety_with_pca(directory):

    """
    Aplica PCA para visualizar a variedade de cores em um conjunto de imagens.

    Args:
    - directory: String. Caminho do diretório onde as imagens estão armazenadas.
    """

    color_data = []

    for img_file in os.listdir(directory):
        if img_file.endswith('.png'):
            img_path = os.path.join(directory, img_file)
            img = cv2.imread(img_path)
            img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
            color_data.append(img.reshape(-1, 3))

    color_data = np.vstack(color_data)
    scaler = StandardScaler()
    color_data_normalized = scaler.fit_transform(color_data)

    pca = PCA(n_components=2)
    principal_components = pca.fit_transform(color_data_normalized)

    plt.figure(figsize=(10, 6))
    plt.scatter(principal_components[:, 0], principal_components[:, 1], alpha=0.2)
    plt.title('Visualização da Variedade de Cores com PCA')
    plt.xlabel('Primeiro Componente Principal')
    plt.ylabel('Segundo Componente Principal')
    plt.show()

plot_color_variety_with_pca('./data/dataset_inteli/tci_pngs')

# Sprint 2


## Conectando ao Google Drive

In [None]:
# Mounting GDrive.
from google.colab import drive
drive.mount('/content/drive')

## Import das Bibliotecas

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.optimizers import RMSprop
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import load_img, img_to_array
import os
import time
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

## Preparação dos Dados de Treino

Separação dos dados para treino do modelo. A ideia foi separar em diretórios distintos, cada variável vai armazenar o diretório com um tipo específico de imagem.

In [None]:
# Importando as imagens pelo diretório de categoria de subpasta

# Dados de treino do modelo

addressDSmain = '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli'
addressMasks = '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/masks'
addressPngs = '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/tci_pngs'
addressTifs = '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/tci_tifs'
addressMarkedRgbs = '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/marked_rgbs'
addressRgbs = '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/rgbs'

treinamento_dir = os.path.join(addressDSmain)
treinamento_masks = os.path.join(addressMasks)
treinamento_pngs = os.path.join(addressPngs)
treinamento_tifs = os.path.join(addressTifs)
treinamento_marked_rgbs = os.path.join(addressMarkedRgbs)
treinamento_rgbs = os.path.join(addressRgbs)

In [None]:
treinamento_dir_nomes = sorted(os.listdir(treinamento_dir))
treinamento_masks_nomes = sorted(os.listdir(treinamento_masks))
treinamento_pngs_nomes = sorted(os.listdir(treinamento_pngs))
treinamento_tifs_nomes = sorted(os.listdir(treinamento_tifs))
treinamento_marked_rgbs_nomes = sorted(os.listdir(treinamento_marked_rgbs))
treinamento_rgbs_nomes = sorted(os.listdir(treinamento_rgbs))

diretorios_desejados = ['masks', 'marked_rgbs', 'rgbs', 'tci_pngs', 'tci_tifs']

# Filtrar a lista mantendo apenas os diretórios desejados
treinamento_dir_nomes = list(filter(lambda x: x in diretorios_desejados, treinamento_dir_nomes))



In [None]:
print(treinamento_dir_nomes)
print(treinamento_marked_rgbs_nomes[:5])
print(treinamento_masks_nomes[:5])
print(treinamento_rgbs_nomes[:5])
print(treinamento_pngs_nomes[:5])
print(treinamento_tifs_nomes[:5])



## Preparação dos Dados de Teste


In [None]:
## Dados de Teste

addressDSmainTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test'
addressMasksTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/masks'
addressPngsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/tci_pngs'
addressTifsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/tci_tifs'
addressMarkedRgbsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/marked_rgbs'
addressRgbsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/rgbs'

treinamento_dir_teste = os.path.join(addressDSmainTeste)
treinamento_masks_teste = os.path.join(addressMasksTeste)
treinamento_pngs_teste = os.path.join(addressPngsTeste)
treinamento_tifs_teste = os.path.join(addressTifsTeste)
treinamento_marked_rgbs_teste = os.path.join(addressMarkedRgbsTeste)
treinamento_rgbs_teste = os.path.join(addressRgbsTeste)


In [None]:
# Dados de Teste

treinamento_dir_teste_nomes = sorted(os.listdir(treinamento_dir_teste))
treinamento_masks_teste_nomes = sorted(os.listdir(treinamento_masks_teste))
treinamento_pngs_teste_nomes = sorted(os.listdir(treinamento_pngs_teste))
treinamento_tifs_teste_nomes = sorted(os.listdir(treinamento_tifs_teste))
treinamento_marked_rgbs_teste_nomes = sorted(os.listdir(treinamento_marked_rgbs_teste))
treinamento_rgbs_teste_nomes = sorted(os.listdir(treinamento_rgbs_teste))

diretorios_desejados = ['masks', 'marked_rgbs', 'rgbs', 'tci_pngs', 'tci_tifs']

# Filtrar a lista mantendo apenas os diretórios desejados
treinamento_dir_teste_nomes_filtrados = list(filter(lambda x: x in diretorios_desejados, treinamento_dir_teste_nomes))

treinamento_ValTest = os.path.join(addressDSmainTeste)

print(treinamento_dir_teste_nomes_filtrados)
print(treinamento_masks_teste_nomes[:3])
print(treinamento_pngs_teste_nomes[:3])
print(treinamento_tifs_teste_nomes[:3])
print(treinamento_marked_rgbs_teste_nomes[:3])
print(treinamento_rgbs_teste_nomes[:3])

In [None]:

# Caminhos para os diretórios de teste
addressDSmainTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test'
addressMasksTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/masks'
addressPngsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/tci_pngs'
addressTifsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/tci_tifs'
addressMarkedRgbsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/marked_rgbs'
addressRgbsTeste = '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/rgbs'

# Lista de nomes dos arquivos nos diretórios de teste
treinamento_masks_teste_nomes = sorted(os.listdir(addressMasksTeste))
treinamento_pngs_teste_nomes = sorted(os.listdir(addressPngsTeste))
treinamento_tifs_teste_nomes = sorted(os.listdir(addressTifsTeste))
treinamento_marked_rgbs_teste_nomes = sorted(os.listdir(addressMarkedRgbsTeste))
treinamento_rgbs_teste_nomes = sorted(os.listdir(addressRgbsTeste))

# Dicionário para mapear nomes de diretório para os caminhos
diretorios_teste = {
    'masks': addressMasksTeste,
    'marked_rgbs': addressMarkedRgbsTeste,
    'rgbs': addressRgbsTeste,
    'tci_pngs': addressPngsTeste,
    'tci_tifs': addressTifsTeste
}


## Data Augmentation

A ideia é gerar novos dados dentro de cada categoria selecionada, foram criadas novas imagens com diferenças de rotação, corte, ampliação das originais. Elas são geradas dentro do dataset das categorias selecionadas. Havia poucas imagens dentro das categorias e isso gerava um não aprendizado do modelo por falta de dados.

In [None]:

directories = [
    '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/masks',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/tci_pngs',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/tci_tifs',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/marked_rgbs',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli/dataset_inteli/rgbs',


    '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/masks',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/tci_pngs',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/tci_tifs',
    '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/marked_rgbs'
    '/content/drive/MyDrive/modulo10/data/dataset_inteli_test/dataset_inteli_test/rgbs'

]

data_gen = ImageDataGenerator(
    rotation_range=180,
    brightness_range=[0.5, 1.5],
    horizontal_flip=True,
    vertical_flip=True,
    fill_mode='nearest'
)

def augment_and_save(directory):
    for filename in os.listdir(directory):
        if filename.lower().endswith(('.png', '.jpg', '.jpeg', '.tif', '.tiff')):
            file_path = os.path.join(directory, filename)
            img = load_img(file_path)
            img_array = img_to_array(img)
            img_array = img_array.reshape((1,) + img_array.shape)

            i = 0
            for batch in data_gen.flow(img_array, batch_size=1, save_to_dir=directory, save_prefix='aug_', save_format='jpg'):
                i += 1
                if i >= 2:
                    break

for directory in directories:
    augment_and_save(directory)
    print(f"Transformações aplicadas e 6 imagens salvas em: {directory}")


In [None]:
for dir_nome, caminho_dir, arquivos in zip(treinamento_dir_nomes, [addressMarkedRgbs, addressMasks, addressRgbs, addressPngs, addressTifs], [treinamento_marked_rgbs_nomes, treinamento_masks_nomes, treinamento_rgbs_nomes, treinamento_pngs_nomes, treinamento_tifs_nomes]):
    for index, arquivo in enumerate(arquivos):  # Não especificamos um valor inicial para index
        # Caminho completo do arquivo original
        arquivo_original = os.path.join(caminho_dir, arquivo)
        # Novo nome do arquivo
        novo_nome = f"{dir_nome}_{index}.png"
        # Caminho completo do novo arquivo
        novo_arquivo = os.path.join(caminho_dir, novo_nome)
        print(f"Renomeando {arquivo_original} para {novo_arquivo}")  # Imprimir o caminho completo antes de renomear
        # Renomear o arquivo
        os.rename(arquivo_original, novo_arquivo)
        # Atualizar a lista de nomes dos arquivos
        arquivos[index] = novo_nome

print(treinamento_marked_rgbs_nomes)

In [None]:
nlinhas = 4
ncolunas = 4
pic_index_INI = 8
size_img = 4
# Índice da figura
pic_index = 0

fig = plt.gcf()
fig.set_size_inches(ncolunas * size_img, nlinhas * size_img)

# Inicializar a variável pic_index com valor final máximo: pic_index_INI
pic_index += pic_index_INI

proximo_pix = [os.path.join(treinamento_masks, IMGnome)
               for IMGnome in treinamento_masks_nomes[pic_index-pic_index_INI:pic_index]]

for i, img_path in enumerate(proximo_pix):
    sp = plt.subplot(nlinhas, ncolunas, i + 1)
    sp.axis('Off')
    try:
        img = mpimg.imread(img_path)
        plt.imshow(img)
    except Exception as e:
        print(f"Não foi possível carregar a imagem {img_path}: {e}")

plt.show()

## Descrição do modelo utilizado



O modelo escolhido pelo grupo é uma rede neural convolucional (CNN) implementada com as bibliotecas TensorFlow e Keras, adequadas para a tarefa de classificação de imagens. O modelo inicia com uma camada de entrada configurada para imagens de 300x300 pixels com três canais de cor. Seguem-se cinco camadas convolucionais intercaladas com camadas de pooling máximo para redução dimensional, cada uma utilizando filtros de 3x3 e ativação ReLU, aumentando progressivamente o número de filtros de 16 até 64. A rede também inclui uma camada de achatamento seguida por uma camada densa de 128 neurônios com ativação ReLU e uma camada de saída com 5 neurônios utilizando a função de ativação softmax para a classificação multiclasse. Este design é suportado por práticas comuns na literatura de aprendizado profundo, como as discutidas por Goodfellow, Bengio, e Courville (2016) em "Deep Learning" e Chollet (2017) em "Deep Learning with Python", onde a combinação de convolução, pooling e camadas densas é fundamental para a extração e classificação eficaz de características em imagens.

In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, (3, 3), activation='relu', input_shape=(300, 300, 3)),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(5, activation='softmax')
])

In [None]:
model.compile(
  loss='categorical_crossentropy',
  optimizer=RMSprop(learning_rate=0.001),
  metrics=['accuracy']
)

In [None]:
# Capturar tempo inicial da execução
start_time = time.time()

## Pré-Processamento

In [None]:
# Diretório principal dos dados de teste
teste_dir = os.path.join(addressDSmainTeste)

# Diretórios considerados para ler dados
classes_teste = ['masks', 'marked_rgbs', 'rgbs', 'tci_pngs', 'tci_tifs']

# Cria um ImageDataGenerator para pré-processar os dados de teste
teste_dadosGerados = ImageDataGenerator(rescale=1/255)

# Cria um gerador de dados a partir do diretório principal dos dados de teste, considerando apenas as classes desejadas
teste_gerador = teste_dadosGerados.flow_from_directory(
    teste_dir,
    target_size=(300, 300),
    batch_size=32,
    classes=classes_teste,
    class_mode='categorical'
)


In [None]:
# Diretório principal
treinamento_dir = os.path.join(addressDSmain)

# Diretório de classes usadas
classes_treinamento = ['masks', 'marked_rgbs', 'rgbs', 'tci_pngs', 'tci_tifs']

# Criando um ImageDataGenerator para pré-processar os dados de treinamento
treina_dadosGerados = ImageDataGenerator(rescale=1/255)

# Criando um gerador de dados a partir do diretório principal, considerando apenas as classes desejadas
treina_gerador = treina_dadosGerados.flow_from_directory(
    treinamento_dir,
    target_size=(300, 300),
    batch_size=128,
    classes=classes_treinamento,  # Lista de classes desejadas
    class_mode='categorical'
)

## Métricas Geradas pelo treinamento a partir da Execução do Modelo

In [None]:
import math

# Calcula o número total de amostras de treinamento
total_samples = treina_gerador.samples

# Calcula o número de lotes por época para garantir que todos os dados sejam usados
batch_size = 128
steps_per_epoch = math.ceil(total_samples / batch_size)

class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
    if(logs.get('accuracy')>0.98):
      print("\nAtingímos uma precisão maior ou igual a 95.0% então podemos parar o treino!")
      self.model.stop_training = True

# Treinamento do modelo
callbacks = myCallback()
historicoProgesso = model.fit(
    treina_gerador,
    steps_per_epoch=steps_per_epoch,
    validation_data = teste_gerador,
    epochs=19,
    verbose=2,
    callbacks=callbacks
)

In [None]:
acc = historicoProgesso.history['accuracy']
val_acc = historicoProgesso.history['val_accuracy']
loss = historicoProgesso.history['loss']
val_loss = historicoProgesso.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'r', label='Precisão do conjunto de Treino')
plt.plot(epochs, val_acc, 'b', label='Precisão do conjunto de Validação')
plt.title('Precisão dos conjuntos de Treino e Validação')
plt.xlabel('Épocas')
plt.ylabel('Precisão')
plt.legend(loc=0)
plt.figure()

plt.show()

O gráfico gerado apresenta uma distribuição da precisão durante épocas através dos dados de treinamento e validação, é observado alguns momentos com grande diferença entre precisão de treinamento e teste em um dado ponto, isso caracteriza um overfitting. A ideia é alterar parâmetros da rede e de treino para redução desses momentos de overfitting. Mas ao final do treinamento, os dados de treino e teste estão bem próximos e ambos de maneira crescente.

## Tempo de Execução com CPU e GPU

Configurando a GPU

- Selecione Runtime: No menu na parte superior do seu notebook, clique em Runtime.
- Change runtime type: No menu que aparece, selecione Change runtime type para abrir a janela de configurações do ambiente de execução.
- Hardware accelerator: Na janela de configurações, você verá uma opção chamada Hardware accelerator. Clique nesta opção e selecione GPU no menu dropdown.
- Salvar: Clique em Save para salvar as configurações. O ambiente agora será reiniciado e estará configurado para usar a GPU.

Se você preferir ou precisar usar a CPU em vez da GPU, você pode seguir um processo similar para configurar o notebook para usar apenas a CPU:

- Selecione Runtime: No menu na parte superior do seu notebook, clique em Runtime.
- Change runtime type: Selecione Change runtime type.
- Hardware accelerator: Escolha None para desativar os aceleradores de hardware e usar a CPU padrão.
- Salvar: Clique em Save. O ambiente será configurado para usar apenas a CPU.

In [None]:
# Identificação do dispositivo de treinamento
device_name = tf.test.gpu_device_name()
if device_name:
    print("Treinado na GPU:", device_name)
else:
    print("Treinado na CPU")

In [None]:
elapsed_time = time.time() - start_time
print(f"Tempo total de treinamento: {elapsed_time:.2f} segundos")

# Sprint 3

## Modelo de Segmentação de Imagens com U-Net e VGG16

## Descrição Geral
Este notebook implementa um modelo de segmentação de imagens utilizando a arquitetura U-Net com backbone VGG16. A segmentação é realizada em imagens e máscaras carregadas de um diretório específico. A abordagem é útil para tarefas como segmentação de áreas agrícolas em imagens de satélite.


## Habilitando GPU no Google Colab
Para habilitar a GPU no Google Colab, siga os passos abaixo:

1. Vá para `Tempo de execução` ou `Runtime` no menu.
2. Selecione `Alterar tipo de tempo de execução` ou `Change runtime`.
3. Na janela que abrir, escolha `GPU` no menu suspenso `Acelerador de hardware`, recomendamos o uso da A100 pela capacidade mista de CPU e GPU.

Após realizar esses passos, a GPU será habilitada para o notebook.

## Importando libs necessárias

In [None]:
import os
import numpy as np
from sklearn.model_selection import train_test_split
import tensorflow as tf
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D, concatenate, Dropout, Conv2DTranspose
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import ModelCheckpoint
from matplotlib import pyplot as plt
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array

## Verificando se a GPU está sendo usada
Com o código abaixo é possível verificar se a GPU está sendo usada pelo TensorFlow.

In [None]:
# Verifica se a GPU está disponível
gpus = tf.config.list_physical_devices('GPU')
if gpus:
    print(f"GPUs disponíveis: {gpus}")
    for gpu in gpus:
        tf.config.experimental.set_memory_growth(gpu, True)
else:
    print("Nenhuma GPU disponível.")

# Verifica se o TensorFlow está utilizando a GPU
if tf.test.gpu_device_name():
    print('GPU ativa:', tf.test.gpu_device_name())
else:
    print("Nenhuma GPU ativa.")

## Preparação de Dados

A preparação de dados envolve carregar as imagens e as máscaras correspondentes, normalizando e transformando esses dados para o formato adequado para treinamento. As imagens são normalizadas para o intervalo [0, 1], e as máscaras são binarizadas, onde valores acima de 0.5 são considerados 1 (objeto de interesse) e abaixo são 0 (fundo).


In [None]:
def load_images_and_masks(data_dir, mask_dir):
    images = []
    masks = []
    file_names = sorted(os.listdir(data_dir))
    for file in file_names:
        if file.endswith('.png'):
            img_path = os.path.join(data_dir, file)
            mask_path = os.path.join(mask_dir, file)
            try:
                img = load_img(img_path)  # Carrega a imagem no formato padrão
                img = img_to_array(img) / 255.0  # Normaliza a imagem para o intervalo [0, 1]
                mask = load_img(mask_path, color_mode='grayscale')  # Carrega a máscara como grayscale
                mask = img_to_array(mask) / 255.0  # Normaliza a máscara
                mask = (mask > 0.5).astype(np.float32)  # Binariza a máscara

                if img.shape == (1200, 1200, 3) and mask.shape == (1200, 1200, 1):
                    images.append(img)
                    masks.append(mask[:, :, 0])  # Garante que a máscara seja um array 2D
                else:
                    print(f"Descartado por dimensões incorretas: {file}")
            except Exception as e:
                print(f"Erro ao carregar {file}: {e}")

    return np.array(images), np.array(masks)

# Caminhos para os diretórios de imagens e máscaras
data_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli/rgbs'
mask_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli/masks'

# Carregar imagens e máscaras
images, masks = load_images_and_masks(data_dir, mask_dir)
print(f"Número de imagens: {len(images)}, Número de máscaras: {len(masks)}")

## Função de perda personalizada

Definimos uma função de perda personalizada que combina a perda Dice e a perda binária de entropia cruzada para otimizar o modelo.

In [None]:
def dice_loss(y_true, y_pred):
    y_true_f = tf.keras.backend.flatten(y_true)
    y_pred_f = tf.keras.backend.flatten(y_pred)
    intersection = tf.keras.backend.sum(y_true_f * y_pred_f)
    return 1 - (2. * intersection + 1) / (tf.keras.backend.sum(y_true_f) + tf.keras.backend.sum(y_pred_f) + 1)

def combined_loss(y_true, y_pred):
    return tf.keras.losses.binary_crossentropy(y_true, y_pred) + dice_loss(y_true, y_pred)

## Arquitetura do modelo

### Descrição Do Modelo Utilizado - Estrutura Geral

O modelo U-Net é uma rede neural convolucional projetada para tarefas de segmentação de imagem. A arquitetura é composta por duas partes principais: o codificador (encoder) e o decodificador (decoder). A estrutura do U-Net permite capturar tanto o contexto global quanto os detalhes locais da imagem. O U-Net, proposto por Ronneberger et al. (2015), destaca-se pelo uso de conexões de skip entre o encoder e o decoder, que preservam informações de alta resolução essenciais para segmentação precisa. A extensão 3D U-Net, proposta por Çiçek et al. (2016), melhora ainda mais a capacidade do modelo em aplicações volumétricas. Ele é amplamente utilizado em diversas aplicações, incluindo a segmentação de tumores e análise de imagens médicas.

Referências:

Ronneberger, O., Fischer, P., & Brox, T. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. In Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015 (pp. 234-241).

Çiçek, Ö., et al. (2016). 3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation. In Medical Image Computing and Computer-Assisted Intervention – MICCAI 2016 (pp. 424-432).


### Codificador (Encoder)


O codificador é baseado na arquitetura VGG16 pré-treinada no conjunto de dados ImageNet. Ele consiste em uma série de camadas convolucionais seguidas por camadas de pooling. A função do codificador é extrair características da imagem de entrada em diferentes níveis de abstração. As camadas convolucionais e de pooling são:


- **Block 1:**
  - 2 camadas Conv2D com 64 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 2:**
  - 2 camadas Conv2D com 128 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 3:**
  - 3 camadas Conv2D com 256 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 4:**
  - 3 camadas Conv2D com 512 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 5:**
  - 3 camadas Conv2D com 512 filtros e kernel 3x3, ativação ReLU

### Decodificador (Decoder)
O decodificador reconstrói a imagem de saída a partir das características extraídas pelo codificador. Utiliza operações de upsampling e camadas convolucionais para aumentar a resolução da imagem. As camadas do decodificador incluem:

- **UpSampling 1:**
  - 1 camada Conv2DTranspose com 512 filtros e kernel 2x2
  - 2 camadas Conv2D com 512 filtros e kernel 3x3, ativação ReLU

- **UpSampling 2:**
  - 1 camada Conv2DTranspose com 256 filtros e kernel 2x2
  - 2 camadas Conv2D com 256 filtros e kernel 3x3, ativação ReLU

- **UpSampling 3:**
  - 1 camada Conv2DTranspose com 128 filtros e kernel 2x2
  - 2 camadas Conv2D com 128 filtros e kernel 3x3, ativação ReLU

- **UpSampling 4:**
  - 1 camada Conv2DTranspose com 64 filtros e kernel 2x2
  - 2 camadas Conv2D com 64 filtros e kernel 3x3, ativação ReLU


### Saída (Output)
A última camada do decodificador é uma camada Conv2D com um único filtro e função de ativação sigmoid, produzindo a máscara segmentada binária.

In [None]:
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D, concatenate, Dropout, Conv2DTranspose
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam

def unet_with_vgg16_backbone(input_size=(1200, 1200, 3)):
    vgg16 = VGG16(weights='imagenet', include_top=False, input_shape=input_size)

    inputs = Input(input_size)

    # Encoder
    s1 = vgg16.get_layer("block1_conv2").output
    s2 = vgg16.get_layer("block2_conv2").output
    s3 = vgg16.get_layer("block3_conv3").output
    s4 = vgg16.get_layer("block4_conv3").output
    b1 = vgg16.get_layer("block5_conv3").output

    # Decoder
    u6 = Conv2DTranspose(512, (2, 2), strides=(2, 2), padding='same')(b1)
    u6 = concatenate([u6, s4])
    c6 = Conv2D(512, (3, 3), activation='relu', padding='same')(u6)
    c6 = Conv2D(512, (3, 3), activation='relu', padding='same')(c6)

    u7 = Conv2DTranspose(256, (2, 2), strides=(2, 2), padding='same')(c6)
    u7 = concatenate([u7, s3])
    c7 = Conv2D(256, (3, 3), activation='relu', padding='same')(u7)
    c7 = Conv2D(256, (3, 3), activation='relu', padding='same')(c7)

    u8 = Conv2DTranspose(128, (2, 2), strides=(2, 2), padding='same')(c7)
    u8 = concatenate([u8, s2])
    c8 = Conv2D(128, (3, 3), activation='relu', padding='same')(u8)
    c8 = Conv2D(128, (3, 3), activation='relu', padding='same')(c8)

    u9 = Conv2DTranspose(64, (2, 2), strides=(2, 2), padding='same')(c8)
    u9 = concatenate([u9, s1])
    c9 = Conv2D(64, (3, 3), activation='relu', padding='same')(u9)
    c9 = Conv2D(64, (3, 3), activation='relu', padding='same')(c9)

    outputs = Conv2D(1, (1, 1), activation='sigmoid')(c9)

    model = Model(inputs=[vgg16.input], outputs=[outputs])
    model.compile(optimizer=Adam(lr=1e-4), loss=combined_loss, metrics=['accuracy'])

    return model



## Divisão dos Dados e Treinamento
Dividimos os dados em conjuntos de treino e teste e treinamos o modelo U-Net com VGG16.

In [None]:
# Dividir os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(images, masks, test_size=0.1, random_state=42)


In [None]:
# Criar o modelo
model = unet_with_vgg16_backbone(input_size=(1200, 1200, 3))

In [None]:
# Treinar o modelo
results = model.fit(X_train, y_train, validation_split=0.1, batch_size=1, epochs=40)


In [None]:
# Avaliar o modelo
model.evaluate(X_test, y_test, batch_size=1)

## Plotando métricas
Plotamos as métricas de perda e acurácia do modelo durante o treinamento.

In [None]:
def plot_metrics(history):
    # Plotando a perda (loss)
    plt.figure(figsize=(14, 5))
    plt.subplot(1, 2, 1)
    plt.plot(history.history['loss'], label='Treino')
    plt.plot(history.history['val_loss'], label='Validação')
    plt.title('Perda')
    plt.ylabel('Perda')
    plt.xlabel('Época')
    plt.legend()

    # Plotando a acurácia (accuracy)
    plt.subplot(1, 2, 2)
    plt.plot(history.history['accuracy'], label='Treino')
    plt.plot(history.history['val_accuracy'], label='Validação')
    plt.title('Acurácia')
    plt.ylabel('Acurácia')
    plt.xlabel('Época')
    plt.legend()

    plt.tight_layout()
    plt.show()

plot_metrics(results)

## Plotando resultados
Plotamos as imagens de entrada, as máscaras reais e as máscaras preditas pelo modelo.

In [None]:
# Função para plotar os resultados
def plot_results(X, y, model, ix=None):
    """Plotar a imagem, a máscara real e a máscara predita.

    Args:
    - X: array de imagens de entrada.
    - y: array de máscaras reais.
    - model: modelo treinado U-Net.
    - ix: índice da imagem a ser plotada. Se None, seleciona uma imagem aleatoriamente.
    """
    if ix is None:
        ix = np.random.randint(0, len(X))

    fig, ax = plt.subplots(1, 3, figsize=(20, 10))
    ax[0].imshow(X[ix], cmap='gray')
    ax[0].title.set_text('Imagem Original')
    ax[0].axis('off')

    ax[1].imshow(y[ix].squeeze(), cmap='gray')  # Squeeze para remover dimensões extras se houver
    ax[1].title.set_text('Máscara Real')
    ax[1].axis('off')

    # Fazer a predição usando o modelo
    pred = model.predict(X[ix:ix+1])
    pred = (pred > 0.5).astype(np.float32)  # Binarizar a predição

    ax[2].imshow(pred.squeeze(), cmap='gray')  # Squeeze para garantir que está em 2D
    ax[2].title.set_text('Máscara Predita')
    ax[2].axis('off')

    plt.show()

In [None]:
index = None
plot_results(X_test, y_test, model, ix=index)

## Instruções para Obtenção do Modelo

### Passo 1: Aquisição dos Dados
Os dados utilizados neste exemplo são imagens e máscaras que podem ser carregadas a partir de um diretório local ou de uma unidade do Google Drive. Certifique-se de que as imagens e as máscaras estejam no formato PNG e que as máscaras sejam imagens em escala de cinza (grayscale).


### Passo 2: Configuração do Ambiente
Para utilizar a GPU no Google Colab:

1. Vá para `Tempo de execução` ou `Runtime` no menu.
2. Selecione `Alterar tipo de tempo de execução` ou `Change runtime`.
3. Na janela que abrir, escolha `GPU` no menu suspenso `Acelerador de hardware`, recomendamos o uso da A100 pela capacidade mista de CPU e GPU.

Após realizar esses passos, a GPU será habilitada para o notebook.

### Passo 3: Preparação dos Dados
Os dados devem ser normalizados e divididos em conjuntos de treino e teste. As imagens são normalizadas para o intervalo [0, 1], e as máscaras são binarizadas (valores acima de 0.5 são considerados 1 e abaixo são 0).

### Passo 4: Treinamento do Modelo
O modelo U-Net com backbone VGG16 é treinado utilizando os dados preparados. Ajuste os hiperparâmetros como número de épocas, tamanho do lote e taxa de aprendizado conforme necessário.

### Passo 5: Avaliação do Modelo
Após o treinamento, o modelo é avaliado no conjunto de teste para medir seu desempenho. Métricas como a perda e a acurácia são plotadas para análise.


### Passo 6: Refinamento do Modelo
Se o desempenho do modelo não for satisfatório, existem as seguintes estratégias de refinamento:
1. **Ajuste de Hiperparâmetros:** Modificar a taxa de aprendizado (learning rate ou `lr`), o número de épocas (`epochs`), o tamanho do lote (`batch_size`), etc.
2. **Aumento de Dados (Data Augmentation):** Utilize técnicas de aumento de dados para gerar mais exemplos de treino, como rotações, zoom, translações, etc.
3. **Arquitetura do Modelo:** Modificar a arquitetura do modelo, adicionando mais camadas ou unidades.
4. **Regularização:** Adicionar camadas de Dropout ou ajuste a regularização L2 para evitar overfitting.
5. **Treinamento com Mais Dados:** Adicionar mais dados de treino para melhorar a generalização do modelo.

## Instruções para deploy em um serviço em nuvem

As seguintes instruções fornecem um guia para preparar, fazer upload e fazer o deploy do modelo de segmentação no AWS SageMaker.

### 1. Preparação do ambiente

Instale a AWS CLI e configure suas credenciais:

In [None]:
pip install awscli
aws configure

Instale o SDK do SageMaker:

In [None]:
pip install sagemaker

### 2. Preparar o notebook

Certifique-se que todas as dependências do notebook estão instaladas:

In [None]:
pip install numpy pandas scikit-learn matplotlib tensorflow

### 3. Preparação do modelo

Após o treinamento do modelo, salve-o no formato .h5:

In [None]:
model.save('segmentation_model.h5')

Após isso, carregue o arquivo do modelo salvo para um bucket no S3:

In [None]:
aws s3 cp segmentation_model.h5 s3://nome-do-bucket/modelos/segmentation_model.h5

### 4. Deploy no SageMaker

Crie um arquivo inference.py e coloque o seguinte código que contém a lógica de carregamento do modelo e inferência:

In [None]:
import json
import numpy as np
from tensorflow.keras.models import load_model

def model_fn(model_dir):
    model = load_model(f'{model_dir}/segmentation_model.h5')
    return model

def input_fn(request_body, request_content_type):
    if request_content_type == 'application/json':
        return np.array(json.loads(request_body)['instances'])
    else:
        raise ValueError('Esse modelo apenas suporta JSON')

def predict_fn(input_data, model):
    predictions = model.predict(input_data)
    return predictions

def output_fn(prediction, response_content_type):
    return json.dumps({'predições': prediction.tolist()})

Utilize o SDK do SageMaker para criar um endpoint para o modelo:

In [None]:
import sagemaker
from sagemaker.tensorflow import TensorFlowModel

sagemaker_session = sagemaker.Session()
role = 'arn:aws:iam::sua-conta:permissao/sagemaker-permissao'

model = TensorFlowModel(model_data='s3://nome-bucket/modelos/segmentation_model.h5',
                        role=role,
                        entry_point='inference.py',
                        framework_version='2.3',
                        sagemaker_session=sagemaker_session)

predictor = model.deploy(initial_instance_count=1,
                         instance_type='ml.m4.xlarge')

### 5. Teste e validação

Envie uma requisição de teste ao endpoint para garantir que tudo esteja funcionando corretamente:

In [None]:
import json
import numpy as np
import boto3

runtime = boto3.client('runtime.sagemaker')
payload = json.dumps({'instances': np.random.rand(1, 224, 224, 3).tolist()})

response = runtime.invoke_endpoint(EndpointName=predictor.endpoint_name,
                                   ContentType='application/json',
                                   Body=payload)

result = json.loads(response['Body'].read().decode())
print(result)

### 6. Limpeza

Para evitar custos desnecessários, remova os recursos quando terminar:

In [None]:
predictor.delete_endpoint()

# Sprint 4

## Data Augmentation







In [None]:
# import os

# def rename_files(directory):
#     for filename in os.listdir(directory):
#         if filename.endswith(".tif") or filename.endswith(".png"):
#             # Extrair o número antes do primeiro sublinhado e adicionar a extensão correta
#             name_part = filename.split('_')[0]
#             extension = os.path.splitext(filename)[1]
#             new_name = name_part + extension

#             # Verificar se o arquivo já está com o nome correto
#             if filename != new_name:
#                 old_path = os.path.join(directory, filename)
#                 new_path = os.path.join(directory, new_name)
#                 os.rename(old_path, new_path)
#                 print(f"Renamed '{filename}' to '{new_name}' in directory '{directory}'")
#             else:
#                 print(f"File '{filename}' already has the correct name in directory '{directory}'")

# def rename_directories(base_directory):
#     for dirname in os.listdir(base_directory):
#         dir_path = os.path.join(base_directory, dirname)
#         if os.path.isdir(dir_path):
#             # Extrair o número antes do primeiro sublinhado e renomear o diretório
#             new_name = dirname.split('_')[0]
#             new_dir_path = os.path.join(base_directory, new_name)

#             # Verificar se o diretório já está com o nome correto
#             if dirname != new_name:
#                 os.rename(dir_path, new_dir_path)
#                 print(f"Renamed directory '{dirname}' to '{new_name}'")
#             else:
#                 print(f"Directory '{dirname}' already has the correct name")

# # Lista de diretórios onde estão as imagens
# directories = [
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/marked_rgbs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_pngs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_tifs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/rgbs',
# ]

# # Diretório de imagens com subdiretórios
# images_directory = '/content/drive/MyDrive/modulo10/data/dataset_inteli_felipe/images'

# # Renomear os arquivos nos diretórios especificados
# for directory in directories:
#     rename_files(directory)

# # Renomear os arquivos no diretório de imagens
# rename_files(images_directory)

# # Renomear os diretórios de imagens
# rename_directories(images_directory)

# print("Renaming completed in all directories")


In [None]:
# import os
# import numpy as np
# import matplotlib.pyplot as plt
# from tensorflow.keras.preprocessing.image import load_img, img_to_array
# from PIL import Image, UnidentifiedImageError, ImageEnhance

# def rotate_image(image, angle):
#     """Rotate the image by a specified angle."""
#     return image.rotate(angle)

# def adjust_brightness_contrast(image, brightness_factor, contrast_factor):
#     """Adjust brightness and contrast of an image."""
#     enhancer = ImageEnhance.Brightness(image)
#     image = enhancer.enhance(brightness_factor)
#     enhancer = ImageEnhance.Contrast(image)
#     image = enhancer.enhance(contrast_factor)
#     return image

# # Função para visualizar a imagem rotacionada em 90, 180 e 270 graus
# def visualize_specific_rotations(image_path, image_dimension):
#     try:
#         image = load_img(image_path, target_size=(image_dimension, image_dimension))
#         x = img_to_array(image).astype('uint8')
#         original_image = Image.fromarray(x)

#         rotations = [90, 180, 270]
#         fig, axes = plt.subplots(1, len(rotations), figsize=(20, 20))

#         for i, angle in enumerate(rotations):
#             rotated_image = rotate_image(original_image, angle)
#             axes[i].imshow(rotated_image)
#             axes[i].set_title(f"Rotation: {angle} degrees")
#             axes[i].axis('off')

#         plt.show()

#     except UnidentifiedImageError:
#         print(f"Error: Cannot identify image file {image_path}")
#     except Exception as e:
#         print(f"Unexpected error occurred with file {image_path}: {e}")

# # Função para visualizar a imagem com brilho e contraste ajustados
# def visualize_brightness_contrast(image_path, image_dimension, brightness_factors, contrast_factors):
#     try:
#         image = load_img(image_path, target_size=(image_dimension, image_dimension))
#         x = img_to_array(image).astype('uint8')
#         original_image = Image.fromarray(x)

#         fig, axes = plt.subplots(len(brightness_factors), len(contrast_factors), figsize=(20, 20))

#         for i, brightness in enumerate(brightness_factors):
#             for j, contrast in enumerate(contrast_factors):
#                 adjusted_image = adjust_brightness_contrast(original_image, brightness, contrast)
#                 axes[i, j].imshow(adjusted_image)
#                 axes[i, j].set_title(f"Brightness: {brightness}, Contrast: {contrast}")
#                 axes[i, j].axis('off')

#         plt.show()

#     except UnidentifiedImageError:
#         print(f"Error: Cannot identify image file {image_path}")
#     except Exception as e:
#         print(f"Unexpected error occurred with file {image_path}: {e}")

# # Caminho para a imagem de teste
# test_image_path = '/content/drive/MyDrive/modulo10/data/575_2019-8-14_S2L1C_21JXJ_TCI.png'
# image_dimension = 1200

# # Visualizar as rotações específicas na imagem de teste
# visualize_specific_rotations(test_image_path, image_dimension)

# # Definir fatores de brilho e contraste
# brightness_factors = [1.0, 1.5]  # Exemplos de fatores de brilho
# contrast_factors = [1.0, 1.5]    # Exemplos de fatores de contraste

# # Visualizar os ajustes de brilho e contraste na imagem de teste
# visualize_brightness_contrast(test_image_path, image_dimension, brightness_factors, contrast_factors)


In [None]:
# import os
# from tensorflow.keras.preprocessing.image import load_img, img_to_array
# from PIL import Image, UnidentifiedImageError, ImageEnhance
# import numpy as np

# def rotate_image(image, angle):
#     """Rotate the image by a specified angle."""
#     return image.rotate(angle)

# def adjust_brightness_contrast(image, brightness_factor, contrast_factor):
#     """Adjust brightness and contrast of an image."""
#     enhancer = ImageEnhance.Brightness(image)
#     image = enhancer.enhance(brightness_factor)
#     enhancer = ImageEnhance.Contrast(image)
#     image = enhancer.enhance(contrast_factor)
#     return image

# def data_augmentation(directory, image_dimension):
#     images_generated = 0
#     rotations = [90, 180, 270]
#     brightness_factors = [1, 1.5]  # Factors for decreasing and increasing brightness
#     contrast_factors = [1, 1.5]    # Factors for decreasing and increasing contrast

#     for filename in os.listdir(directory):
#         if filename.endswith(".tif") or filename.endswith(".png"):
#             image_path = os.path.join(directory, filename)
#             print(f"Processing file: {filename}")

#             try:
#                 image = load_img(image_path, target_size=(image_dimension, image_dimension))
#                 x = img_to_array(image)

#                 name, ext = os.path.splitext(filename)

#                 # Apply rotations
#                 for angle in rotations:
#                     rotated_image = rotate_image(Image.fromarray(x.astype('uint8')), angle)
#                     new_name = f"{name}_rot{angle}{ext}"
#                     save_path = os.path.join(directory, new_name)
#                     rotated_image.save(save_path)
#                     images_generated += 1

#                     # Apply brightness and contrast adjustments
#                     for brightness in brightness_factors:
#                         for contrast in contrast_factors:
#                             adjusted_image = adjust_brightness_contrast(rotated_image, brightness, contrast)
#                             new_name = f"{name}_rot{angle}_bright{brightness}_cont{contrast}{ext}"
#                             save_path = os.path.join(directory, new_name)
#                             adjusted_image.save(save_path)
#                             images_generated += 1

#             except UnidentifiedImageError:
#                 print(f"Error: Cannot identify image file {image_path}")
#             except Exception as e:
#                 print(f"Unexpected error occurred with file {filename}: {e}")

#     return images_generated

# # Lista de diretórios onde estão as imagens
# directories = [
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_pngs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_tifs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/rgbs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/masks'  # Incluindo o diretório de máscaras
# ]

# image_dimension = 1200

# # Aplicar data augmentation em todos os diretórios especificados e contar imagens geradas
# total_images_generated = 0
# for directory in directories:
#     images_generated = data_augmentation(directory, image_dimension)
#     total_images_generated += images_generated
#     print(f"Number of images generated in {directory}: {images_generated}")

# print(f"Total number of images generated in all directories: {total_images_generated}")


In [None]:
# image_path = '/content/drive/MyDrive/modulo10/data/dataset_inteli_felipe/tci_tifs/1062_2020-8-8_S2L1C_21JYK_TCI.tif'


# with rasterio.open(image_path) as src:
#     image_data = src.read(1)

# plt.imshow(image_data)
# plt.axis('off')
# plt.colorbar()
# plt.show()

In [None]:
# image_path = '/content/drive/MyDrive/modulo10/data/dataset_inteli_felipe/images/1062_2020-8-8_S2L1C_21JYK/b11.tif'

# with rasterio.open(image_path) as src:
#     image_data = src.read(1)

# plt.imshow(image_data)
# plt.axis('off')
# plt.colorbar()
# plt.show()

## Crop


In [None]:
# import os
# import numpy as np
# import matplotlib.pyplot as plt
# from tensorflow.keras.preprocessing.image import load_img, img_to_array
# from PIL import Image, UnidentifiedImageError, ImageEnhance

In [None]:
# from PIL import Image
# import os
# import uuid

# # Diretórios contendo as imagens originais
# input_image_dirs = [
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/rgbs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_tifs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_pngs',
# ]
# # Diretório contendo as máscaras
# input_mask_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/masks'

# # Diretórios onde as imagens e máscaras cortadas serão salvas
# output_image_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/newTargetImages2'
# output_mask_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/newTargetMasks2'

# os.makedirs(output_image_dir, exist_ok=True)
# os.makedirs(output_mask_dir, exist_ok=True)

# # Dimensões dos cortes
# crop_width, crop_height = 120, 120

# # Cortes por imagem
# max_cuts = 5

# # Função para cortar a imagem e sua máscara em pedaços menores
# def crop_image_and_mask(image_path, mask_path, output_image_dir, output_mask_dir, crop_width, crop_height, max_cuts):
#     try:
#         img = Image.open(image_path)
#         mask = Image.open(mask_path)
#         img_width, img_height = img.size

#         # Gera um nome aleatório para a imagem
#         base_name = str(uuid.uuid4())[:8]
#         ext = os.path.splitext(image_path)[1]

#         cut_count = 0
#         for i in range(0, img_width, crop_width):
#             for j in range(0, img_height, crop_height):
#                 if cut_count >= max_cuts:
#                     return
#                 box = (i, j, i + crop_width, j + crop_height)
#                 cropped_img = img.crop(box)
#                 cropped_mask = mask.crop(box)
#                 cropped_img_path = os.path.join(output_image_dir, f"{base_name}_{cut_count+1}{ext}")
#                 cropped_mask_path = os.path.join(output_mask_dir, f"{base_name}_{cut_count+1}{ext}")
#                 cropped_img.save(cropped_img_path)
#                 cropped_mask.save(cropped_mask_path)
#                 cut_count += 1
#     except Exception as e:
#         print(f"Erro ao processar {image_path}: {e}")

# # Percorrer todos os diretórios de entrada
# for input_image_dir in input_image_dirs:
#     for filename in os.listdir(input_image_dir):
#         if filename.lower().endswith(('.png', '.jpg', '.jpeg', '.tif', '.tiff')):
#             image_path = os.path.join(input_image_dir, filename)
#             mask_path = os.path.join(input_mask_dir, filename.replace('.tif', '.png'))  # Assumindo que as máscaras têm o mesmo nome que as imagens
#             if os.path.exists(mask_path):  # Garantindo que a máscara correspondente existe
#                 print(f"Processando {image_path} e {mask_path}")
#                 crop_image_and_mask(image_path, mask_path, output_image_dir, output_mask_dir, crop_width, crop_height, max_cuts)
#             else:
#                 print(f"Máscara não encontrada para {image_path}")


## Modelo de Segmentação de Imagens com U-Net e VGG16

## Descrição Geral
Este notebook implementa um modelo de segmentação de imagens utilizando a arquitetura U-Net com backbone VGG16. A segmentação é realizada em imagens e máscaras carregadas de um diretório específico. A abordagem é útil para tarefas como segmentação de áreas agrícolas em imagens de satélite.


## Habilitando GPU no Google Colab
Para habilitar a GPU no Google Colab, siga os passos abaixo:

1. Vá para `Tempo de execução` ou `Runtime` no menu.
2. Selecione `Alterar tipo de tempo de execução` ou `Change runtime`.
3. Na janela que abrir, escolha `GPU` no menu suspenso `Acelerador de hardware`, recomendamos o uso da A100 pela capacidade mista de CPU e GPU.

Após realizar esses passos, a GPU será habilitada para o notebook.

## Importando libs necessárias

In [None]:
import os
import zipfile
import numpy as np
import gdown
import tensorflow as tf
from matplotlib import pyplot as plt
import tensorflow.keras.backend as K
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from tensorflow.keras.callbacks import ModelCheckpoint
from google_drive_downloader import GoogleDriveDownloader as gdd
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D, concatenate, Dropout, Conv2DTranspose
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array

## Verificando se a GPU está sendo usada
Com o código abaixo é possível verificar se a GPU está sendo usada pelo TensorFlow.

In [None]:
# Verificação da GPU
def check_gpu():
    """Verifica se a GPU está disponível e ativa."""
    gpus = tf.config.list_physical_devices('GPU')
    if gpus:
        print(f"GPUs disponíveis: {gpus}")
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
    else:
        print("Nenhuma GPU disponível.")

    if tf.test.gpu_device_name():
        print('GPU ativa:', tf.test.gpu_device_name())
    else:
        print("Nenhuma GPU ativa.")

check_gpu()

## Preparação de Dados

A preparação de dados envolve baixar e carregar tanto as imagens quanto as máscaras correspondentes, normalizando e transformando esses dados para o formato adequado para treinamento. As imagens são normalizadas para o intervalo [0, 1], e as máscaras são binarizadas, onde valores acima de 0.5 são considerados 1 (objeto de interesse) e abaixo são 0 (fundo).


In [None]:
def load_images_and_masks_in_batches(data_dir, mask_dir, batch_size=51):
    """Carrega imagens e máscaras em batches."""
    file_names = sorted(os.listdir(data_dir))
    images, masks = [], []
    count = 0

    for file in file_names:
        if file.endswith('.png') or file.endswith('.tif'):
            img_path = os.path.join(data_dir, file)
            mask_path = os.path.join(mask_dir, file)
            try:
                img = load_img(img_path)
                img = img_to_array(img) / 255.0
                mask = load_img(mask_path, color_mode='grayscale')
                mask = img_to_array(mask) / 255.0
                mask = (mask > 0.5).astype(np.float32)

                if img.shape == (120, 120, 3) and mask.shape == (120, 120, 1):
                    images.append(img)
                    masks.append(mask[:, :, 0])
                    count += 1
                else:
                    print(f"Descartado por dimensões incorretas: {file}")

                if count == batch_size:
                    yield np.array(images), np.array(masks)
                    images, masks = [], []
                    count = 0
            except Exception as e:
                print(f"Erro ao carregar {file}: {e}")

    if images and masks:
        yield np.array(images), np.array(masks)

# Caminhos para os diretórios de imagens e máscaras
data_dir = './data/newTargetImages2'
mask_dir = './data/newTargetMasks2'

# Processar imagens e máscaras em batches
batch_size = 51
all_images, all_masks = [], []

for batch_images, batch_masks in load_images_and_masks_in_batches(data_dir, mask_dir, batch_size):
    all_images.extend(batch_images)
    all_masks.extend(batch_masks)

# Converter listas para arrays numpy
all_images = np.array(all_images)
all_masks = np.array(all_masks)

# Dividir os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(all_images, all_masks, test_size=0.1, random_state=42)
print(f"Tamanho do conjunto de treino: {len(X_train)} imagens")
print(f"Tamanho do conjunto de teste: {len(X_test)} imagens")

In [None]:
# import os
# import numpy as np
# from sklearn.model_selection import train_test_split
# from tensorflow.keras.preprocessing.image import load_img, img_to_array

# def load_images_and_masks_in_batches(data_dir, mask_dir, batch_size=51):
#     file_names = sorted(os.listdir(data_dir))
#     images = []
#     masks = []
#     count = 0

#     for file in file_names:
#         if file.endswith('.png'):
#             img_path = os.path.join(data_dir, file)
#             mask_path = os.path.join(mask_dir, file)
#             try:
#                 img = load_img(img_path)  # Carrega a imagem no formato padrão
#                 img = img_to_array(img) / 255.0  # Normaliza a imagem para o intervalo [0, 1]
#                 mask = load_img(mask_path, color_mode='grayscale')  # Carrega a máscara como grayscale
#                 mask = img_to_array(mask) / 255.0  # Normaliza a máscara
#                 mask = (mask > 0.5).astype(np.float32)  # Binariza a máscara

#                 if img.shape == (120, 120, 3) and mask.shape == (120, 120, 1):
#                     images.append(img)
#                     masks.append(mask[:, :, 0])  # Garante que a máscara seja um array 2D
#                     count += 1
#                 else:
#                     print(f"Descartado por dimensões incorretas: {file}")

#                 if count == batch_size:
#                     yield np.array(images), np.array(masks)
#                     images, masks = [], []
#                     count = 0
#             except Exception as e:
#                 print(f"Erro ao carregar {file}: {e}")

#     if images and masks:
#         yield np.array(images), np.array(masks)

# # Caminhos para os diretórios de imagens e máscaras
# data_dir = './data/newTargetImages2'
# mask_dir = './data/newTargetMasks2'

# # Processar imagens e máscaras em batches
# batch_size = 51
# all_images = []
# all_masks = []

# for batch_images, batch_masks in load_images_and_masks_in_batches(data_dir, mask_dir, batch_size):
#     all_images.extend(batch_images)
#     all_masks.extend(batch_masks)

# # Converter listas para arrays numpy
# all_images = np.array(all_images)
# all_masks = np.array(all_masks)

# # Dividir os dados em treino e teste
# X_train, X_test, y_train, y_test = train_test_split(all_images, all_masks, test_size=0.1, random_state=42)

# print(f"Tamanho do conjunto de treino: {len(X_train)} imagens")
# print(f"Tamanho do conjunto de teste: {len(X_test)} imagens")


## Funções de perda e métricas personalizadas

Definimos uma função de perda personalizada que combina a perda Dice e a perda binária de entropia cruzada para otimizar o modelo.

In [None]:
def dice_loss(y_true, y_pred):
    y_true_f = tf.keras.backend.flatten(y_true)
    y_pred_f = tf.keras.backend.flatten(y_pred)
    intersection = tf.keras.backend.sum(y_true_f * y_pred_f)
    return 1 - (2. * intersection + 1) / (tf.keras.backend.sum(y_true_f) + tf.keras.backend.sum(y_pred_f) + 1)

def combined_loss(y_true, y_pred):
    return tf.keras.losses.binary_crossentropy(y_true, y_pred) + dice_loss(y_true, y_pred)

def iou_metric(y_true, y_pred):
    y_true = tf.cast(y_true, tf.float32)
    y_pred = tf.cast(y_pred > 0.5, tf.float32)
    intersection = tf.reduce_sum(y_true * y_pred)
    union = tf.reduce_sum(y_true) + tf.reduce_sum(y_pred) - intersection
    return intersection / (union + tf.keras.backend.epsilon())

def precision(y_true, y_pred):
    true_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_true * y_pred, 0, 1)))
    predicted_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_pred, 0, 1)))
    return true_positives / (predicted_positives + tf.keras.backend.epsilon())

def recall(y_true, y_pred):
    true_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_true * y_pred, 0, 1)))
    possible_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_true, 0, 1)))
    return true_positives / (possible_positives + tf.keras.backend.epsilon())

def f1_score(y_true, y_pred):
    p = precision(y_true, y_pred)
    r = recall(y_true, y_pred)
    return 2 * ((p * r) / (p + r + tf.keras.backend.epsilon()))

def accuracy(y_true, y_pred):
    y_pred = tf.round(y_pred)
    y_true = tf.round(y_true)
    return tf.reduce_sum(tf.cast(tf.equal(y_true, y_pred), tf.float32)) / tf.reduce_sum(tf.cast(tf.size(y_true), tf.float32))

## Arquitetura do modelo

### Descrição Do Modelo Utilizado - Estrutura Geral

O modelo U-Net é uma rede neural convolucional projetada para tarefas de segmentação de imagem. A arquitetura é composta por duas partes principais: o codificador (encoder) e o decodificador (decoder). A estrutura do U-Net permite capturar tanto o contexto global quanto os detalhes locais da imagem. O U-Net, proposto por Ronneberger et al. (2015), destaca-se pelo uso de conexões de skip entre o encoder e o decoder, que preservam informações de alta resolução essenciais para segmentação precisa. A extensão 3D U-Net, proposta por Çiçek et al. (2016), melhora ainda mais a capacidade do modelo em aplicações volumétricas. Ele é amplamente utilizado em diversas aplicações, incluindo a segmentação de tumores e análise de imagens médicas.

Referências:

Ronneberger, O., Fischer, P., & Brox, T. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. In Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015 (pp. 234-241).

Çiçek, Ö., et al. (2016). 3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation. In Medical Image Computing and Computer-Assisted Intervention – MICCAI 2016 (pp. 424-432).


### Codificador (Encoder)


O codificador é baseado na arquitetura VGG16 pré-treinada no conjunto de dados ImageNet. Ele consiste em uma série de camadas convolucionais seguidas por camadas de pooling. A função do codificador é extrair características da imagem de entrada em diferentes níveis de abstração. As camadas convolucionais e de pooling são:


- **Block 1:**
  - 2 camadas Conv2D com 64 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 2:**
  - 2 camadas Conv2D com 128 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 3:**
  - 3 camadas Conv2D com 256 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 4:**
  - 3 camadas Conv2D com 512 filtros e kernel 3x3, ativação ReLU
  - 1 camada MaxPooling2D com tamanho de pool 2x2

- **Block 5:**
  - 3 camadas Conv2D com 512 filtros e kernel 3x3, ativação ReLU

### Decodificador (Decoder)
O decodificador reconstrói a imagem de saída a partir das características extraídas pelo codificador. Utiliza operações de upsampling e camadas convolucionais para aumentar a resolução da imagem. As camadas do decodificador incluem:

- **UpSampling 1:**
  - 1 camada Conv2DTranspose com 512 filtros e kernel 2x2
  - 2 camadas Conv2D com 512 filtros e kernel 3x3, ativação ReLU

- **UpSampling 2:**
  - 1 camada Conv2DTranspose com 256 filtros e kernel 2x2
  - 2 camadas Conv2D com 256 filtros e kernel 3x3, ativação ReLU

- **UpSampling 3:**
  - 1 camada Conv2DTranspose com 128 filtros e kernel 2x2
  - 2 camadas Conv2D com 128 filtros e kernel 3x3, ativação ReLU

- **UpSampling 4:**
  - 1 camada Conv2DTranspose com 64 filtros e kernel 2x2
  - 2 camadas Conv2D com 64 filtros e kernel 3x3, ativação ReLU


### Saída (Output)
A última camada do decodificador é uma camada Conv2D com um único filtro e função de ativação sigmoid, produzindo a máscara segmentada binária.

In [None]:
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.layers import Input, Conv2D, Conv2DTranspose, concatenate, Resizing, Dropout
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam

def dice_loss(y_true, y_pred):
    y_true_f = tf.keras.backend.flatten(y_true)
    y_pred_f = tf.keras.backend.flatten(y_pred)
    intersection = tf.keras.backend.sum(y_true_f * y_pred_f)
    return 1 - (2. * intersection + 1) / (tf.keras.backend.sum(y_true_f) + tf.keras.backend.sum(y_pred_f) + 1)

def combined_loss(y_true, y_pred):
    return tf.keras.losses.binary_crossentropy(y_true, y_pred) + dice_loss(y_true, y_pred)

def unet_with_vgg16_backbone(input_size=(120, 120, 3), dropout_rate=0.5, loss_function='binary_crossentropy'):
    vgg16 = VGG16(weights='imagenet', include_top=False, input_shape=input_size)

    # Encoder
    s1 = vgg16.get_layer("block1_conv2").output
    s2 = vgg16.get_layer("block2_conv2").output
    s3 = vgg16.get_layer("block3_conv3").output
    s4 = vgg16.get_layer("block4_conv3").output
    b1 = vgg16.get_layer("block5_conv3").output

    # Decoder
    u6 = Conv2DTranspose(512, (2, 2), strides=(2, 2), padding='same')(b1)
    u6 = Resizing(s4.shape[1], s4.shape[2])(u6)
    u6 = concatenate([u6, s4])
    u6 = Dropout(dropout_rate)(u6)
    c6 = Conv2D(512, (3, 3), activation='relu', padding='same')(u6)
    c6 = Conv2D(512, (3, 3), activation='relu', padding='same')(c6)

    u7 = Conv2DTranspose(256, (2, 2), strides=(2, 2), padding='same')(c6)
    u7 = Resizing(s3.shape[1], s3.shape[2])(u7)
    u7 = concatenate([u7, s3])
    u7 = Dropout(dropout_rate)(u7)
    c7 = Conv2D(256, (3, 3), activation='relu', padding='same')(u7)
    c7 = Conv2D(256, (3, 3), activation='relu', padding='same')(c7)

    u8 = Conv2DTranspose(128, (2, 2), strides=(2, 2), padding='same')(c7)
    u8 = Resizing(s2.shape[1], s2.shape[2])(u8)
    u8 = concatenate([u8, s2])
    u8 = Dropout(dropout_rate)(u8)
    c8 = Conv2D(128, (3, 3), activation='relu', padding='same')(u8)
    c8 = Conv2D(128, (3, 3), activation='relu', padding='same')(c8)

    u9 = Conv2DTranspose(64, (2, 2), strides=(2, 2), padding='same')(c8)
    u9 = Resizing(s1.shape[1], s1.shape[2])(u9)
    u9 = concatenate([u9, s1])
    u9 = Dropout(dropout_rate)(u9)
    c9 = Conv2D(64, (3, 3), activation='relu', padding='same')(u9)
    c9 = Conv2D(64, (3, 3), activation='relu', padding='same')(c9)

    outputs = Conv2D(1, (1, 1), activation='sigmoid')(c9)

    model = Model(inputs=vgg16.input, outputs=outputs)
    model.compile(optimizer=Adam(lr=1e-4), loss=loss_function, metrics=['accuracy'])

    return model

## Avaliando o melhor valor de Dropout

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.losses import binary_crossentropy
from sklearn.model_selection import train_test_split

dropouts = np.concatenate((np.arange(0.01, 0.1, 0.01), np.arange(0.1, 0.6, 0.1)))
val_losses = []
dropout_values = []

for dropout in dropouts:
    print(f"Testing model with {dropout*100:.1f}% dropout rate...")
    model = unet_with_vgg16_backbone(dropout_rate=dropout, loss_function=combined_loss)
    history = model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=30, verbose=1)
    val_loss = history.history['val_loss'][-1]
    val_losses.append(val_loss)
    dropout_values.append(dropout)
    print(f"Validation loss for {dropout*100:.1f}% dropout: {val_loss:.4f}")

plt.figure(figsize=(10, 6))
plt.plot(dropout_values, val_losses, marker='o', linestyle='-')
plt.title('Validation Loss vs. Dropout Rate')
plt.xlabel('Dropout Rate')
plt.ylabel('Validation Loss')
plt.xticks(dropout_values, labels=[f"{d*100:.1f}%" for d in dropout_values])
plt.grid(True)
plt.show()

## Divisão dos Dados e Treinamento
Dividimos os dados em conjuntos de treino e teste e treinamos o modelo U-Net com VGG16.

In [None]:
# Criar o modelo
model = unet_with_vgg16_backbone(input_size=(120, 120, 3))

In [None]:
# Callback para salvar o modelo com a melhor acurácia de validação
model_checkpoint_callback = ModelCheckpoint(
    'best_model.h5', monitor='val_loss', save_best_only=True, verbose=1)

In [None]:
# Callback para early stopping
early_stopping_callback = EarlyStopping(
    monitor='val_loss', patience=10, verbose=1, restore_best_weights=True)

In [None]:
# Treinar o modelo com os callbacks
results = model.fit(
    X_train, y_train, validation_split=0.1, epochs=40, batch_size=1,
    callbacks=[early_stopping_callback, model_checkpoint_callback])

## Avaliação do modelo

In [None]:
def evaluate_model(model, X_test, y_test):
    """Avalia o modelo treinado no conjunto de teste."""
    model.evaluate(X_test, y_test, batch_size=1)
    model.save('segmentation_model.h5')

evaluate_model(model, X_test, y_test)

## Plotando métricas
Plotamos as métricas de perda e acurácia do modelo durante o treinamento.

In [None]:
def plot_metrics(history):
    """Plota as métricas de perda e acurácia do modelo durante o treinamento."""
    plt.figure(figsize=(14, 10))

    # Plotando a perda (loss)
    plt.subplot(2, 3, 1)
    plt.plot(history.history['loss'], label='Treino')
    plt.plot(history.history['val_loss'], label='Validação')
    plt.title('Perda')
    plt.ylabel('Perda')
    plt.xlabel('Época')
    plt.legend()

    # Plotando a acurácia (accuracy)
    plt.subplot(2, 3, 2)
    plt.plot(history.history['accuracy'], label='Treino')
    plt.plot(history.history['val_accuracy'], label='Validação')
    plt.title('Acurácia')
    plt.ylabel('Acurácia')
    plt.xlabel('Época')
    plt.legend()

    # Plotando a métrica IOU
    plt.subplot(2, 3, 3)
    plt.plot(history.history['iou_metric'], label='Treino')
    plt.plot(history.history['val_iou_metric'], label='Validação')
    plt.title('IOU')
    plt.ylabel('IOU')
    plt.xlabel('Época')
    plt.legend()

    # Plotando a precisão (precision)
    plt.subplot(2, 3, 4)
    plt.plot(history.history['precision'], label='Treino')
    plt.plot(history.history['val_precision'], label='Validação')
    plt.title('Precisão')
    plt.ylabel('Precisão')
    plt.xlabel('Época')
    plt.legend()

    # Plotando o recall
    plt.subplot(2, 3, 5)
    plt.plot(history.history['recall'], label='Treino')
    plt.plot(history.history['val_recall'], label='Validação')
    plt.title('Recall')
    plt.ylabel('Recall')
    plt.xlabel('Época')
    plt.legend()

    # Plotando a pontuação F1
    plt.subplot(2, 3, 6)
    plt.plot(history.history['f1_score'], label='Treino')
    plt.plot(history.history['val_f1_score'], label='Validação')
    plt.title('Pontuação F1')
    plt.ylabel('F1 Score')
    plt.xlabel('Época')
    plt.legend()

    plt.tight_layout()
    plt.show()

plot_metrics(results)

## Função de Pós-Processamento para Máscaras de Segmentação

Realização do pós-processamento das máscaras binárias geradas. O objetivo é suavizar, preencher quando possível e arredondar as bordas da máscara, melhorando a aparência visual das previsões e aumentando a precisão prática da segmentação.

### Parâmetros

- `mask (np.array)`: A máscara binária original predita pelo modelo.
- `kernel_size (int)`: O tamanho do kernel utilizado para as operações morfológicas. Um kernel maior intensifica os efeitos de erosão e dilatação.

### Processo

1. **Erosão**: A erosão é aplicada primeiro para eliminar pequenos ruídos e separar objetos que estão levemente conectados. Isso ajuda a clarificar a máscara e reduzir artefatos indesejados.

2. **Dilatação**: Após a erosão, a dilatação é aplicada para restaurar o tamanho dos objetos que foram erodidos, ao mesmo tempo que mantém as desconexões introduzidas pela erosão. Isso ajuda a preservar a integridade estrutural dos objetos na máscara, enquanto ainda suaviza as bordas.

<!-- ### Exemplo de Código

```python
import cv2
import numpy as np

def post_process_mask(mask, kernel_size=3):
    """
    Aplica erosão e dilatação para suavizar as bordas da máscara.
    """
    kernel = np.ones((kernel_size, kernel_size), np.uint8)
    erosion = cv2.erode(mask, kernel, iterations=1)
    dilation = cv2.dilate(erosion, kernel, iterations=1)
    return dilation -->


In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

def post_process_mask(mask, kernel_size=3):
    """Aplica erosão seguida de dilatação para suavizar as bordas da máscara."""
    kernel = np.ones((kernel_size, kernel_size), np.uint8)
    erosion = cv2.erode(mask, kernel, iterations=1)
    dilation = cv2.dilate(erosion, kernel, iterations=1)
    return dilation

def plot_results(X, y, model, num_images=4):
    """Plota a imagem, a máscara real, a máscara predita e a máscara pós-processada para um número especificado de imagens."""
    for i in range(num_images):
        ix = np.random.randint(0, len(X))
        fig, ax = plt.subplots(1, 4, figsize=(27, 10))

        # Plotando a imagem original
        ax[0].imshow(X[ix], cmap='gray')
        ax[0].title.set_text('Imagem Original')
        ax[0].axis('off')

        # Plotando a máscara real
        ax[1].imshow(y[ix].squeeze(), cmap='gray')
        ax[1].title.set_text('Máscara Real')
        ax[1].axis('off')

        # Fazendo a previsão da máscara e plotando
        pred = model.predict(X[ix:ix+1])
        pred = (pred > 0.5).astype(np.float32)
        ax[2].imshow(pred.squeeze(), cmap='gray')
        ax[2].title.set_text('Máscara Predita')
        ax[2].axis('off')

        # Aplicando pós-processamento na máscara predita e plotando
        pred_processed = post_process_mask(pred.squeeze())
        ax[3].imshow(pred_processed, cmap='gray')
        ax[3].title.set_text('Máscara Pós-processada')
        ax[3].axis('off')

        plt.show()

plot_results(X_test, y_test, model)

## Instruções para Obtenção do Modelo

### Passo 1: Aquisição dos Dados
Os dados utilizados neste exemplo são imagens e máscaras que podem ser carregadas a partir de um diretório local ou de uma unidade do Google Drive. Certifique-se de que as imagens e as máscaras estejam no formato PNG e que as máscaras sejam imagens em escala de cinza (grayscale).


### Passo 2: Configuração do Ambiente
Para utilizar a GPU no Google Colab:

1. Vá para `Tempo de execução` ou `Runtime` no menu.
2. Selecione `Alterar tipo de tempo de execução` ou `Change runtime`.
3. Na janela que abrir, escolha `GPU` no menu suspenso `Acelerador de hardware`, recomendamos o uso da A100 pela capacidade mista de CPU e GPU.

Após realizar esses passos, a GPU será habilitada para o notebook.

### Passo 3: Preparação dos Dados
Os dados devem ser normalizados e divididos em conjuntos de treino e teste. As imagens são normalizadas para o intervalo [0, 1], e as máscaras são binarizadas (valores acima de 0.5 são considerados 1 e abaixo são 0).

### Passo 4: Treinamento do Modelo
O modelo U-Net com backbone VGG16 é treinado utilizando os dados preparados. Ajuste os hiperparâmetros como número de épocas, tamanho do lote e taxa de aprendizado conforme necessário.

### Passo 5: Avaliação do Modelo
Após o treinamento, o modelo é avaliado no conjunto de teste para medir seu desempenho. Métricas como a perda e a acurácia são plotadas para análise.


### Passo 6: Refinamento do Modelo
Se o desempenho do modelo não for satisfatório, existem as seguintes estratégias de refinamento:
1. **Ajuste de Hiperparâmetros:** Modificar a taxa de aprendizado (learning rate ou `lr`), o número de épocas (`epochs`), o tamanho do lote (`batch_size`), etc.
2. **Aumento de Dados (Data Augmentation):** Utilize técnicas de aumento de dados para gerar mais exemplos de treino, como rotações, zoom, translações, etc.
3. **Arquitetura do Modelo:** Modificar a arquitetura do modelo, adicionando mais camadas ou unidades.
4. **Regularização:** Adicionar camadas de Dropout ou ajuste a regularização L2 para evitar overfitting.
5. **Treinamento com Mais Dados:** Adicionar mais dados de treino para melhorar a generalização do modelo.

## Instruções para deploy em um serviço em nuvem

As seguintes instruções fornecem um guia para preparar, fazer upload e fazer o deploy do modelo de segmentação no AWS SageMaker.

### 1. Preparação do ambiente

Instale a AWS CLI e configure suas credenciais:

In [None]:
pip install awscli
aws configure

Instale o SDK do SageMaker:

In [None]:
pip install sagemaker

### 2. Preparar o notebook

Certifique-se que todas as dependências do notebook estão instaladas:

In [None]:
pip install numpy pandas scikit-learn matplotlib tensorflow

### 3. Preparação do modelo

Após o treinamento do modelo, salve-o no formato .h5:

In [None]:
model.save('segmentation_model.h5')

Após isso, carregue o arquivo do modelo salvo para um bucket no S3:

In [None]:
aws s3 cp segmentation_model.h5 s3://nome-do-bucket/modelos/segmentation_model.h5

### 4. Deploy no SageMaker

Crie um arquivo inference.py e coloque o seguinte código que contém a lógica de carregamento do modelo e inferência:

In [None]:
import json
import numpy as np
from tensorflow.keras.models import load_model

def model_fn(model_dir):
    model = load_model(f'{model_dir}/segmentation_model.h5')
    return model

def input_fn(request_body, request_content_type):
    if request_content_type == 'application/json':
        return np.array(json.loads(request_body)['instances'])
    else:
        raise ValueError('Esse modelo apenas suporta JSON')

def predict_fn(input_data, model):
    predictions = model.predict(input_data)
    return predictions

def output_fn(prediction, response_content_type):
    return json.dumps({'predições': prediction.tolist()})

Utilize o SDK do SageMaker para criar um endpoint para o modelo:

In [None]:
import sagemaker
from sagemaker.tensorflow import TensorFlowModel

sagemaker_session = sagemaker.Session()
role = 'arn:aws:iam::sua-conta:permissao/sagemaker-permissao'

model = TensorFlowModel(model_data='s3://nome-bucket/modelos/segmentation_model.h5',
                        role=role,
                        entry_point='inference.py',
                        framework_version='2.3',
                        sagemaker_session=sagemaker_session)

predictor = model.deploy(initial_instance_count=1,
                         instance_type='ml.m4.xlarge')

### 5. Teste e validação

Envie uma requisição de teste ao endpoint para garantir que tudo esteja funcionando corretamente:

In [None]:
import json
import numpy as np
import boto3

runtime = boto3.client('runtime.sagemaker')
payload = json.dumps({'instances': np.random.rand(1, 224, 224, 3).tolist()})

response = runtime.invoke_endpoint(EndpointName=predictor.endpoint_name,
                                   ContentType='application/json',
                                   Body=payload)

result = json.loads(response['Body'].read().decode())
print(result)

### 6. Limpeza

Para evitar custos desnecessários, remova os recursos quando terminar:

In [None]:
predictor.delete_endpoint()

# Sprint 5


## Pré-Processamento

## Data Augmentation







In [None]:
# import os

# def rename_files(directory):
#     for filename in os.listdir(directory):
#         if filename.endswith(".tif") or filename.endswith(".png"):
#             # Extrair o número antes do primeiro sublinhado e adicionar a extensão correta
#             name_part = filename.split('_')[0]
#             extension = os.path.splitext(filename)[1]
#             new_name = name_part + extension

#             # Verificar se o arquivo já está com o nome correto
#             if filename != new_name:
#                 old_path = os.path.join(directory, filename)
#                 new_path = os.path.join(directory, new_name)
#                 os.rename(old_path, new_path)
#                 print(f"Renamed '{filename}' to '{new_name}' in directory '{directory}'")
#             else:
#                 print(f"File '{filename}' already has the correct name in directory '{directory}'")

# def rename_directories(base_directory):
#     for dirname in os.listdir(base_directory):
#         dir_path = os.path.join(base_directory, dirname)
#         if os.path.isdir(dir_path):
#             # Extrair o número antes do primeiro sublinhado e renomear o diretório
#             new_name = dirname.split('_')[0]
#             new_dir_path = os.path.join(base_directory, new_name)

#             # Verificar se o diretório já está com o nome correto
#             if dirname != new_name:
#                 os.rename(dir_path, new_dir_path)
#                 print(f"Renamed directory '{dirname}' to '{new_name}'")
#             else:
#                 print(f"Directory '{dirname}' already has the correct name")

# # Lista de diretórios onde estão as imagens
# directories = [
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/marked_rgbs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_pngs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_tifs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/rgbs',
# ]

# # Diretório de imagens com subdiretórios
# images_directory = '/content/drive/MyDrive/modulo10/data/dataset_inteli_felipe/images'

# # Renomear os arquivos nos diretórios especificados
# for directory in directories:
#     rename_files(directory)

# # Renomear os arquivos no diretório de imagens
# rename_files(images_directory)

# # Renomear os diretórios de imagens
# rename_directories(images_directory)

# print("Renaming completed in all directories")


In [None]:
# import os
# import numpy as np
# import matplotlib.pyplot as plt
# from tensorflow.keras.preprocessing.image import load_img, img_to_array
# from PIL import Image, UnidentifiedImageError, ImageEnhance

# def rotate_image(image, angle):
#     """Rotate the image by a specified angle."""
#     return image.rotate(angle)

# def adjust_brightness_contrast(image, brightness_factor, contrast_factor):
#     """Adjust brightness and contrast of an image."""
#     enhancer = ImageEnhance.Brightness(image)
#     image = enhancer.enhance(brightness_factor)
#     enhancer = ImageEnhance.Contrast(image)
#     image = enhancer.enhance(contrast_factor)
#     return image

# # Função para visualizar a imagem rotacionada em 90, 180 e 270 graus
# def visualize_specific_rotations(image_path, image_dimension):
#     try:
#         image = load_img(image_path, target_size=(image_dimension, image_dimension))
#         x = img_to_array(image).astype('uint8')
#         original_image = Image.fromarray(x)

#         rotations = [90, 180, 270]
#         fig, axes = plt.subplots(1, len(rotations), figsize=(20, 20))

#         for i, angle in enumerate(rotations):
#             rotated_image = rotate_image(original_image, angle)
#             axes[i].imshow(rotated_image)
#             axes[i].set_title(f"Rotation: {angle} degrees")
#             axes[i].axis('off')

#         plt.show()

#     except UnidentifiedImageError:
#         print(f"Error: Cannot identify image file {image_path}")
#     except Exception as e:
#         print(f"Unexpected error occurred with file {image_path}: {e}")

# # Função para visualizar a imagem com brilho e contraste ajustados
# def visualize_brightness_contrast(image_path, image_dimension, brightness_factors, contrast_factors):
#     try:
#         image = load_img(image_path, target_size=(image_dimension, image_dimension))
#         x = img_to_array(image).astype('uint8')
#         original_image = Image.fromarray(x)

#         fig, axes = plt.subplots(len(brightness_factors), len(contrast_factors), figsize=(20, 20))

#         for i, brightness in enumerate(brightness_factors):
#             for j, contrast in enumerate(contrast_factors):
#                 adjusted_image = adjust_brightness_contrast(original_image, brightness, contrast)
#                 axes[i, j].imshow(adjusted_image)
#                 axes[i, j].set_title(f"Brightness: {brightness}, Contrast: {contrast}")
#                 axes[i, j].axis('off')

#         plt.show()

#     except UnidentifiedImageError:
#         print(f"Error: Cannot identify image file {image_path}")
#     except Exception as e:
#         print(f"Unexpected error occurred with file {image_path}: {e}")

# # Caminho para a imagem de teste
# test_image_path = '/content/drive/MyDrive/modulo10/data/575_2019-8-14_S2L1C_21JXJ_TCI.png'
# image_dimension = 1200

# # Visualizar as rotações específicas na imagem de teste
# visualize_specific_rotations(test_image_path, image_dimension)

# # Definir fatores de brilho e contraste
# brightness_factors = [1.0, 1.5]  # Exemplos de fatores de brilho
# contrast_factors = [1.0, 1.5]    # Exemplos de fatores de contraste

# # Visualizar os ajustes de brilho e contraste na imagem de teste
# visualize_brightness_contrast(test_image_path, image_dimension, brightness_factors, contrast_factors)


In [None]:
# import os
# from tensorflow.keras.preprocessing.image import load_img, img_to_array
# from PIL import Image, UnidentifiedImageError, ImageEnhance
# import numpy as np

# def rotate_image(image, angle):
#     """Rotate the image by a specified angle."""
#     return image.rotate(angle)

# def adjust_brightness_contrast(image, brightness_factor, contrast_factor):
#     """Adjust brightness and contrast of an image."""
#     enhancer = ImageEnhance.Brightness(image)
#     image = enhancer.enhance(brightness_factor)
#     enhancer = ImageEnhance.Contrast(image)
#     image = enhancer.enhance(contrast_factor)
#     return image

# def data_augmentation(directory, image_dimension):
#     images_generated = 0
#     rotations = [90, 180, 270]
#     brightness_factors = [1, 1.5]  # Factors for decreasing and increasing brightness
#     contrast_factors = [1, 1.5]    # Factors for decreasing and increasing contrast

#     for filename in os.listdir(directory):
#         if filename.endswith(".tif") or filename.endswith(".png"):
#             image_path = os.path.join(directory, filename)
#             print(f"Processing file: {filename}")

#             try:
#                 image = load_img(image_path, target_size=(image_dimension, image_dimension))
#                 x = img_to_array(image)

#                 name, ext = os.path.splitext(filename)

#                 # Apply rotations
#                 for angle in rotations:
#                     rotated_image = rotate_image(Image.fromarray(x.astype('uint8')), angle)
#                     new_name = f"{name}_rot{angle}{ext}"
#                     save_path = os.path.join(directory, new_name)
#                     rotated_image.save(save_path)
#                     images_generated += 1

#                     # Apply brightness and contrast adjustments
#                     for brightness in brightness_factors:
#                         for contrast in contrast_factors:
#                             adjusted_image = adjust_brightness_contrast(rotated_image, brightness, contrast)
#                             new_name = f"{name}_rot{angle}_bright{brightness}_cont{contrast}{ext}"
#                             save_path = os.path.join(directory, new_name)
#                             adjusted_image.save(save_path)
#                             images_generated += 1

#             except UnidentifiedImageError:
#                 print(f"Error: Cannot identify image file {image_path}")
#             except Exception as e:
#                 print(f"Unexpected error occurred with file {filename}: {e}")

#     return images_generated

# # Lista de diretórios onde estão as imagens
# directories = [
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_pngs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_tifs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/rgbs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/masks'  # Incluindo o diretório de máscaras
# ]

# image_dimension = 1200

# # Aplicar data augmentation em todos os diretórios especificados e contar imagens geradas
# total_images_generated = 0
# for directory in directories:
#     images_generated = data_augmentation(directory, image_dimension)
#     total_images_generated += images_generated
#     print(f"Number of images generated in {directory}: {images_generated}")

# print(f"Total number of images generated in all directories: {total_images_generated}")


In [None]:
# image_path = '/content/drive/MyDrive/modulo10/data/dataset_inteli_felipe/tci_tifs/1062_2020-8-8_S2L1C_21JYK_TCI.tif'


# with rasterio.open(image_path) as src:
#     image_data = src.read(1)

# plt.imshow(image_data)
# plt.axis('off')
# plt.colorbar()
# plt.show()

In [None]:
# image_path = '/content/drive/MyDrive/modulo10/data/dataset_inteli_felipe/images/1062_2020-8-8_S2L1C_21JYK/b11.tif'

# with rasterio.open(image_path) as src:
#     image_data = src.read(1)

# plt.imshow(image_data)
# plt.axis('off')
# plt.colorbar()
# plt.show()

## Crop


In [None]:
# import os
# import numpy as np
# import matplotlib.pyplot as plt
# from tensorflow.keras.preprocessing.image import load_img, img_to_array
# from PIL import Image, UnidentifiedImageError, ImageEnhance

In [None]:
# from PIL import Image
# import os
# import uuid

# # Diretórios contendo as imagens originais
# input_image_dirs = [
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/rgbs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_tifs',
#     '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/tci_pngs',
# ]
# # Diretório contendo as máscaras
# input_mask_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/masks'

# # Diretórios onde as imagens e máscaras cortadas serão salvas
# output_image_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/newTargetImages2'
# output_mask_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/newTargetMasks2'

# os.makedirs(output_image_dir, exist_ok=True)
# os.makedirs(output_mask_dir, exist_ok=True)

# # Dimensões dos cortes
# crop_width, crop_height = 120, 120

# # Cortes por imagem
# max_cuts = 5

# # Função para cortar a imagem e sua máscara em pedaços menores
# def crop_image_and_mask(image_path, mask_path, output_image_dir, output_mask_dir, crop_width, crop_height, max_cuts):
#     try:
#         img = Image.open(image_path)
#         mask = Image.open(mask_path)
#         img_width, img_height = img.size

#         # Gera um nome aleatório para a imagem
#         base_name = str(uuid.uuid4())[:8]
#         ext = os.path.splitext(image_path)[1]

#         cut_count = 0
#         for i in range(0, img_width, crop_width):
#             for j in range(0, img_height, crop_height):
#                 if cut_count >= max_cuts:
#                     return
#                 box = (i, j, i + crop_width, j + crop_height)
#                 cropped_img = img.crop(box)
#                 cropped_mask = mask.crop(box)
#                 cropped_img_path = os.path.join(output_image_dir, f"{base_name}_{cut_count+1}{ext}")
#                 cropped_mask_path = os.path.join(output_mask_dir, f"{base_name}_{cut_count+1}{ext}")
#                 cropped_img.save(cropped_img_path)
#                 cropped_mask.save(cropped_mask_path)
#                 cut_count += 1
#     except Exception as e:
#         print(f"Erro ao processar {image_path}: {e}")

# # Percorrer todos os diretórios de entrada
# for input_image_dir in input_image_dirs:
#     for filename in os.listdir(input_image_dir):
#         if filename.lower().endswith(('.png', '.jpg', '.jpeg', '.tif', '.tiff')):
#             image_path = os.path.join(input_image_dir, filename)
#             mask_path = os.path.join(input_mask_dir, filename.replace('.tif', '.png'))  # Assumindo que as máscaras têm o mesmo nome que as imagens
#             if os.path.exists(mask_path):  # Garantindo que a máscara correspondente existe
#                 print(f"Processando {image_path} e {mask_path}")
#                 crop_image_and_mask(image_path, mask_path, output_image_dir, output_mask_dir, crop_width, crop_height, max_cuts)
#             else:
#                 print(f"Máscara não encontrada para {image_path}")


## Modelo de Segmentação de Imagens com U-Net e VGG16

## Descrição Geral
Este notebook implementa um modelo de segmentação de imagens utilizando a arquitetura U-Net com backbone VGG16. A segmentação é realizada em imagens e máscaras carregadas de um diretório específico. A abordagem é útil para tarefas como segmentação de áreas agrícolas em imagens de satélite.


## Habilitando GPU no Google Colab
Para habilitar a GPU no Google Colab, siga os passos abaixo:

1. Vá para `Tempo de execução` ou `Runtime` no menu.
2. Selecione `Alterar tipo de tempo de execução` ou `Change runtime`.
3. Na janela que abrir, escolha `GPU` no menu suspenso `Acelerador de hardware`, recomendamos o uso da A100 pela capacidade mista de CPU e GPU.

Após realizar esses passos, a GPU será habilitada para o notebook.

## Importando libs necessárias

In [None]:
import os
import zipfile
import numpy as np
import gdown
import tensorflow as tf
from matplotlib import pyplot as plt
import tensorflow.keras.backend as K
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from tensorflow.keras.callbacks import ModelCheckpoint
from google_drive_downloader import GoogleDriveDownloader as gdd
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D, concatenate, Dropout, Conv2DTranspose
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array

## Verificando se a GPU está sendo usada
Com o código abaixo é possível verificar se a GPU está sendo usada pelo TensorFlow.

In [None]:
# Verificação da GPU
def check_gpu():
    """Verifica se a GPU está disponível e ativa."""
    gpus = tf.config.list_physical_devices('GPU')
    if gpus:
        print(f"GPUs disponíveis: {gpus}")
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
    else:
        print("Nenhuma GPU disponível.")

    if tf.test.gpu_device_name():
        print('GPU ativa:', tf.test.gpu_device_name())
    else:
        print("Nenhuma GPU ativa.")

check_gpu()

## Preparação de Dados

A preparação de dados envolve baixar e carregar tanto as imagens quanto as máscaras correspondentes, normalizando e transformando esses dados para o formato adequado para treinamento. As imagens são normalizadas para o intervalo [0, 1], e as máscaras são binarizadas, onde valores acima de 0.5 são considerados 1 (objeto de interesse) e abaixo são 0 (fundo).


In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
def load_images_and_masks_in_batches(data_dir, mask_dir, batch_size=51):
    """
    Carrega imagens e máscaras em batches.

    Args:
        data_dir (str): O diretório contendo as imagens.
        mask_dir (str): O diretório contendo as máscaras correspondentes às imagens.
        batch_size (int, optional): O tamanho do batch. O padrão é 51.

    Yields:
        tuple: Um par de arrays numpy contendo os batches de imagens e máscaras.

    Raises:
        Exception: Se ocorrer um erro ao carregar uma imagem.

    Returns:
        tuple: Um par de arrays numpy contendo as imagens e máscaras restantes.
    """
    file_names = sorted(os.listdir(data_dir))
    images, masks = [], []
    count = 0

    for file in file_names:
        if file.endswith('.png') or file.endswith('.tif'):
            img_path = os.path.join(data_dir, file)
            mask_path = os.path.join(mask_dir, file)
            try:
                img = load_img(img_path)
                img = img_to_array(img) / 255.0
                mask = load_img(mask_path, color_mode='grayscale')
                mask = img_to_array(mask) / 255.0
                mask = (mask > 0.5).astype(np.float32)

                if img.shape == (120, 120, 3) and mask.shape == (120, 120, 1):
                    images.append(img)
                    masks.append(mask[:, :, 0])
                    count += 1
                else:
                    print(f"Descartado por dimensões incorretas: {file}")

                if count == batch_size:
                    yield np.array(images), np.array(masks)
                    images, masks = [], []
                    count = 0
                    print(f"Carregou {batch_size} imagens")
            except Exception as e:
                print(f"Erro ao carregar {file}: {e}")

    if images and masks:
        yield np.array(images), np.array(masks)

data_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/newTargetImages2'
mask_dir = '/content/drive/MyDrive/modulo10/data/dataset_inteli_teste/newTargetMasks2'

batch_size = 51
all_images, all_masks = [], []

for batch_images, batch_masks in load_images_and_masks_in_batches(data_dir, mask_dir, batch_size):
    all_images.extend(batch_images)
    all_masks.extend(batch_masks)

all_images = np.array(all_images)
all_masks = np.array(all_masks)

X_train, X_test, y_train, y_test = train_test_split(all_images, all_masks, test_size=0.4, random_state=42)
print(f"Tamanho do conjunto de treino: {len(X_train)} imagens")
print(f"Tamanho do conjunto de teste: {len(X_test)} imagens")

In [None]:
# import os
# import numpy as np
# from sklearn.model_selection import train_test_split
# from tensorflow.keras.preprocessing.image import load_img, img_to_array

# def load_images_and_masks_in_batches(data_dir, mask_dir, batch_size=51):
#     file_names = sorted(os.listdir(data_dir))
#     images = []
#     masks = []
#     count = 0

#     for file in file_names:
#         if file.endswith('.png'):
#             img_path = os.path.join(data_dir, file)
#             mask_path = os.path.join(mask_dir, file)
#             try:
#                 img = load_img(img_path)  # Carrega a imagem no formato padrão
#                 img = img_to_array(img) / 255.0  # Normaliza a imagem para o intervalo [0, 1]
#                 mask = load_img(mask_path, color_mode='grayscale')  # Carrega a máscara como grayscale
#                 mask = img_to_array(mask) / 255.0  # Normaliza a máscara
#                 mask = (mask > 0.5).astype(np.float32)  # Binariza a máscara

#                 if img.shape == (120, 120, 3) and mask.shape == (120, 120, 1):
#                     images.append(img)
#                     masks.append(mask[:, :, 0])  # Garante que a máscara seja um array 2D
#                     count += 1
#                 else:
#                     print(f"Descartado por dimensões incorretas: {file}")

#                 if count == batch_size:
#                     yield np.array(images), np.array(masks)
#                     images, masks = [], []
#                     count = 0
#             except Exception as e:
#                 print(f"Erro ao carregar {file}: {e}")

#     if images and masks:
#         yield np.array(images), np.array(masks)

# # Caminhos para os diretórios de imagens e máscaras
# data_dir = './data/newTargetImages2'
# mask_dir = './data/newTargetMasks2'

# # Processar imagens e máscaras em batches
# batch_size = 51
# all_images = []
# all_masks = []

# for batch_images, batch_masks in load_images_and_masks_in_batches(data_dir, mask_dir, batch_size):
#     all_images.extend(batch_images)
#     all_masks.extend(batch_masks)

# # Converter listas para arrays numpy
# all_images = np.array(all_images)
# all_masks = np.array(all_masks)

# # Dividir os dados em treino e teste
# X_train, X_test, y_train, y_test = train_test_split(all_images, all_masks, test_size=0.1, random_state=42)

# print(f"Tamanho do conjunto de treino: {len(X_train)} imagens")
# print(f"Tamanho do conjunto de teste: {len(X_test)} imagens")


## Funções de perda e métricas personalizadas

Definimos uma função de perda personalizada que combina a perda Dice e a perda binária de entropia cruzada para otimizar o modelo.

In [None]:
def dice_loss(y_true, y_pred):
    """
    Calculate the Dice loss between the true labels and predicted labels.

    Parameters:
    - y_true: The true labels.
    - y_pred: The predicted labels.

    Returns:
    - The Dice loss value.

    """
    y_true_f = tf.keras.backend.flatten(y_true)
    y_pred_f = tf.keras.backend.flatten(y_pred)
    intersection = tf.keras.backend.sum(y_true_f * y_pred_f)
    return 1 - (2. * intersection + 1) / (tf.keras.backend.sum(y_true_f) + tf.keras.backend.sum(y_pred_f) + 1)

def combined_loss(y_true, y_pred):
    """
    Calculates the combined loss by adding binary crossentropy loss and dice loss.

    Parameters:
    - y_true: The true labels.
    - y_pred: The predicted labels.

    Returns:
    The combined loss value.
    """
    return tf.keras.losses.binary_crossentropy(y_true, y_pred) + dice_loss(y_true, y_pred)

def iou_metric(y_true, y_pred):
    """
    Calculates the Intersection over Union (IoU) metric for binary segmentation.

    Parameters:
    - y_true: Ground truth binary segmentation mask.
    - y_pred: Predicted binary segmentation mask.

    Returns:
    - IoU metric value.

    """
    y_true = tf.cast(y_true, tf.float32)
    y_pred = tf.cast(y_pred > 0.5, tf.float32)
    intersection = tf.reduce_sum(y_true * y_pred)
    union = tf.reduce_sum(y_true) + tf.reduce_sum(y_pred) - intersection
    return intersection / (union + tf.keras.backend.epsilon())

def precision(y_true, y_pred):
    """
    Calculates the precision metric for binary classification.

    Precision is the ratio of true positives to the sum of true positives and false positives.
    It measures the ability of the model to correctly predict positive samples.

    Args:
        y_true (tensor): True labels.
        y_pred (tensor): Predicted labels.

    Returns:
        tensor: Precision value.

    """
    true_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_true * y_pred, 0, 1)))
    predicted_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_pred, 0, 1)))
    return true_positives / (predicted_positives + tf.keras.backend.epsilon())

def recall(y_true, y_pred):
    """
    Calculates the recall metric for a binary classification problem.

    Recall measures the ability of a model to find all the relevant cases (true positives) in a dataset.

    Args:
        y_true (tensor): True labels of the data.
        y_pred (tensor): Predicted labels of the data.

    Returns:
        tensor: The recall score.

    """
    true_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_true * y_pred, 0, 1)))
    possible_positives = tf.reduce_sum(tf.round(tf.clip_by_value(y_true, 0, 1)))
    return true_positives / (possible_positives + tf.keras.backend.epsilon())

def f1_score(y_true, y_pred):
    """
    Calculate the F1 score, which is a measure of a model's accuracy.

    The F1 score is the harmonic mean of precision and recall. It is a useful metric
    for imbalanced datasets, where the number of samples in different classes is
    significantly different.

    Parameters:
        y_true (array-like): The true labels.
        y_pred (array-like): The predicted labels.

    Returns:
        float: The F1 score.
    """
    p = precision(y_true, y_pred)
    r = recall(y_true, y_pred)
    return 2 * ((p * r) / (p + r + tf.keras.backend.epsilon()))


def coefficient_of_variation_of_coverage(y_true, y_pred):
    """
    Calculate the coefficient of variation of coverage.

    Parameters:
    - y_true: The true values.
    - y_pred: The predicted values.

    Returns:
    The coefficient of variation of coverage.
    """
    mean_coverage = tf.reduce_mean(y_pred)
    std_deviation = tf.math.reduce_std(y_pred)
    cvr = std_deviation / (mean_coverage + tf.keras.backend.epsilon())

    return cvr


def accuracy(y_true, y_pred):
    """
    Calculates the accuracy of the predicted values.

    Parameters:
    - y_true: The true values.
    - y_pred: The predicted values.

    Returns:
    - The accuracy of the predicted values.
    """
    y_pred = tf.round(y_pred)
    y_true = tf.round(y_true)
    return tf.reduce_sum(tf.cast(tf.equal(y_true, y_pred), tf.float32)) / tf.reduce_sum(tf.cast(tf.size(y_true), tf.float32))

## Arquitetura do modelo

### Descrição Do Modelo Utilizado - Estrutura Geral

O modelo U-Net é uma rede neural convolucional projetada para tarefas de segmentação de imagem. A arquitetura é composta por duas partes principais: o codificador (encoder) e o decodificador (decoder). A estrutura do U-Net permite capturar tanto o contexto global quanto os detalhes locais da imagem. O U-Net, proposto por Ronneberger et al. (2015), destaca-se pelo uso de conexões de skip entre o encoder e o decoder, que preservam informações de alta resolução essenciais para segmentação precisa. Este modelo é amplamente utilizado em diversas aplicações, incluindo a segmentação de tumores e análise de imagens médicas.

Referências:

Ronneberger, O., Fischer, P., & Brox, T. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. In Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015 (pp. 234-241).


### Codificador (Encoder)


O codificador é baseado na arquitetura MobileNetV2 pré-treinada no conjunto de dados ImageNet. Ele consiste em uma série de camadas convolucionais projetadas para extrair características da imagem de entrada em diferentes níveis de abstração. As camadas utilizadas são:

- **block_1_expand_relu:**
  - Produz uma saída de 64x64.

- **block_3_expand_relu:**
  - Produz uma saída de 32x32.

- **block_6_expand_relu:**
  - Produz uma saída de 16x16.

- **block_13_expand_relu:**
  - Produz uma saída de 8x8.

- **Saída final do MobileNetV2:**
  - Produz uma saída de 4x4.

### Decodificador (Decoder)

O decodificador reconstrói a imagem de saída a partir das características extraídas pelo codificador. Utiliza operações de upsampling e camadas convolucionais para aumentar a resolução da imagem. As camadas do decodificador incluem:

- **UpSampling 1:**
  - Conv2DTranspose com 128 filtros e kernel 2x2
  - Resizing para ajustar a saída ao tamanho correspondente do encoder
  - concatenate com a saída block_13_expand_relu
  - Dropout com taxa definida
  - Conv2D com 128 filtros e kernel 3x3, ativação ReLU

- **UpSampling 2:**
  - Conv2DTranspose com 64 filtros e kernel 2x2
  - Resizing para ajustar a saída ao tamanho correspondente do encoder
  - concatenate com a saída block_6_expand_relu
  - Dropout com taxa definida
  - Conv2D com 64 filtros e kernel 3x3, ativação ReLU

- **UpSampling 3:**
  - Conv2DTranspose com 32 filtros e kernel 2x2
  - Resizing para ajustar a saída ao tamanho correspondente do encoder
  - concatenate com a saída block_3_expand_relu
  - Dropout com taxa definida
  - Conv2D com 32 filtros e kernel 3x3, ativação ReLU

- **UpSampling 4:**
  - Conv2DTranspose com 16 filtros e kernel 2x2
  - Resizing para ajustar a saída ao tamanho correspondente do encoder
  - concatenate com a saída block_1_expand_relu
  - Dropout com taxa definida
  - Conv2D com 16 filtros e kernel 3x3, ativação ReLU


### Saída (Output)

A última camada do decodificador é uma Conv2D com um único filtro e função de ativação sigmoid, produzindo a máscara segmentada binária. A camada Resizing garante que a saída tenha o mesmo tamanho da entrada, ajustando para (120, 120).

Esta arquitetura combina a eficiência do MobileNetV2 para extração de características com a capacidade da U-Net de realizar segmentação precisa, sendo adequada para diversas aplicações em segmentação de imagem.

In [None]:
import tensorflow as tf
from tensorflow.keras.layers import Input, Conv2D, Conv2DTranspose, concatenate, Dropout, Resizing
from tensorflow.keras.models import Model
from tensorflow.keras.applications import MobileNetV2

def unet_with_mobilenet_backbone(input_size=(120, 120, 3), dropout_rate=0.1):
    """
    Creates a U-Net model with MobileNetV2 as the backbone.

    Args:
        input_size (tuple): The input size of the model in the format (height, width, channels).
        dropout_rate (float): The dropout rate to be applied after each concatenation layer.

    Returns:
        keras.Model: The U-Net model with MobileNetV2 backbone.

    """
    # Carrega o MobileNetV2 como backbone, sem a parte superior e com pesos pré-treinados do ImageNet
    mobilenet = MobileNetV2(weights='imagenet', include_top=False, input_shape=input_size)

    # Congelar camadas do backbone para preservar os pesos pré-treinados
    for layer in mobilenet.layers:
        layer.trainable = False

    # Extração de features em diferentes níveis
    s1 = mobilenet.get_layer('block_1_expand_relu').output   # 64x64
    s2 = mobilenet.get_layer('block_3_expand_relu').output   # 32x32
    s3 = mobilenet.get_layer('block_6_expand_relu').output   # 16x16
    s4 = mobilenet.get_layer('block_13_expand_relu').output  # 8x8
    b1 = mobilenet.output  # 4x4

    # Decoder com redução do número de filtros e simplificação das operações
    u6 = Conv2DTranspose(128, (2, 2), strides=(2, 2), padding='same')(b1)
    u6 = Resizing(s4.shape[1], s4.shape[2])(u6)
    u6 = concatenate([u6, s4])
    u6 = Dropout(dropout_rate)(u6)
    c6 = Conv2D(128, (3, 3), activation='relu', padding='same')(u6)

    u7 = Conv2DTranspose(64, (2, 2), strides=(2, 2), padding='same')(c6)
    u7 = Resizing(s3.shape[1], s3.shape[2])(u7)
    u7 = concatenate([u7, s3])
    u7 = Dropout(dropout_rate)(u7)
    c7 = Conv2D(64, (3, 3), activation='relu', padding='same')(u7)

    u8 = Conv2DTranspose(32, (2, 2), strides=(2, 2), padding='same')(c7)
    u8 = Resizing(s2.shape[1], s2.shape[2])(u8)
    u8 = concatenate([u8, s2])
    u8 = Dropout(dropout_rate)(u8)
    c8 = Conv2D(32, (3, 3), activation='relu', padding='same')(u8)

    u9 = Conv2DTranspose(16, (2, 2), strides=(2, 2), padding='same')(c8)
    u9 = Resizing(s1.shape[1], s1.shape[2])(u9)
    u9 = concatenate([u9, s1])
    u9 = Dropout(dropout_rate)(u9)
    c9 = Conv2D(16, (3, 3), activation='relu', padding='same')(u9)

    # Camada de saída com resizing para garantir que a saída tem o tamanho de entrada
    outputs = Conv2D(1, (1, 1), activation='sigmoid')(c9)
    outputs = Resizing(input_size[0], input_size[1])(outputs)

    model = Model(inputs=mobilenet.input, outputs=outputs)

    return model

model = unet_with_mobilenet_backbone()
model.summary()

In [None]:
def create_model(dropout_rate):
    """
    Creates a model with a specified dropout rate.

    Parameters:
    - dropout_rate (float): The dropout rate to be used in the model.

    Returns:
    - model: The compiled model.

    """
    model = unet_with_mobilenet_backbone(dropout_rate=dropout_rate)
    model.compile(
        optimizer='adam',
        loss='binary_crossentropy',
        metrics=[
            'accuracy',
            precision,
            recall,
            f1_score,
            iou_metric,
            coefficient_of_variation_of_coverage
        ]
    )
    return model

## Avaliando o melhor valor de Dropout

In [None]:
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint

def train_model(model, X_train, y_train, X_test, y_test, epochs=30, model_path='best_model.h5'):
    """
    Trains a given model using the provided training and testing data.

    Parameters:
    - model: The model to be trained.
    - X_train: The input features of the training data.
    - y_train: The target labels of the training data.
    - X_test: The input features of the testing data.
    - y_test: The target labels of the testing data.
    - epochs: The number of epochs to train the model (default: 30).
    - model_path: The path to save the best model (default: 'best_model.h5').

    Returns:
    - history: The training history of the model.
    """
    early_stopping = EarlyStopping(
        monitor='val_loss',
        patience=10,
        verbose=1,
        mode='min',
        restore_best_weights=True
    )

    model_checkpoint = ModelCheckpoint(
        model_path,
        monitor='val_loss',
        save_best_only=True,
        verbose=1,
        mode='min'
    )

    history = model.fit(
        X_train, y_train,
        validation_data=(X_test, y_test),
        epochs=epochs,
        verbose=1,
        callbacks=[early_stopping, model_checkpoint]
    )
    return history

best_loss = float('inf')
best_dropout = 0
model_path = 'best_model.h5'

dropouts = np.concatenate((np.arange(0.01, 0.1, 0.01), np.arange(0.1, 0.6, 0.1)))
val_losses = []
dropout_values = []

for dropout in dropouts:
    print(f"Testing model with {dropout*100:.1f}% dropout rate...")
    model = create_model(dropout_rate=dropout)
    history = train_model(model, X_train, y_train, X_test, y_test, epochs=100, model_path=model_path)
    val_loss = min(history.history['val_loss'])
    val_losses.append(val_loss)
    dropout_values.append(dropout)

    if val_loss < best_loss:
        best_loss = val_loss
        best_dropout = dropout
        best_model_path = model_path

    print(f"Minimum validation loss for {dropout*100:.1f}% dropout: {val_loss:.4f}")

custom_objects = {
    'binary_crossentropy': tf.keras.losses.binary_crossentropy,
    'dice_loss': dice_loss,
    'combined_loss': combined_loss,
    'iou_metric': iou_metric,
    'precision': precision,
    'recall': recall,
    'f1_score': f1_score,
    'coefficient_of_variation_of_coverage': coefficient_of_variation_of_coverage,
    'accuracy': accuracy
}


best_model = tf.keras.models.load_model(best_model_path, custom_objects=custom_objects)
print(f"Best model uses dropout rate: {best_dropout*100:.1f}%, with validation loss: {best_loss:.4f}")


In [None]:
import matplotlib.pyplot as plt
import numpy as np

def plot_validation_loss(dropout_values, val_losses):
    """
    Plots the validation loss against the dropout rate.

    Parameters:
    - dropout_values (list): List of dropout rates.
    - val_losses (list): List of validation losses.

    Returns:
    None
    """
    plt.figure(figsize=(10, 6))
    plt.plot(dropout_values, val_losses, marker='o', linestyle='-', color='b', label='Validation Loss')
    plt.title('Validation Loss vs. Dropout Rate', fontsize=14)
    plt.xlabel('Dropout Rate (%)', fontsize=12)
    plt.ylabel('Validation Loss', fontsize=12)
    plt.xticks(dropout_values, labels=[f"{rate*100:.1f}%" for rate in dropout_values])
    plt.yticks(np.arange(min(val_losses), max(val_losses), 0.005))
    plt.grid(True, which='both', linestyle='--', linewidth=0.5)
    plt.legend()
    plt.tight_layout()
    plt.show()


## Avaliação do modelo

In [None]:
def evaluate_model(model, X_test, y_test):
    """
    Avalia o modelo treinado no conjunto de teste.

    Parameters:
    model (object): O modelo treinado a ser avaliado.
    X_test (array-like): Os dados de teste.
    y_test (array-like): Os rótulos de teste.

    Returns:
    None
    """
    model.evaluate(X_test, y_test, batch_size=1)
    model.save('segmentation_model.h5')

evaluate_model(model, X_test, y_test)

## Plotando métricas
Plotamos as métricas de perda e acurácia do modelo durante o treinamento.

In [None]:
def plot_metrics(history):
    """
    Plots the loss and accuracy metrics of the model during training.

    Parameters:
    history (object): The history object returned by the `fit` method of a Keras model.

    Returns:
    None
    """

    import matplotlib.pyplot as plt

    plt.figure(figsize=(14, 10))

    # Plotting the loss
    plt.subplot(2, 3, 1)
    plt.plot(history.history['loss'], label='Train')
    plt.plot(history.history['val_loss'], label='Validation')
    plt.title('Loss')
    plt.ylabel('Loss')
    plt.xlabel('Epoch')
    plt.legend()

    # Plotting the accuracy
    plt.subplot(2, 3, 2)
    plt.plot(history.history['accuracy'], label='Train')
    plt.plot(history.history['val_accuracy'], label='Validation')
    plt.title('Accuracy')
    plt.ylabel('Accuracy')
    plt.xlabel('Epoch')
    plt.legend()

    # Plotting the IOU metric
    plt.subplot(2, 3, 3)
    plt.plot(history.history['iou_metric'], label='Train')
    plt.plot(history.history['val_iou_metric'], label='Validation')
    plt.title('IOU')
    plt.ylabel('IOU')
    plt.xlabel('Epoch')
    plt.legend()

    # Plotting the precision
    plt.subplot(2, 3, 4)
    plt.plot(history.history['precision'], label='Train')
    plt.plot(history.history['val_precision'], label='Validation')
    plt.title('Precision')
    plt.ylabel('Precision')
    plt.xlabel('Epoch')
    plt.legend()

    # Plotting the recall
    plt.subplot(2, 3, 5)
    plt.plot(history.history['recall'], label='Train')
    plt.plot(history.history['val_recall'], label='Validation')
    plt.title('Recall')
    plt.ylabel('Recall')
    plt.xlabel('Epoch')
    plt.legend()

    # Plotting the F1 score
    plt.subplot(2, 3, 6)
    plt.plot(history.history['f1_score'], label='Train')
    plt.plot(history.history['val_f1_score'], label='Validation')
    plt.title('F1 Score')
    plt.ylabel('F1 Score')
    plt.xlabel('Epoch')
    plt.legend()

    # Plotting the COVR
    plt.subplot(2, 4, 7)
    plt.plot(history.history['coefficient_of_variation_of_coverage'], label='Treino')
    plt.plot(history.history['val_coefficient_of_variation_of_coverage'], label='Validação')
    plt.title('COVR')
    plt.ylabel('COVR')
    plt.xlabel('Época')
    plt.legend()

    plt.tight_layout()
    plt.show()

plot_metrics(history)

## Função de Pós-Processamento para Máscaras de Segmentação

Realização do pós-processamento das máscaras binárias geradas. O objetivo é suavizar, preencher quando possível e arredondar as bordas da máscara, melhorando a aparência visual das previsões e aumentando a precisão prática da segmentação.

### Parâmetros

- `mask (np.array)`: A máscara binária original predita pelo modelo.
- `kernel_size (int)`: O tamanho do kernel utilizado para as operações morfológicas. Um kernel maior intensifica os efeitos de erosão e dilatação.

### Processo

1. **Erosão**: A erosão é aplicada primeiro para eliminar pequenos ruídos e separar objetos que estão levemente conectados. Isso ajuda a clarificar a máscara e reduzir artefatos indesejados.

2. **Dilatação**: Após a erosão, a dilatação é aplicada para restaurar o tamanho dos objetos que foram erodidos, ao mesmo tempo que mantém as desconexões introduzidas pela erosão. Isso ajuda a preservar a integridade estrutural dos objetos na máscara, enquanto ainda suaviza as bordas.

<!-- ### Exemplo de Código

```python
import cv2
import numpy as np

def post_process_mask(mask, kernel_size=3):
    """
    Aplica erosão e dilatação para suavizar as bordas da máscara.
    """
    kernel = np.ones((kernel_size, kernel_size), np.uint8)
    erosion = cv2.erode(mask, kernel, iterations=1)
    dilation = cv2.dilate(erosion, kernel, iterations=1)
    return dilation -->


In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

def post_process_mask(mask, kernel_size=3):
    """
    Applies erosion followed by dilation to smooth the edges of the mask.

    Parameters:
    - mask: The input mask image.
    - kernel_size: The size of the kernel used for erosion and dilation. Default is 3.

    Returns:
    The processed mask image.
    """
    kernel = np.ones((kernel_size, kernel_size), np.uint8)
    erosion = cv2.erode(mask, kernel, iterations=1)
    dilation = cv2.dilate(erosion, kernel, iterations=1)
    return dilation

def plot_results(X, y, model, num_images=40):
    """
    Plots the image, real mask, predicted mask, and post-processed mask for a specified number of images.

    Parameters:
    - X (numpy.ndarray): Array of input images.
    - y (numpy.ndarray): Array of corresponding masks.
    - model: The trained model used for prediction.
    - num_images (int): Number of images to plot (default is 40).
    """
    for i in range(num_images):
        ix = np.random.randint(0, len(X))
        fig, ax = plt.subplots(1, 4, figsize=(27, 10))

        # Plotting the original image
        ax[0].imshow(X[ix], cmap='gray')
        ax[0].title.set_text('Original Image')
        ax[0].axis('off')

        # Plotting the real mask
        ax[1].imshow(y[ix].squeeze(), cmap='gray')
        ax[1].title.set_text('Real Mask')
        ax[1].axis('off')

        # Making the prediction mask and plotting
        pred = model.predict(X[ix:ix+1])
        pred = (pred > 0.5).astype(np.float32)
        ax[2].imshow(pred.squeeze(), cmap='gray')
        ax[2].title.set_text('Predicted Mask')
        ax[2].axis('off')

        # Applying post-processing to the predicted mask and plotting
        pred_processed = post_process_mask(pred.squeeze())
        ax[3].imshow(pred_processed, cmap='gray')
        ax[3].title.set_text('Post-processed Mask')
        ax[3].axis('off')

        plt.show()

plot_results(X_test, y_test, model)

## Função para recontrução da imagem 1200 x 1200

Não conseguimos implementar 100% essa etapa mas segue abaixo uma das tentativas de funções para resolver esse problema. Acreditamos que seja útil para futuros desenvolvimentos desse projeto.

In [None]:
# import Image

# # Função para fazer a predição em uma imagem cortada
# def predict_image(image_path, model):
#     image = Image.open(image_path).resize((1200, 1200))
#     image_array = np.array(image) / 255.0
#     image_array = np.expand_dims(image_array, axis=0)  # Adicionar batch dimension
#     prediction = model.predict(image_array)
#     prediction_image = np.squeeze(prediction)  # Remover batch dimension
#     prediction_image = (prediction_image * 255).astype(np.uint8)
#     return Image.fromarray(prediction_image)

# # Caminho para as partes cortadas da imagem
# image_parts_dir = '/content/drive/MyDrive/modulo10/data/cropped_images'

# # Obter lista de partes da imagem
# image_parts = sorted(os.listdir(image_parts_dir))

# # Inicializar uma imagem em branco para recompor a imagem completa
# image_size = 1200
# n_parts = int(np.sqrt(len(image_parts)))  # Supondo um corte quadrado das imagens
# full_image = Image.new('RGB', (image_size * n_parts, image_size * n_parts))

# # Recompor a imagem completa
# for i, part in enumerate(image_parts):
#     part_path = os.path.join(image_parts_dir, part)
#     prediction = predict_image(part_path, model)
#     x = (i % n_parts) * image_size
#     y = (i // n_parts) * image_size
#     full_image.paste(prediction, (x, y))

# # Salvar ou exibir a imagem completa com as predições
# full_image.save('/content/drive/MyDrive/modulo10/data/full_image_with_predictions.png')
# full_image.show()

## Instruções para Obtenção do Modelo

### Passo 1: Aquisição dos Dados
Os dados utilizados neste exemplo são imagens e máscaras que podem ser carregadas a partir de um diretório local ou de uma unidade do Google Drive. Certifique-se de que as imagens e as máscaras estejam no formato PNG e que as máscaras sejam imagens em escala de cinza (grayscale).


### Passo 2: Configuração do Ambiente
Para utilizar a GPU no Google Colab:

1. Vá para `Tempo de execução` ou `Runtime` no menu.
2. Selecione `Alterar tipo de tempo de execução` ou `Change runtime`.
3. Na janela que abrir, escolha `GPU` no menu suspenso `Acelerador de hardware`, recomendamos o uso da A100 pela capacidade mista de CPU e GPU.

Após realizar esses passos, a GPU será habilitada para o notebook.

### Passo 3: Preparação dos Dados
Os dados devem ser normalizados e divididos em conjuntos de treino e teste. As imagens são normalizadas para o intervalo [0, 1], e as máscaras são binarizadas (valores acima de 0.5 são considerados 1 e abaixo são 0).

### Passo 4: Treinamento do Modelo
O modelo U-Net com backbone VGG16 é treinado utilizando os dados preparados. Ajuste os hiperparâmetros como número de épocas, tamanho do lote e taxa de aprendizado conforme necessário.

### Passo 5: Avaliação do Modelo
Após o treinamento, o modelo é avaliado no conjunto de teste para medir seu desempenho. Métricas como a perda e a acurácia são plotadas para análise.


### Passo 6: Refinamento do Modelo
Se o desempenho do modelo não for satisfatório, existem as seguintes estratégias de refinamento:
1. **Ajuste de Hiperparâmetros:** Modificar a taxa de aprendizado (learning rate ou `lr`), o número de épocas (`epochs`), o tamanho do lote (`batch_size`), etc.
2. **Aumento de Dados (Data Augmentation):** Utilize técnicas de aumento de dados para gerar mais exemplos de treino, como rotações, zoom, translações, etc.
3. **Arquitetura do Modelo:** Modificar a arquitetura do modelo, adicionando mais camadas ou unidades.
4. **Regularização:** Adicionar camadas de Dropout ou ajuste a regularização L2 para evitar overfitting.
5. **Treinamento com Mais Dados:** Adicionar mais dados de treino para melhorar a generalização do modelo.

## Instruções para deploy em um serviço em nuvem

As seguintes instruções fornecem um guia para preparar, fazer upload e fazer o deploy do modelo de segmentação no AWS SageMaker.

### 1. Preparação do ambiente

Instale a AWS CLI e configure suas credenciais:

In [None]:
pip install awscli
aws configure

Instale o SDK do SageMaker:

In [None]:
pip install sagemaker

### 2. Preparar o notebook

Certifique-se que todas as dependências do notebook estão instaladas:

In [None]:
pip install numpy pandas scikit-learn matplotlib tensorflow

### 3. Preparação do modelo

Após o treinamento do modelo, salve-o no formato .h5:

In [None]:
model.save('segmentation_model.h5')

Após isso, carregue o arquivo do modelo salvo para um bucket no S3:

In [None]:
aws s3 cp segmentation_model.h5 s3://nome-do-bucket/modelos/segmentation_model.h5

### 4. Deploy no SageMaker

Crie um arquivo inference.py e coloque o seguinte código que contém a lógica de carregamento do modelo e inferência:

In [None]:
import json
import numpy as np
from tensorflow.keras.models import load_model

def model_fn(model_dir):
    model = load_model(f'{model_dir}/segmentation_model.h5')
    return model

def input_fn(request_body, request_content_type):
    if request_content_type == 'application/json':
        return np.array(json.loads(request_body)['instances'])
    else:
        raise ValueError('Esse modelo apenas suporta JSON')

def predict_fn(input_data, model):
    predictions = model.predict(input_data)
    return predictions

def output_fn(prediction, response_content_type):
    return json.dumps({'predições': prediction.tolist()})

Utilize o SDK do SageMaker para criar um endpoint para o modelo:

In [None]:
import sagemaker
from sagemaker.tensorflow import TensorFlowModel

sagemaker_session = sagemaker.Session()
role = 'arn:aws:iam::sua-conta:permissao/sagemaker-permissao'

model = TensorFlowModel(model_data='s3://nome-bucket/modelos/segmentation_model.h5',
                        role=role,
                        entry_point='inference.py',
                        framework_version='2.3',
                        sagemaker_session=sagemaker_session)

predictor = model.deploy(initial_instance_count=1,
                         instance_type='ml.m4.xlarge')

### 5. Teste e validação

Envie uma requisição de teste ao endpoint para garantir que tudo esteja funcionando corretamente:

In [None]:
import json
import numpy as np
import boto3

runtime = boto3.client('runtime.sagemaker')
payload = json.dumps({'instances': np.random.rand(1, 224, 224, 3).tolist()})

response = runtime.invoke_endpoint(EndpointName=predictor.endpoint_name,
                                   ContentType='application/json',
                                   Body=payload)

result = json.loads(response['Body'].read().decode())
print(result)

### 6. Limpeza

Para evitar custos desnecessários, remova os recursos quando terminar:

In [None]:
predictor.delete_endpoint()