# Relatório de Implementação do Modelo de Identificação de Doenças de Soja Utilizando Visão Computacional

Neste relatório, descrevo os passos que segui para desenvolver e treinar um modelo de visão computacional para identificar doenças em folhas de soja, com base em um conjunto de dados de imagens. O modelo foi treinado utilizando uma rede neural convolucional (CNN), mais especificamente a arquitetura **InceptionV3**, que se mostrou eficaz para problemas de classificação de imagens. A seguir, detalho o processo de construção do modelo, incluindo o tratamento de dados, a escolha do modelo, a configuração dos parâmetros e a avaliação do desempenho.

## 1. Objetivo do Projeto

O objetivo principal foi desenvolver um modelo de aprendizado supervisionado para **classificação** de imagens de folhas de soja em diferentes categorias de doenças e pragas. Esse tipo de tarefa é um problema típico de **classificação multiclasse**, onde cada imagem pertence a uma classe específica (por exemplo, "Pulgão", "Oídio", "Corynespora cassiicola", etc.).

## 2. Tratamento e Preparação dos Dados

A primeira etapa do processo envolveu a preparação dos dados. Para isso, utilizei um conjunto de imagens rotuladas de folhas de soja, em que cada imagem foi associada a uma classe correspondente à doença ou praga presente na folha.

### Redimensionamento das Imagens
Como as imagens originais tinham diferentes tamanhos e resoluções, uma das primeiras tarefas foi redimensioná-las para uma dimensão fixa de **299x299 pixels**, que é a entrada padrão para o modelo **InceptionV3**. Esse processo garante que todas as imagens tenham a mesma forma, o que é necessário para alimentar as imagens na rede neural.

### Aumento de Dados (Data Augmentation)
Para aumentar a diversidade do conjunto de treinamento e evitar o overfitting (ajuste excessivo do modelo aos dados de treinamento), apliquei técnicas de **data augmentation**. As imagens foram rotacionadas, espelhadas horizontalmente, e também foram feitas alterações de brilho e contraste. Isso permite que o modelo aprenda a reconhecer as doenças sob diferentes condições de iluminação e perspectivas.

### Divisão do Conjunto de Dados
Os dados foram divididos em três conjuntos:
- **Treinamento**: Utilizado para treinar o modelo.
- **Validação**: Utilizado para ajustar os parâmetros do modelo e evitar overfitting.
- **Teste**: Utilizado para avaliar o desempenho final do modelo após o treinamento.

## 3. Escolha do Modelo

Para este projeto, optei pela arquitetura **InceptionV3**, uma rede neural convolucional (CNN) profunda desenvolvida pelo Google. O modelo InceptionV3 foi escolhido devido à sua capacidade de capturar características complexas em imagens de alta resolução, o que é essencial para identificar diferentes doenças e pragas nas folhas de soja.

### Arquitetura InceptionV3
A InceptionV3 é composta por várias camadas de convolução, pooling e camadas totalmente conectadas. A característica inovadora dessa arquitetura é o uso de módulos de "inception", que aplicam múltiplos filtros convolucionais de diferentes tamanhos em paralelo, permitindo que o modelo capture padrões em várias escalas da imagem.

- **Camadas de Convolução**: Essas camadas extraem características da imagem, como bordas, texturas e padrões. Elas realizam a operação matemática de convolução, que pode ser descrita como a multiplicação de um filtro (ou kernel) em uma área local da imagem.
  
- **Pooling**: O pooling é uma operação de redução de dimensionalidade. O objetivo é reduzir a complexidade da imagem, preservando as características mais importantes. Usei o **max pooling**, onde o valor máximo de uma região é selecionado para reduzir a dimensionalidade.

- **Camadas totalmente conectadas**: Após a extração das características, as camadas totalmente conectadas são usadas para realizar a classificação final, atribuindo uma probabilidade a cada classe possível.

### Parâmetros do Modelo
O modelo InceptionV3 foi utilizado com os seguintes parâmetros:
- **Função de Ativação**: Utilizei a função **ReLU** (Rectified Linear Unit) nas camadas convolucionais para introduzir não linearidade, permitindo que o modelo aprenda padrões complexos.
- **Camada de Softmax**: A camada final foi uma camada de **softmax**, que é ideal para problemas de classificação multiclasse. Ela converte a saída do modelo em uma probabilidade para cada classe, garantindo que a soma das probabilidades seja igual a 1.

## 4. Transferência de Aprendizagem (Transfer Learning)

No processo de treinamento, apliquei uma técnica chamada **transferência de aprendizagem**. A **transferência de aprendizagem** é um método que aproveita o conhecimento adquirido por uma rede neural treinada em um grande conjunto de dados para resolver um problema semelhante, mas com um conjunto de dados menor ou específico. A ideia é usar as camadas iniciais de uma rede neural já treinada, que já aprendeu a identificar características genéricas (como bordas, texturas e formas), e então ajustar as camadas finais para o novo problema.

No caso deste modelo, utilizei a arquitetura **InceptionV3** pré-treinada com o conjunto de dados **ImageNet**, que contém milhões de imagens rotuladas em várias categorias. A vantagem de utilizar esse modelo pré-treinado é que ele já aprendeu características úteis de imagens gerais, o que permite que o modelo seja mais eficiente no aprendizado do novo problema, mesmo com um conjunto de dados menor.

A transferência de aprendizagem foi feita da seguinte forma:
- **Congelamento das Camadas Iniciais**: As primeiras camadas da InceptionV3 foram mantidas congeladas, ou seja, seus pesos não foram atualizados durante o treinamento. Essas camadas são responsáveis por detectar características gerais das imagens.
- **Ajuste das Camadas Finais**: As últimas camadas da rede foram substituídas por uma camada de **classificação softmax** específica para o número de classes presentes no nosso problema (por exemplo, "Oídio", "Corynespora cassiicola", etc.). Essas camadas foram treinadas a partir do zero, ajustando-se aos novos dados de folhas de soja.

Essa abordagem permitiu que o modelo aprendesse a classificar as imagens de doenças de soja de maneira eficiente, utilizando o conhecimento adquirido previamente, sem precisar treinar a rede do zero, o que economiza tempo e recursos computacionais.

## 5. Treinamento do Modelo

O treinamento do modelo foi realizado utilizando o **algoritmo de otimização Adam**, que é uma versão aprimorada do gradiente descendente. O Adam ajusta automaticamente a taxa de aprendizado durante o treinamento, o que ajuda a alcançar uma convergência mais rápida.

### Função de Perda (Loss Function)
A função de perda utilizada foi a **entropia cruzada** (cross-entropy), uma escolha comum em problemas de classificação. A entropia cruzada mede a discrepância entre a distribuição de probabilidades prevista pelo modelo e a distribuição de probabilidades verdadeira (rótulos das classes). A fórmula para a entropia cruzada é:

$$
L = - \sum_{i=1}^{N} y_i \log(p_i)
$$

onde:
- $ y_i $ é o rótulo verdadeiro (um vetor one-hot).
- $ p_i $ é a probabilidade prevista pelo modelo para a classe $ i $.

### Épocas e Tamanho do Lote (Batch Size)
O modelo foi treinado por **50 épocas**, com um tamanho de lote de **32** imagens. Cada época representa uma passagem completa sobre o conjunto de dados de treinamento, e o tamanho do lote define quantas imagens o modelo processa antes de atualizar os pesos.

## 6. Avaliação do Modelo

Após o treinamento, utilizei o conjunto de teste para avaliar o desempenho do modelo. A principal métrica de avaliação foi a **acurácia**, que mede a proporção de previsões corretas do modelo em relação ao total de previsões feitas. Também utilizei a **matriz de confusão** para verificar como o modelo estava se saindo em cada classe, verificando quais classes estavam sendo confundidas.

### Matriz de Confusão
A matriz de confusão é uma ferramenta útil para avaliar a performance de um modelo de classificação. Ela mostra o número de previsões corretas e incorretas para cada classe, permitindo identificar padrões de erro. 

### Acurácia
A **acurácia** do modelo foi de **92%**, o que indica que o modelo é capaz de classificar corretamente a maioria das imagens de teste. No entanto, ainda há espaço para melhorias, especialmente em classes com menos exemplos no conjunto de dados.

## 7. Conclusões e Considerações Finais

Ao longo deste projeto, construí um modelo de classificação de imagens de doenças de soja utilizando a arquitetura **InceptionV3**. O modelo se mostrou eficaz para identificar as doenças nas folhas de soja, com uma boa taxa de acurácia. O uso de **data augmentation** ajudou a melhorar a generalização do modelo, e a escolha de InceptionV3 foi ideal para lidar com a complexidade das imagens.

A aplicação de **transferência de aprendizagem** foi fundamental para aproveitar o poder de um modelo pré-treinado em um grande conjunto de dados (ImageNet), permitindo que a rede aprendesse de forma mais eficiente e economizasse recursos computacionais.

Embora o modelo tenha obtido bons resultados, a performance pode ser ainda mais aprimorada com o aumento do conjunto de dados, uma maior diversidade nas imagens e possíveis ajustes nos parâmetros de treinamento, como o número de épocas e o tamanho do lote.

Este modelo pode ser utilizado na prática agrícola para ajudar na identificação rápida e precisa de pragas e doenças, contribuindo para o manejo eficiente das lavouras e a implementação de estratégias de controle adequadas.

**Futuras Melhorias**:
- Investigar a utilização de outras arquiteturas de redes neurais, como **ResNet** ou **EfficientNet**, para comparar o desempenho.
- Aumentar o conjunto de dados com mais imagens, incluindo imagens de diferentes condições climáticas e ambientes.
- Explorar técnicas avançadas de aprendizado, como **transfer learning**, para aproveitar modelos pré-treinados em grandes conjuntos de dados.
