- Descrição do Projeto
- Objetivos do Projeto
- Tecnologias e Ferramentas
- Impacto e Aplicações
- Vídeos de Demonstração
- Notebook Jupyter
- Estrutura de Pastas
- Como Executar o Código
- Licença
Este projeto representa a Fase 5 do nosso curso, onde atuamos como consultores da FarmTech Solutions, uma empresa especializada em soluções de Inteligência Artificial para o setor agrícola. Nossa missão é desenvolver modelos preditivos e análises de tendências para uma fazenda de médio porte (aproximadamente 200 hectares) que cultiva diversas culturas.
feedback do professor Pontos positivos: A análise exploratória dos dados foi bem feita, com gráficos claros, descrição das variáveis e identificação de padrões. A aplicação de clusterização (KMeans) foi implementada corretamente, com visualização dos clusters e comentários sobre possíveis tendências. Foram construídos cinco modelos preditivos distintos, com comparação por métricas como R², MAE e MSE. O código Python está bem organizado, com boas práticas, comentários explicativos e estrutura de Markdown para guiar a leitura. Sobre o ir alem:Boa documentação e desenvolvimento do esquematico elétrico. Código bem estruturado e dividido nas pastas. Criação do Front End A Entrega 2 foi executada com qualidade: Os custos foram estimados de forma detalhada, com uso da AWS Pricing Calculator, comparando São Paulo (US$ 12,49/mês) e Virgínia do Norte (US$ 7,07/mês). O documento mostra o uso de instância t4g.micro e 50GB de EBS, atendendo exatamente aos requisitos da proposta. A justificativa é sólida, considerando: A latência mais baixa ao hospedar no Brasil. A necessidade de conformidade com a LGPD, especialmente em se tratando de dados sensíveis. O equilíbrio entre custo e desempenho, defendendo tecnicamente a escolha por São Paulo, mesmo com valor superior. A conclusão é clara, com uma recomendação alinhada às boas práticas de computação em nuvem para aplicações sensíveis e geograficamente localizadas. Pontos de melhoria: Nenhum ponto relevante foi identificado. A entrega está completa e de alta qualidade.
Parabéns pelo trabalho! O projeto cobre com excelência todos os pontos solicitados: desde a modelagem de dados com análise e previsão de rendimento agrícola, até a justificativa técnica e legal para a escolha da infraestrutura em nuvem. A decisão final foi bem fundamentada e comunicada de maneira clara e profissional. Um projeto maduro, com ótima aplicabilidade e pronto para ser usado em portfólio ou como case real de aplicação de IA no agronegócio.
O projeto está estruturado em duas entregas principais:
Entrega 1: Análise Preditiva de Rendimento de Safras
- Realizamos uma análise exploratória completa do conjunto de dados "crop_yield.csv", que contém informações sobre condições climáticas e rendimento de diferentes culturas.
- Aplicamos técnicas de clusterização para identificar tendências nos rendimentos das plantações e detectar possíveis outliers.
- Desenvolvemos cinco modelos preditivos utilizando diferentes algoritmos de regressão supervisionada para prever o rendimento das safras com base em variáveis como precipitação, umidade específica, umidade relativa e temperatura.
- Avaliamos o desempenho dos modelos utilizando métricas relevantes e identificamos o algoritmo mais eficaz para este cenário específico.
Entrega 2: Infraestrutura de Computação em Nuvem
- Realizamos uma análise comparativa de custos utilizando a calculadora da AWS para hospedar nossa solução de Machine Learning.
- Comparamos os valores entre as regiões de São Paulo (Brasil) e Virgínia do Norte (EUA) para uma máquina Linux com configurações específicas (2 CPUs, 1 GiB de memória, até 5 Gigabit de rede e 50 GB de armazenamento).
- Avaliamos as implicações legais e técnicas relacionadas ao armazenamento de dados no exterior versus localmente.
- Justificamos nossa escolha de infraestrutura considerando fatores como custo, desempenho e conformidade regulatória.
Para o desenvolvimento deste projeto, utilizamos:
- Python como linguagem principal de programação
- Bibliotecas de ciência de dados: Pandas, NumPy, Scikit-learn
- Ferramentas de visualização: Matplotlib, Seaborn
- Jupyter Notebook para documentação e execução do código
- AWS para análise de infraestrutura em nuvem
Nossa solução permite que a fazenda:
- Otimize o planejamento de plantio com base em previsões precisas de rendimento
- Identifique condições ideais para maximizar a produtividade de diferentes culturas
- Tome decisões baseadas em dados sobre alocação de recursos e investimentos
- Reduza custos operacionais através de uma infraestrutura em nuvem otimizada
Este projeto demonstra como a combinação de Machine Learning e Computação em Nuvem pode transformar práticas agrícolas tradicionais, promovendo uma agricultura mais eficiente, sustentável e lucrativa.
Nota: Os detalhes completos da implementação, resultados e análises estão disponíveis no notebook Jupyter associado a este repositório.
Dentre os arquivos e pastas presentes na raiz do projeto, definem-se:
-
.github: Nesta pasta ficarão os arquivos de configuração específicos do GitHub que ajudam a gerenciar e automatizar processos no repositório.
-
assets: aqui estão os arquivos relacionados a elementos não-estruturados deste repositório, como imagens.
-
config: Posicione aqui arquivos de configuração que são usados para definir parâmetros e ajustes do projeto.
-
document: aqui estão todos os documentos do projeto que as atividades poderão pedir. Na subpasta "other", adicione documentos complementares e menos importantes.
-
scripts: Posicione aqui scripts auxiliares para tarefas específicas do seu projeto. Exemplo: deploy, migrações de banco de dados, backups.
-
src: Todo o código fonte criado para o desenvolvimento do projeto ao longo das 7 fases.
-
README.md: arquivo que serve como guia e explicação geral sobre o projeto (o mesmo que você está lendo agora).
Para executar este projeto, você precisará ter instalado:
- Python 3.8 ou superior
- Jupyter Notebook ou JupyterLab
- Git (para clonar o repositório)
As seguintes bibliotecas Python são necessárias para executar o notebook:
pandas==1.5.3
numpy==1.24.3
scikit-learn==1.2.2
matplotlib==3.7.1
seaborn==0.12.2
Clique aqui para verificar as estimativas da AWS
AWS Pricing Calculator Ederson Badeca.pdf - Documento PDF com detalhes da análise de custos
AWS Technical Decision - Documento com justificativa técnica da escolha da infraestrutura AWS
-
Clone este repositório:
git clone https://github.com/seu-usuario/nome-do-repositorio.git cd nome-do-repositorio -
Instale as dependências:
pip install -r requirements.txt -
Acesse o notebook Jupyter:
-
Execute o notebook:
jupyter notebook src/EdersonBadeca_rm560204_pbl_fase5.ipynbOu se preferir usar JupyterLab:
jupyter lab src/EdersonBadeca_rm560204_pbl_fase5.ipynb -
Execute todas as células do notebook sequencialmente para reproduzir a análise completa.
O notebook está organizado nas seguintes seções:
- Introdução e carregamento dos dados: Apresentação do problema e importação do dataset.
- Análise exploratória de dados: Visualizações e estatísticas descritivas.
- Clusterização para identificação de tendências: Aplicação de algoritmos não supervisionados.
- Modelos preditivos: Implementação de cinco algoritmos de regressão diferentes.
- Avaliação de modelos: Comparação de desempenho entre os modelos.
- Conclusões: Resumo dos resultados e insights obtidos.
O arquivo de dados crop_yield.csv está localizado na pasta data/ e contém informações sobre condições climáticas e rendimento de diferentes culturas agrícolas.
Os resultados da análise, incluindo gráficos e métricas de desempenho dos modelos, são gerados durante a execução do notebook.
MODELO GIT FIAP por Fiap está licenciado sobre Attribution 4.0 International.

