# 📊 Análise Exploratória de Dados (EDA)

## FarmTech - Monitoramento de Máquinas Agrícolas

Este notebook realiza uma análise exploratória dos dados de sensores das máquinas agrícolas.

## 1. Configuração Inicial

In [None]:
# Importação de bibliotecas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path

# Configurações de exibição
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
plt.style.use('seaborn')
%matplotlib inline

## 2. Carregamento dos Dados

In [None]:
def carregar_dados():
    # Caminho para os dados
    data_dir = Path('..') / 'data' / 'raw'
    
    # Carregar os dados
    maquinas = pd.read_csv(data_dir / 'maquinas.csv')
    sensores = pd.read_csv(data_dir / 'sensores.csv')
    medicoes = pd.read_csv(data_dir / 'medicoes.csv')
    
    return maquinas, sensores, medicoes

# Carregar os dados
maquinas, sensores, medicoes = carregar_dados()

## 3. Análise Inicial dos Dados

In [None]:
# Visão geral dos dados
print("=== MÁQUINAS ===")
display(maquinas.info())
display(maquinas.head())

print("\n=== SENSORES ===")
display(sensores.info())
display(sensores.head())

print("\n=== MEDIÇÕES ===")
display(medicoes.info())
display(medicoes.head())

## 4. Análise Exploratória

In [None]:
# Estatísticas descritivas das medições
print("=== ESTATÍSTICAS DAS MEDIÇÕES ===")
display(medicoes.describe())

# Verificar valores nulos
print("\n=== VALORES NULOS ===")
display(medicoes.isnull().sum())

## 5. Visualizações

In [None]:
# Histograma das medições de temperatura
plt.figure(figsize=(10, 6))
sns.histplot(data=medicoes, x='temp', bins=30, kde=True)
plt.title('Distribuição de Temperatura')
plt.xlabel('Temperatura (°C)')
plt.ylabel('Contagem')
plt.show()

In [None]:
# Boxplot de temperatura por sensor
plt.figure(figsize=(12, 6))
sns.boxplot(data=medicoes, x='cd_sensor', y='temp')
plt.title('Distribuição de Temperatura por Sensor')
plt.xlabel('Sensor')
plt.ylabel('Temperatura (°C)')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 6. Próximos Passos

1. **Pré-processamento de Dados**
   - Tratamento de outliers
   - Normalização dos dados
   
2. **Engenharia de Features**
   - Criação de variáveis temporais
   - Agregações por período
   
3. **Modelagem**
   - Definição do problema
   - Seleção de algoritmos
   - Treinamento e validação