# üìä An√°lise Explorat√≥ria de Dados (EDA)

## FarmTech - Monitoramento de M√°quinas Agr√≠colas

Este notebook realiza uma an√°lise explorat√≥ria dos dados de sensores das m√°quinas agr√≠colas.

## 1. Configura√ß√£o Inicial

In [None]:
# Importa√ß√£o de bibliotecas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path

# Configura√ß√µes de exibi√ß√£o
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
plt.style.use('seaborn')
%matplotlib inline

## 2. Carregamento dos Dados

In [None]:
def carregar_dados():
    # Caminho para os dados
    data_dir = Path('..') / 'data' / 'raw'
    
    # Carregar os dados
    maquinas = pd.read_csv(data_dir / 'maquinas.csv')
    sensores = pd.read_csv(data_dir / 'sensores.csv')
    medicoes = pd.read_csv(data_dir / 'medicoes.csv')
    
    return maquinas, sensores, medicoes

# Carregar os dados
maquinas, sensores, medicoes = carregar_dados()

## 3. An√°lise Inicial dos Dados

In [None]:
# Vis√£o geral dos dados
print("=== M√ÅQUINAS ===")
display(maquinas.info())
display(maquinas.head())

print("\n=== SENSORES ===")
display(sensores.info())
display(sensores.head())

print("\n=== MEDI√á√ïES ===")
display(medicoes.info())
display(medicoes.head())

## 4. An√°lise Explorat√≥ria

In [None]:
# Estat√≠sticas descritivas das medi√ß√µes
print("=== ESTAT√çSTICAS DAS MEDI√á√ïES ===")
display(medicoes.describe())

# Verificar valores nulos
print("\n=== VALORES NULOS ===")
display(medicoes.isnull().sum())

## 5. Visualiza√ß√µes

In [None]:
# Histograma das medi√ß√µes de temperatura
plt.figure(figsize=(10, 6))
sns.histplot(data=medicoes, x='temp', bins=30, kde=True)
plt.title('Distribui√ß√£o de Temperatura')
plt.xlabel('Temperatura (¬∞C)')
plt.ylabel('Contagem')
plt.show()

In [None]:
# Boxplot de temperatura por sensor
plt.figure(figsize=(12, 6))
sns.boxplot(data=medicoes, x='cd_sensor', y='temp')
plt.title('Distribui√ß√£o de Temperatura por Sensor')
plt.xlabel('Sensor')
plt.ylabel('Temperatura (¬∞C)')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 6. Pr√≥ximos Passos

1. **Pr√©-processamento de Dados**
   - Tratamento de outliers
   - Normaliza√ß√£o dos dados
   
2. **Engenharia de Features**
   - Cria√ß√£o de vari√°veis temporais
   - Agrega√ß√µes por per√≠odo
   
3. **Modelagem**
   - Defini√ß√£o do problema
   - Sele√ß√£o de algoritmos
   - Treinamento e valida√ß√£o