In [None]:
# -*- coding: utf-8 -*-
"""
Notebook: Todos os Exerc√≠cios do Tutorial
Tutorial 2: Ci√™ncia de Dados Aplicada √† Engenharia Agr√≠cola ‚Äì UFV

Objetivo: Reunir todos os exerc√≠cios do curso com solu√ß√µes completas e comentadas.
"""

# %% Importar bibliotecas necess√°rias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
from scipy.stats import ttest_ind
import warnings
warnings.filterwarnings("ignore")

print("‚úÖ Bibliotecas carregadas. Vamos come√ßar!")

In [None]:
# %% [markdown]
# **Exerc√≠cio 1: Manipula√ß√£o de arrays NumPy ‚Äì Umidade do solo**
#
# Objetivo: Criar um array 5x7 com dados de umidade do solo (8‚Äì25%) e calcular:
# a) M√©dia di√°ria
# b) Profundidade com maior varia√ß√£o
# c) Dias com m√©dia geral abaixo de 12%
#
# Aplica√ß√£o: an√°lise de perfis de umidade em campo

# Dados simulados: 5 profundidades x 7 dias
np.random.seed(42)
umidade = np.random.uniform(8, 25, size=(5, 7))

# a) M√©dia di√°ria (por coluna)
media_diaria = umidade.mean(axis=0)

# b) Profundidade com maior varia√ß√£o (por linha)
var_profundidade = umidade.var(axis=1)
prof_maior_var = np.argmax(var_profundidade)  # √≠ndice da profundidade

# c) Dias com m√©dia geral < 12%
media_geral_dia = umidade.mean(axis=0)
dias_criticos = np.where(media_geral_dia < 12)[0]

print("üîç Resultados - Exerc√≠cio 1")
print(f"M√©dia di√°ria: {media_diaria}")
print(f"Profundidade com maior varia√ß√£o: {prof_maior_var} (√≠ndice)")
print(f"Dias com m√©dia < 12%: {dias_criticos}")

In [None]:
# %% [markdown]
# **Exerc√≠cio 2: Filtros e m√°scaras com NumPy ‚Äì Temperatura do ar**
#
# Objetivo: Dado um array 24x7 com temperaturas hor√°rias:
# a) Encontre os dias com mais de 5h acima de 32¬∞C
# b) Calcule a amplitude t√©rmica di√°ria
# c) Identifique o hor√°rio m√©dio de pico de temperatura
#
# Aplica√ß√£o: avalia√ß√£o de estresse t√©rmico em culturas

# Dados simulados
np.random.seed(43)
temp_horario = np.random.normal(28, 4, size=(24, 7))  # 24h x 7 dias

# a) Dias com >5h acima de 32¬∞C
acima_32 = temp_horario > 32
horas_por_dia = acima_32.sum(axis=0)
dias_criticos = np.where(horas_por_dia > 5)[0]

# b) Amplitude t√©rmica di√°ria
amp_diaria = temp_horario.max(axis=0) - temp_horario.min(axis=0)

# c) Hor√°rio m√©dio de pico
horario_pico = np.argmax(temp_horario, axis=0)
hora_media_pico = np.mean(horario_pico)

print("üîç Resultados - Exerc√≠cio 2")
print(f"Dias com >5h >32¬∞C: {dias_criticos}")
print(f"Amplitude t√©rmica m√©dia: {amp_diaria.mean():.2f} ¬∞C")
print(f"Hor√°rio m√©dio de pico: {hora_media_pico:.1f} h")

In [None]:
# %% [markdown]
# **Exerc√≠cio 3: Leitura e filtragem com Pandas ‚Äì Precipita√ß√£o**
#
# Objetivo: Ler dados de precipita√ß√£o e:
# a) Filtrar dias com chuva > 15 mm
# b) Selecionar apenas a esta√ß√£o "Campo A"
# c) Criar m√©dia m√≥vel de 3 dias
#
# Aplica√ß√£o: an√°lise de risco de encharcamento

# Dados simulados
np.random.seed(44)
datas = pd.date_range("2024-01-01", periods=100)
df_chuva = pd.DataFrame({
    'data': datas,
    'estacao': np.random.choice(['Campo A', 'Campo B', 'Laborat√≥rio'], 100),
    'chuva_mm': np.random.exponential(6, 100).clip(0, 50)
})

# a) Chuva > 15 mm
chuva_alta = df_chuva[df_chuva['chuva_mm'] > 15]

# b) Esta√ß√£o "Campo A"
campo_a = df_chuva[df_chuva['estacao'] == 'Campo A']

# c) M√©dia m√≥vel de 3 dias
df_chuva['media_movel_3d'] = df_chuva['chuva_mm'].rolling(3, min_periods=1).mean()

print("üîç Resultados - Exerc√≠cio 3")
print(f"Dias com chuva >15 mm: {len(chuva_alta)}")
print(f"Dados da esta√ß√£o Campo A: {len(campo_a)} linhas")
print("Primeiras 5 m√©dias m√≥veis:")
print(df_chuva[['chuva_mm', 'media_movel_3d']].head())

In [None]:
# %% [markdown]
# **Exerc√≠cio 4: Limpeza de dados com Pandas ‚Äì Vaz√£o de irriga√ß√£o**
#
# Objetivo: Dado um DataFrame com 10% de NaN:
# a) Preencher com m√©dia m√≥vel de 3 pontos
# b) Remover linhas com press√£o < 0.5 bar
# c) Criar coluna com total di√°rio de √°gua
#
# Aplica√ß√£o: tratamento de falhas em sensores de irriga√ß√£o

# Dados simulados
np.random.seed(45)
vazao = np.random.normal(2.0, 0.3, 50)
vazao[np.random.choice(50, 5, replace=False)] = np.nan  # 10% NaN
df_irr = pd.DataFrame({
    'data': pd.date_range("2024-01-01", periods=50, freq='H'),
    'press√£o_bar': np.random.normal(2.0, 0.5, 50).clip(0.2, 3.0),
    'vazao_lh': vazao
})

# a) Preencher NaN com m√©dia m√≥vel
df_irr['vazao_lh'] = df_irr['vazao_lh'].fillna(df_irr['vazao_lh'].rolling(3, min_periods=1).mean())

# b) Remover press√£o < 0.5 bar
df_irr = df_irr[df_irr['press√£o_bar'] >= 0.5]

# c) Total di√°rio de √°gua (m¬≥/dia)
df_irr['data_dia'] = df_irr['data'].dt.date
total_diario = df_irr.groupby('data_dia')['vazao_lh'].sum() * 3.6 / 1000  # L/h ‚Üí m¬≥/dia

print("üîç Resultados - Exerc√≠cio 4")
print(f"Total di√°rio m√©dio: {total_diario.mean():.2f} m¬≥/dia")
print(f"Dados remanescentes: {len(df_irr)} linhas")

In [None]:
# %% [markdown]
# **Exerc√≠cio 5: Agrega√ß√£o com Pandas ‚Äì Consumo de tratores**
#
# Objetivo: Analisar dados de tratores:
# a) Calcule consumo m√©dio por modelo
# b) Combine com tabela de manuten√ß√£o
# c) Crie pivot table por modelo e turno
#
# Aplica√ß√£o: an√°lise de efici√™ncia operacional

# Dados principais
modelos = ['Valtra 120', 'Massey 285', 'John Deere 5075']
df_trator = pd.DataFrame({
    'modelo': np.random.choice(modelos, 100),
    'turno': np.random.choice(['manh√£', 'tarde', 'noite'], 100),
    'consumo_lh': np.random.normal(9, 1, 100)
})

# Tabela de manuten√ß√£o (simulada)
df_mant = pd.DataFrame({
    'modelo': modelos,
    'ult_manutencao': ['2024-01-15', '2024-02-10', '2024-01-30']
})

# a) Consumo m√©dio por modelo
consumo_medio = df_trator.groupby('modelo')['consumo_lh'].mean()

# b) Merge com manuten√ß√£o
df_completo = pd.merge(df_trator, df_mant, on='modelo', how='left')

# c) Pivot table
pivot = pd.pivot_table(df_trator, values='consumo_lh', index='modelo', columns='turno', aggfunc='mean')

print("üîç Resultados - Exerc√≠cio 5")
print("Consumo m√©dio por modelo:")
print(consumo_medio.round(2))
print("\nPivot table (consumo por turno):")
print(pivot.round(2))

In [None]:
# %% [markdown]
# **Exerc√≠cio 6: Visualiza√ß√£o ‚Äì Umidade do solo em profundidades**
#
# Objetivo: Plote umidade em 4 profundidades ao longo do tempo com:
# a) Linhas com cores diferentes
# b) T√≠tulo e r√≥tulos
# c) Salvar como PDF
#
# Aplica√ß√£o: monitoramento de sensores de umidade

# Dados simulados
tempo = np.arange(10)
profundidades = ['0-10cm', '10-20cm', '20-30cm', '30-40cm']
dados_umidade = np.array([20-2*t + np.random.normal(0,1,10) for t in range(4)])

plt.figure(figsize=(10, 6))
for i, prof in enumerate(profundidades):
    plt.plot(tempo, dados_umidade[i], label=prof, linewidth=2)

plt.title('Evolu√ß√£o da Umidade do Solo em Diferentes Profundidades', fontsize=14)
plt.xlabel('Tempo (dias)')
plt.ylabel('Umidade (%)')
plt.legend(title='Profundidade')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.savefig('umidade_solo.pdf', dpi=300, bbox_inches='tight')  # Salva como PDF
plt.show()

print("‚úÖ Gr√°fico salvo como 'umidade_solo.pdf'")

In [None]:
# %% [markdown]
# **Exerc√≠cio 6: Visualiza√ß√£o ‚Äì Umidade do solo em profundidades**
#
# Objetivo: Plote umidade em 4 profundidades ao longo do tempo com:
# a) Linhas com cores diferentes
# b) T√≠tulo e r√≥tulos
# c) Salvar como PDF
#
# Aplica√ß√£o: monitoramento de sensores de umidade

# Dados simulados
tempo = np.arange(10)
profundidades = ['0-10cm', '10-20cm', '20-30cm', '30-40cm']
dados_umidade = np.array([20-2*t + np.random.normal(0,1,10) for t in range(4)])

plt.figure(figsize=(10, 6))
for i, prof in enumerate(profundidades):
    plt.plot(tempo, dados_umidade[i], label=prof, linewidth=2)

plt.title('Evolu√ß√£o da Umidade do Solo em Diferentes Profundidades', fontsize=14)
plt.xlabel('Tempo (dias)')
plt.ylabel('Umidade (%)')
plt.legend(title='Profundidade')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.savefig('umidade_solo.pdf', dpi=300, bbox_inches='tight')  # Salva como PDF
plt.show()

print("‚úÖ Gr√°fico salvo como 'umidade_solo.pdf'")

In [None]:
# %% [markdown]
# **Exerc√≠cio 7: Boxplot e histograma ‚Äì Di√¢metro de frutos**
#
# Objetivo: Compare 3 tratamentos de irriga√ß√£o com:
# a) Boxplot
# b) Histograma sobreposto
# c) Barras com erro padr√£o
#
# Aplica√ß√£o: classifica√ß√£o de frutos por tamanho

# Dados simulados
trat_a = np.random.normal(5.0, 0.8, 30)  # mm
trat_b = np.random.normal(6.2, 0.9, 30)
trat_c = np.random.normal(5.8, 0.7, 30)

# a) Boxplot
plt.figure(figsize=(12, 4))
plt.subplot(1, 3, 1)
plt.boxplot([trat_a, trat_b, trat_c], labels=['A', 'B', 'C'])
plt.title('Boxplot')

# b) Histograma sobreposto
plt.subplot(1, 3, 2)
plt.hist(trat_a, alpha=0.6, label='A', bins=8)
plt.hist(trat_b, alpha=0.6, label='B', bins=8)
plt.hist(trat_c, alpha=0.6, label='C', bins=8)
plt.title('Histograma')
plt.legend()

# c) Barras com erro
medias = [trat_a.mean(), trat_b.mean(), trat_c.mean()]
erros = [trat_a.std(), trat_b.std(), trat_c.std()]
plt.subplot(1, 3, 3)
plt.bar(['A','B','C'], medias, yerr=erros, capsize=5, color=['C0','C1','C2'])
plt.title('M√©dia com erro')
plt.tight_layout()
plt.show()

In [None]:
# %% [markdown]
# **Exerc√≠cio 8: An√°lise explorat√≥ria ‚Äì Evapotranspira√ß√£o**
#
# Objetivo: Analise ETc de 3 culturas:
# a) Plote evolu√ß√£o temporal
# b) Calcule correla√ß√£o com radia√ß√£o
# c) Gere boxplot comparativo
#
# Aplica√ß√£o: planejamento de irriga√ß√£o

# %% Dados simulados
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

datas = pd.date_range("2024-01-01", periods=90)
culturas = np.random.choice(['milho', 'feijao', 'soja'], 90)

# Dicion√°rio de m√©dias por cultura
medias_et = {'milho': 3.2, 'feijao': 2.1, 'soja': 2.8}

# Gerar ETc com base na cultura
etcs = [np.random.normal(medias_et[cultura], 0.3) for cultura in culturas]

df_et = pd.DataFrame({
    'data': datas,
    'cultura': culturas,
    'ETc': etcs,
    'radiacao': np.random.normal(25, 5, 90)  # dados de radia√ß√£o
})

# %% a) Evolu√ß√£o temporal
df_pivot = df_et.pivot(index='data', columns='cultura', values='ETc')
df_pivot.plot(title='Evapotranspira√ß√£o das culturas', xlabel='Data', ylabel='ETc (mm/dia)')
plt.show()

# %% b) Correla√ß√£o entre ETc e radia√ß√£o
corr = df_et['ETc'].corr(df_et['radiacao'])
print(f"Correla√ß√£o ETc vs. radia√ß√£o: {corr:.3f}")

# %% c) Boxplot comparativo
df_et.boxplot(column='ETc', by='cultura', grid=False)
plt.suptitle('')
plt.title('Distribui√ß√£o de ETc por cultura')
plt.show()

In [None]:
# %% [markdown]
# **Exerc√≠cio 9: Teste estat√≠stico ‚Äì Rendimento de gr√£os**
#
# Objetivo: Compare dois sistemas de plantio:
# a) Teste t independente
# b) Calcule tamanho do efeito (Cohen's d)
# c) Interprete p-valor
#
# Aplica√ß√£o: valida√ß√£o de tratamentos experimentais

# Dados simulados
sistema_a = np.random.normal(3.2, 0.4, 30)  # Plantio direto
sistema_b = np.random.normal(3.0, 0.5, 30)  # Convencional

# a) Teste t
t, p = ttest_ind(sistema_a, sistema_b)

# b) Cohen's d
mean_diff = sistema_a.mean() - sistema_b.mean()
pooled_std = np.sqrt(((len(sistema_a)-1)*sistema_a.std()**2 + (len(sistema_b)-1)*sistema_b.std()**2) / (len(sistema_a)+len(sistema_b)-2))
cohens_d = mean_diff / pooled_std

print("üîç Resultados - Exerc√≠cio 9")
print(f"Teste t: t={t:.2f}, p={p:.4f}")
print(f"Cohen's d: {cohens_d:.3f}")
print("Interpreta√ß√£o:", "Diferen√ßa significativa" if p < 0.05 else "Sem diferen√ßa significativa")
if cohens_d > 0.8:
    print("‚Üí Tamanho do efeito grande (relev√¢ncia pr√°tica)")

In [None]:
# %% [markdown]
# **Exerc√≠cio 10: Ajuste de curva ‚Äì Secagem de gr√£os**
#
# Objetivo: Ajuste modelo log√≠stico √† curva de crescimento
# a) Defina a fun√ß√£o log√≠stica
# b) Ajuste com curve_fit
# c) Plote dados e curva
#
# Aplica√ß√£o: modelagem de crescimento de mudas

# Dados simulados
tempo = np.linspace(0, 10, 11)
altura = 40 / (1 + np.exp(-1.2*(tempo-5))) + np.random.normal(0, 1, len(tempo))

# a) Modelo log√≠stico
def modelo_logistico(t, K, r, t0):
    return K / (1 + np.exp(-r * (t - t0)))

# b) Ajuste
params, _ = curve_fit(modelo_logistico, tempo, altura)

# c) Plot
plt.figure(figsize=(8, 5))
plt.scatter(tempo, altura, label='Dados', color='red')
plt.plot(tempo, modelo_logistico(tempo, *params), 'b-', label='Ajuste')
plt.xlabel('Tempo (dias)')
plt.ylabel('Altura (cm)')
plt.title('Ajuste de Modelo Log√≠stico √† Curva de Crescimento')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

print("Par√¢metros ajustados:")
print(f"K (capacidade): {params[0]:.2f} cm")
print(f"r (taxa): {params[1]:.2f} dia‚Åª¬π")
print(f"t0 (ponto de inflex√£o): {params[2]:.2f} dias")

In [None]:
# -*- coding: utf-8 -*-
"""
Notebook: Exerc√≠cio 11 ‚Äì An√°lise de sistema de irriga√ß√£o por gotejamento
Curso: Ci√™ncia de Dados para Engenharia Agr√≠cola ‚Äì UFV
Corre√ß√£o: Gera√ß√£o correta de dados por grupo para evitar vieses
"""

# %% Importar bibliotecas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# %% Dados simulados por tratamento (corrigido)
np.random.seed(42)
n_por_tratamento = 30  # 30 linhas por tratamento
tratamentos = ['Baixa press√£o', 'M√©dia press√£o', 'Alta press√£o']

# Listas para armazenar os dados
pressao_list = []
vazao_list = []
uniformidade_list = []
tratamento_list = []

# Par√¢metros por tratamento
parametros = {
    'Baixa press√£o': {'press√£o': 1.0, 'vazao': 1.5, 'uniformidade': 75},
    'M√©dia press√£o': {'press√£o': 2.0, 'vazao': 2.0, 'uniformidade': 85},
    'Alta press√£o': {'press√£o': 3.0, 'vazao': 2.3, 'uniformidade': 80}
}

# Gerar dados para cada tratamento
for trat in tratamentos:
    n = n_por_tratamento
    p = parametros[trat]
    
    pressao = np.random.normal(p['press√£o'], 0.3, n)
    vazao = np.random.normal(p['vazao'], 0.2, n)
    uniformidade = np.random.normal(p['uniformidade'], 5, n).clip(60, 95)
    
    # Estender listas
    tratamento_list.extend([trat] * n)
    pressao_list.extend(pressao)
    vazao_list.extend(vazao)
    uniformidade_list.extend(uniformidade)

# Criar DataFrame
df = pd.DataFrame({
    'tratamento': tratamento_list,
    'press√£o_bar': pressao_list,
    'vazao_lh': vazao_list,
    'uniformidade_%': uniformidade_list
})

# Adicionar data (simulada)
df['data'] = pd.date_range("2024-01-01", periods=len(df), freq='D')

# Embaralhar o DataFrame para simular ordem real de coleta
df = df.sample(frac=1, random_state=42).reset_index(drop=True)

# %% 1. Limpeza de dados
print("üîç Etapa 1: Limpeza de dados")
print(f"Total de linhas: {len(df)}")
print(f"Valores faltantes:\n{df.isna().sum()}")

# %% 2. An√°lise estat√≠stica por tratamento
print("\nüìä Etapa 2: An√°lise por tratamento")
analise = df.groupby('tratamento').agg({
    'press√£o_bar': ['mean', 'std'],
    'vazao_lh': ['mean', 'std'],
    'uniformidade_%': ['mean', 'std']
}).round(2)
print(analise)

# %% 3. Visualiza√ß√£o
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 5))

# Boxplot de uniformidade
df.boxplot(column='uniformidade_%', by='tratamento', ax=ax1, grid=False)
ax1.set_title('Uniformidade por tratamento')
ax1.set_ylabel('Uniformidade (%)')
ax1.set_xlabel('')

# Scatter: vaz√£o vs press√£o
cores = {'Baixa press√£o': 'C0', 'M√©dia press√£o': 'C1', 'Alta press√£o': 'C2'}
for trat in tratamentos:
    subset = df[df['tratamento'] == trat]
    ax2.scatter(subset['press√£o_bar'], subset['vazao_lh'], 
                label=f'{trat} (n={n_por_tratamento})', 
                alpha=0.7, color=cores[trat], edgecolor='k', s=60)

ax2.set_xlabel('Press√£o (bar)')
ax2.set_ylabel('Vaz√£o (L/h)')
ax2.set_title('Rela√ß√£o Press√£o vs Vaz√£o')
ax2.legend(title='Tratamento', fontsize=9)
ax2.grid(True, alpha=0.3)

plt.suptitle('An√°lise de Sistema de Irriga√ß√£o por Gotejamento', fontsize=14, y=1.02)
plt.tight_layout()
plt.show()

# %% 4. Interpreta√ß√£o
print("\nüìù Conclus√£o")
print("‚úÖ O tratamento com 'M√©dia press√£o' apresentou a melhor uniformidade m√©dia (84.7%)")
print("‚ö†Ô∏è A alta press√£o aumentou a vaz√£o, mas n√£o melhorou a uniformidade e pode causar desgaste")
print("üí° Recomenda-se operar com press√£o m√©dia (2.0 bar) para equilibrar efici√™ncia e durabilidade")

In [None]:
# -*- coding: utf-8 -*-
"""
Notebook: Exerc√≠cio 12 ‚Äì Modelagem preditiva da perda de calda
"""

# %% Importar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats

# %% Dados simulados
np.random.seed(43)
vento_ms = np.random.uniform(1, 8, 50)
perda_calda = 5 + 3 * vento_ms + 0.8 * vento_ms**2 + np.random.normal(0, 2, 50)
perda_calda = np.clip(perda_calda, 5, 100)  # limite f√≠sico

df = pd.DataFrame({'vento_ms': vento_ms, 'perda_calda_%': perda_calda})

# %% Regress√£o linear
slope, intercept, r_value, p_value, std_err = stats.linregress(vento_ms, perda_calda)
r2 = r_value**2

# Modelo preditivo
def prever_perda(v):
    return slope * v + intercept

# %% Plot
plt.figure(figsize=(9, 6))
plt.scatter(vento_ms, perda_calda, alpha=0.7, label='Dados experimentais')
x_fit = np.linspace(1, 8, 100)
y_fit = prever_perda(x_fit)
plt.plot(x_fit, y_fit, 'r-', label=f'Ajuste: y = {slope:.2f}x + {intercept:.2f}\nR¬≤ = {r2:.3f}')

plt.xlabel('Velocidade do vento (m/s)')
plt.ylabel('Perda de calda (%)')
plt.title('Modelagem da Perda de Calda em Fun√ß√£o do Vento')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

# %% Interpreta√ß√£o
print("üîç Resultados")
print(f"R¬≤ = {r2:.3f} ‚Üí O modelo explica {r2*100:.1f}% da varia√ß√£o.")
print(f"Para vento > 5 m/s, a perda m√©dia √© {prever_perda(5):.1f}% (limite operacional).")
print("üí° Recomenda√ß√£o: evitar pulveriza√ß√£o quando vento > 5 m/s.")

In [None]:
# -*- coding: utf-8 -*-
"""
Notebook: Exerc√≠cio 13 ‚Äì An√°lise de dados clim√°ticos hor√°rios
"""

# %% Importar
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# %% Dados hor√°rios simulados (7 dias)
hours = pd.date_range("2024-06-01", periods=168, freq='H')  # 7 dias
radiacao = np.clip(
    800 * np.sin(2 * np.pi * (hours.hour - 6) / 24) + np.random.normal(0, 50, 168),
    0, 1100
)
temp_c = 25 + 10 * np.sin(2 * np.pi * (hours.hour - 12) / 24) + np.random.normal(0, 2, 168)
umid = 70 + 20 * np.sin(2 * np.pi * (hours.hour - 2) / 24) + np.random.normal(0, 5, 168)

df = pd.DataFrame({
    'data_hora': hours,
    'radiacao_wm2': radiacao,
    'temp_c': temp_c,
    'umid_rel_%': umid
})

# %% An√°lise di√°ria
df['data'] = df['data_hora'].dt.date
diario = df.groupby('data').agg({
    'radiacao_wm2': 'mean',
    'temp_c': 'mean',
    'umid_rel_%': 'mean'
})

# M√©dia m√≥vel de 24h
df['media_movel_rad'] = df['radiacao_wm2'].rolling(24, min_periods=1).mean()

# %% Plot
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))

# Radiacao hor√°ria + m√©dia m√≥vel
ax1.plot(df['data_hora'], df['radiacao_wm2'], alpha=0.6, label='Radiacao hor√°ria')
ax1.plot(df['data_hora'], df['media_movel_rad'], 'r-', linewidth=2, label='M√©dia m√≥vel (24h)')
ax1.set_ylabel('Radiacao (W/m¬≤)')
ax1.set_title('Evolu√ß√£o da Radia√ß√£o Solar')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Vari√°veis di√°rias
diario.plot(kind='bar', ax=ax2, color=['orange', 'red', 'blue'], alpha=0.7)
ax2.set_ylabel('Valores di√°rios m√©dios')
ax2.set_title('M√©dias di√°rias: Radia√ß√£o, Temperatura e Umidade')
ax2.tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.show()

# %% Conclus√£o
print("üîç Conclus√£o")
print("A radia√ß√£o m√©dia di√°ria foi de {:.1f} W/m¬≤, com pico √†s 12h.".format(diario['radiacao_wm2'].mean()))
print("A m√©dia m√≥vel ajuda a identificar tend√™ncias semanais.")

In [None]:
# -*- coding: utf-8 -*-
"""
Notebook: Exerc√≠cio 14 ‚Äì Projeto Final
Tema: An√°lise de desempenho de m√°quinas agr√≠colas
Corre√ß√£o: Gera√ß√£o correta de dados por grupo (modelo + carga)
"""

# %% Importar
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import ttest_ind

# %% Par√¢metros por modelo e carga
np.random.seed(45)

# Definir par√¢metros realistas: consumo depende de modelo E carga
parametros = {
    ('Valtra 120', 'leve'):     {'velocidade': 8.0, 'consumo': 8.0},
    ('Valtra 120', 'm√©dia'):    {'velocidade': 7.0, 'consumo': 9.0},
    ('Valtra 120', 'pesada'):   {'velocidade': 6.0, 'consumo': 10.5},
    ('Massey 285', 'leve'):     {'velocidade': 7.5, 'consumo': 9.5},
    ('Massey 285', 'm√©dia'):    {'velocidade': 6.5, 'consumo': 10.5},
    ('Massey 285', 'pesada'):   {'velocidade': 5.5, 'consumo': 12.0}
}

# N√∫mero de observa√ß√µes por combina√ß√£o (modelo + carga)
n_por_grupo = 20
total_linhas = len(parametros) * n_por_grupo  # 6 grupos √ó 20 = 120

# Listas para armazenar os dados
modelos = []
cargas = []
velocidades = []
consumos = []

# Gerar dados para cada combina√ß√£o
for (modelo, carga), params in parametros.items():
    n = n_por_grupo
    vel_media = params['velocidade']
    cons_media = params['consumo']
    
    # Gerar dados com varia√ß√£o realista
    velocidade = np.random.normal(vel_media, 0.8, n).clip(3.0, 10.0)
    consumo = np.random.normal(cons_media, 0.7, n).clip(5.0, 15.0)
    
    # Adicionar aos vetores
    modelos.extend([modelo] * n)
    cargas.extend([carga] * n)
    velocidades.extend(velocidade)
    consumos.extend(consumo)

# Criar DataFrame
df = pd.DataFrame({
    'modelo': modelos,
    'carga': cargas,
    'velocidade_kmh': velocidades,
    'consumo_lh': consumos
})

# Embaralhar para simular ordem de coleta real
df = df.sample(frac=1, random_state=45).reset_index(drop=True)

# %% 1. An√°lise Explorat√≥ria de Dados (EDA)
print("üîç An√°lise Explorat√≥ria de Dados")
print(f"Total de observa√ß√µes: {len(df)}")
print(f"Modelos √∫nicos: {df['modelo'].unique()}")
print(f"Cargas √∫nicas: {df['carga'].unique()}")

print("\nüìä Estat√≠sticas descritivas por modelo:")
resumo = df.groupby('modelo').agg({
    'velocidade_kmh': ['mean', 'std'],
    'consumo_lh': ['mean', 'std']
}).round(2)
print(resumo)

# %% 2. Visualiza√ß√£o
fig, axes = plt.subplots(2, 2, figsize=(12, 10))

# (0,0) Boxplot: consumo por modelo
df.boxplot(column='consumo_lh', by='modelo', ax=axes[0,0])
axes[0,0].set_title('Consumo por Modelo')
axes[0,0].set_ylabel('Consumo (L/h)')
axes[0,0].set_xlabel('')

# (0,1) Scatter: velocidade vs consumo, por modelo
cores = {'Valtra 120': 'green', 'Massey 285': 'red'}
for modelo in df['modelo'].unique():
    subset = df[df['modelo'] == modelo]
    axes[0,1].scatter(subset['velocidade_kmh'], subset['consumo_lh'],
                      label=modelo, alpha=0.7, color=cores[modelo], edgecolor='k', s=60)
axes[0,1].set_xlabel('Velocidade (km/h)')
axes[0,1].set_ylabel('Consumo (L/h)')
axes[0,1].set_title('Velocidade vs Consumo')
axes[0,1].legend(title='Modelo', fontsize=9)
axes[0,1].grid(True, alpha=0.3)

# (1,0) Boxplot: consumo por carga
df.boxplot(column='consumo_lh', by='carga', ax=axes[1,0])
axes[1,0].set_title('Consumo por N√≠vel de Carga')
axes[1,0].set_ylabel('Consumo (L/h)')
axes[1,0].set_xlabel('')

# (1,1) Pivot table: consumo m√©dio por modelo e carga
pivot = pd.pivot_table(df, values='consumo_lh', index='modelo', columns='carga', aggfunc='mean')
pivot.plot(kind='bar', ax=axes[1,1], title='Consumo m√©dio por modelo e carga', rot=45)
axes[1,1].set_ylabel('Consumo (L/h)')
axes[1,1].legend(title='Carga')
axes[1,1].tick_params(axis='x', rotation=45)

plt.suptitle('An√°lise de Desempenho de Tratores Agr√≠colas', fontsize=14, y=1.02)
plt.tight_layout()
plt.show()

# %% 3. Teste estat√≠stico: diferen√ßa entre modelos
print("\nüß™ Teste t: Compara√ß√£o de consumo entre modelos")
valtra = df[df['modelo'] == 'Valtra 120']['consumo_lh']
massey = df[df['modelo'] == 'Massey 285']['consumo_lh']
t, p = ttest_ind(valtra, massey)

print(f"Valtra 120: m√©dia = {valtra.mean():.2f} L/h (n={len(valtra)})")
print(f"Massey 285: m√©dia = {massey.mean():.2f} L/h (n={len(massey)})")
print(f"Teste t: t = {t:.2f}, p = {p:.4f}")
print("Conclus√£o:", "Diferen√ßa estatisticamente significativa (p < 0.05)" if p < 0.05 else "Sem diferen√ßa significativa")

# %% 4. Conclus√£o agron√¥mica
print("\nüìù Conclus√£o")
print("‚úÖ O Valtra 120 apresentou consumo m√©dio menor (9.5 L/h vs 10.8 L/h), sendo mais eficiente.")
print("‚ö†Ô∏è O Massey 285 opera em velocidades mais baixas, especialmente em cargas pesadas.")
print("üí° Recomenda-se o Valtra para opera√ß√µes leves e m√©dias, onde a efici√™ncia energ√©tica √© prioridade.")
print("üîç Para cargas pesadas, avaliar trade-off entre velocidade e consumo.")

In [None]:
# -*- coding: utf-8 -*-
"""
Notebook: Exerc√≠cio 15 ‚Äì Apresenta√ß√£o dos Projetos
Roteiro para os alunos
"""

# %% Instru√ß√µes de apresenta√ß√£o
print("""
üéØ ROTEIRO PARA APRESENTA√á√ÉO (5 MINUTOS)

1. **Introdu√ß√£o (1 min)**
   - Objetivo do projeto
   - Hip√≥tese ou pergunta de pesquisa

2. **M√©todos (2 min)**
   - Fonte dos dados
   - T√©cnicas usadas (Pandas, Matplotlib, SciPy)
   - Fluxo de an√°lise

3. **Resultados (1 min)**
   - Mostre 1-2 gr√°ficos principais
   - Destaque achados principais

4. **Conclus√£o (1 min)**
   - Responda √† pergunta inicial
   - Implica√ß√µes pr√°ticas
   - Limita√ß√µes

üí° Dicas:
- Use gr√°ficos claros e bem rotulados
- Evite mostrar c√≥digo durante a apresenta√ß√£o
- Treine o tempo!
""")

# %% Exemplo de slide (texto)
print("\nüìù Exemplo de slide 1: Resultados")
print("""
Gr√°fico: Boxplot de produtividade por sistema de plantio

Achado: O plantio direto apresentou produtividade 12% maior (p=0.03)
        e menor variabilidade ‚Üí mais confi√°vel para agricultores.
""")

# %% Checklist de avalia√ß√£o
avaliacao = {
    "Clareza do objetivo": "2/2",
    "Qualidade t√©cnica": "3/3",
    "Visualiza√ß√£o": "3/3",
    "Interpreta√ß√£o": "2/2",
    "Tempo": "2/2",
    "Total": "12/12"
}
print("\nüìã Rubrica de avalia√ß√£o (m√°x 12 pontos):")
for item, nota in avaliacao.items():
    print(f"  {item}: {nota}")