In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.formula.api as smf

# Lista de arquivos e nomes das áreas
arquivos = [
    ("Amazonia_pentada_areaDematada3_precipitacao.xlsx", "Área Desmatada 3"),
    ("Amazonia_pentada_areaDesmatada1.xlsx", "Área Desmatada 1"),
    ("Amazonia_pentada_areaDesmatada2.xlsx", "Área Desmatada 2"),
    ("Amazonia_pentada_areaDesmatada4.xlsx", "Área Desmatada 4"),
    ("AreaPreservada1.xlsx", "Área Preservada 1"),
    ("AreaPreservada2.xlsx", "Área Preservada 2")
]

# Caminho base dos arquivos
caminho_base = "/home/talita/Documentos/calculo_climatologia/estudoEstacaoSeca/Dados/"

# Carregar e combinar os dados
dados = []

for arquivo, nome_area in arquivos:
    df = pd.read_excel(caminho_base + arquivo)
    df['Área'] = nome_area
    dados.append(df)

# Combinar todos os dados em um único DataFrame
df_completo = pd.concat(dados, ignore_index=True)

# Verificar as colunas disponíveis (ajuste conforme necessário)
print(df_completo.columns)

# Calcular a duração da estação seca
df_completo['Duracao_Seca'] = df_completo['Pentada_Fim_Seca'] - df_completo['Pentada_Início_Seca']

# Regressão Linear Multivariada
modelo = smf.ols('Duracao_Seca ~ Ano + C(Área)', data=df_completo).fit()
print("\n--- Resumo do Modelo de Regressão ---")
print(modelo.summary())

# Plotar as tendências das áreas
plt.figure(figsize=(12, 8))
sns.lmplot(
    data=df_completo,
    x="Ano",
    y="Duracao_Seca",
    hue="Área",
    height=6,
    aspect=1.5,
    markers=["o", "s", "D", "^", "v", "*"],
    ci=None
)
plt.title("Tendência da Duração da Estação Seca por Área", fontsize=14, fontweight="bold")
plt.xlabel("Ano", fontsize=12)
plt.ylabel("Duração da Estação Seca (pentadas)", fontsize=12)
plt.grid(axis="both", linestyle="--", alpha=0.5)
plt.tight_layout()
plt.show()


ModuleNotFoundError: No module named 'matplotlib'