# Base de datos

In [9]:
# Librerías
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

## Cambio de formato antigüo

In [11]:
# Definir una lista con los nombres de los archivos y sus años
archivos = [
    ('NIVELES REPRESAS PAPALLACTA 2014.xlsx', 2014),
    ('NIVELES REPRESAS PAPALLACTA 2015.xlsx', 2015),
    ('NIVELES REPRESAS PAPALLACTA 2016_cor.xlsx', 2016),
    ('NIVELES REPRESAS PAPALLACTA 2017.xlsx', 2017),
    ('NIVELES REPRESAS PAPALLACTA 2018.xlsx', 2018),
]

In [13]:
# Función para leer archivo, procesar datos y retornar DataFrame
def procesar_archivos(archivo):
    datos = pd.read_excel(archivo, header=3, usecols="A:D")
    datos.columns = ['Fecha', 'SalveFacha(PAPLT801_ACH1_CT)', 'Sucus(PAPLT813_ACH2_CT)',
                     'Mogotes(PAPLT808_ACH1_CT)']
    datos['Fecha'] = pd.to_datetime(datos['Fecha'], errors='coerce')
    return datos

# Leer cada archivo Excel, procesar y almacenar en un diccionario por año
dataframes_por_y = {yyyy: procesar_archivos(archivo) for archivo, yyyy in archivos}

# Función para filtrar datos por mes y año para un año específico
def filtro_m_y_especifico(dataframe, year):
    return {
        (year, month): dataframe[(dataframe['Fecha'].dt.year == year) & (dataframe['Fecha'].dt.month == month)]
        for month in range(1, 13)
    }

# Obtener los DataFrames filtrados por cada mes y año para cada año específico
dataframes_por_m_y = {yyyy: filtro_m_y_especifico(df, yyyy) for yyyy, df in dataframes_por_y.items()}


In [15]:
# Ejemplo: Mostrar las primeras filas del DataFrame filtrado para enero de cada año
for yyyy in dataframes_por_m_y:
    print(f"Datos de Mayo {yyyy}:")
    print(dataframes_por_m_y[yyyy][(yyyy, 5)].head())

Datos de Mayo 2014:
       Fecha SalveFacha(PAPLT801_ACH1_CT) Sucus(PAPLT813_ACH2_CT)  \
0 2014-05-30                  3890.699023             3890.117617   
1 2014-05-31                  3890.699023             3890.148019   

  Mogotes(PAPLT808_ACH1_CT)  
0               3985.199951  
1               3985.199951  
Datos de Mayo 2015:
         Fecha SalveFacha(PAPLT801_ACH1_CT) Sucus(PAPLT813_ACH2_CT)  \
120 2015-05-01                  3890.865079             3889.234939   
121 2015-05-02                  3890.923687             3889.234939   
122 2015-05-03                  3890.923687             3889.337293   
123 2015-05-04                  3890.923687             3889.337293   
124 2015-05-05                  3890.904151             3889.337293   

    Mogotes(PAPLT808_ACH1_CT)  
120                3983.67805  
121               3983.758621  
122               3983.812335  
123               3983.883954  
124               3983.913795  
Datos de Mayo 2016:
         Fecha SalveFac