In [1]:
import pandas as pd

import os
import numpy as np

In [8]:
xls_files = [f for f in os.listdir(os.getcwd()) if f.endswith('.xls')]

In [10]:
dfs = []

for xls in xls_files:
    df = pd.read_excel(os.path.join(xls), skiprows= 2, usecols=["Title","Circuit","Week\nAdm"])
    dfs.append(df)

In [11]:
consolidated = pd.concat(dfs, ignore_index= True)

In [12]:
consolidated 

Unnamed: 0,Title,Circuit,Week\nAdm
0,Godzilla y Kong: El Nuevo Imperio,Independiente - Costa Rica,125.0
1,Kung Fu Panda 4,Independiente - Costa Rica,22.0
2,Godzilla y Kong: El Nuevo Imperio,Cinemark,3090.0
3,Kung Fu Panda 4,Cinemark,2526.0
4,Duna Parte Dos,Cinemark,150.0
...,...,...,...
614,Sismo Magnitud 9.5,Cinepolis,93.0
615,Mavka: Guardiana del Bosque,Cinepolis,25.0
616,Alicia en el País de las Pesadillas,Cinepolis,12.0
617,Fatum,Cinepolis,4.0


In [13]:
movies_by_circuit = consolidated.groupby(["Title", "Circuit"])["Week\nAdm"].sum().reset_index()

In [14]:
movies_by_circuit.head()

Unnamed: 0,Title,Circuit,Week\nAdm
0,2024 Festivales y Muestras,Independiente - Costa Rica,68.0
1,57 Segundos Atras,CCM Cinemas,24.0
2,57 Segundos Atras,Cinepolis,283.0
3,57 Segundos Atras,Cines Moderno,7.0
4,57 Segundos Atras,Independiente - Costa Rica,6.0


In [15]:
movies_by_circuit_sorted = movies_by_circuit.sort_values(by="Title", ascending=True)

In [16]:
movies_by_circuit_sorted

Unnamed: 0,Title,Circuit,Week\nAdm
0,2024 Festivales y Muestras,Independiente - Costa Rica,68.0
1,57 Segundos Atras,CCM Cinemas,24.0
2,57 Segundos Atras,Cinepolis,283.0
3,57 Segundos Atras,Cines Moderno,7.0
4,57 Segundos Atras,Independiente - Costa Rica,6.0
...,...,...,...
150,Érase una vez en Panamá,Cinemark,602.0
152,Érase una vez en Panamá,Cines Moderno,352.0
148,Érase una vez en Panamá,Caribbean Cinemas,568.0
149,Érase una vez en Panamá,Cinelandia,19.0


In [18]:
movies_by_circuit_sorted.to_csv("output.txt", sep="\t", index=False)

In [17]:
df_total_per_movie = movies_by_circuit_sorted.groupby("Title")["Week\nAdm"].sum().reset_index()

In [18]:
df_total_per_movie_sorted = df_total_per_movie.sort_values(by="Title", ascending=True)

In [19]:
df_total_per_movie_sorted.to_csv("output_totales.txt", sep="\t", index=False)

In [20]:

output = []
# Definir ancho de columnas
col1_width = 30  # Ancho para el nombre del Circuito
col2_width = 10  # Ancho para Week\Adm
col3_width = 15  # Ancho para el Porcentaje

for title in df_total_per_movie_sorted["Title"]:
    movie_data = movies_by_circuit_sorted[movies_by_circuit_sorted["Title"] == title]

    # pasar columnas a numpy para optimizar
    circuits = movie_data["Circuit"].values
    week_adm_values = movie_data["Week\nAdm"].astype(int).values

    total_adm = int(df_total_per_movie_sorted.loc[df_total_per_movie_sorted["Title"] == title, "Week\nAdm"].values[0])
    
    percentages = np.round((week_adm_values / total_adm) * 100, 2)
    
    # Convertir a string con el formato adecuado
    percentages = np.array([f"{p}%" for p in percentages])
    total_adm = int(total_adm)
    output.append("############################################################################################################################")
    output.append(f"Pelicula: {title}\n")

     # Agregar encabezados con formato uniforme
    output.append(f"{'Circuit':<{col1_width}} {'Week\\Adm':<{col2_width}} {'Porcentaje':<{col3_width}}")
    
    # Usar NumPy para generar filas de salida en un solo paso
    formatted_rows = np.array([f"{c:<{col1_width}} {w:<{col2_width}} {p:<{col3_width}}" 
                               for c, w, p in zip(circuits, week_adm_values, percentages)])

    output.extend(formatted_rows.tolist())

    # Agregar el total con alineación
    output.append(f"{'Total':<{col1_width}} {total_adm:<{col2_width}}\n")

# Guardar el archivo de salida
with open("movies_output.txt", "w") as f:
    f.write("\n".join(output))


In [16]:
output

['############################################################################################################################',
 'Pelicula: 2024 Festivales y Muestras\n',
 'Circuit                        Week\\Adm   Porcentaje     ',
 'Independiente - Costa Rica     68         100.0%         ',
 'Total                          68        \n',
 '############################################################################################################################',
 'Pelicula: 57 Segundos Atras\n',
 'Circuit                        Week\\Adm   Porcentaje     ',
 'CCM Cinemas                    24         7.5%           ',
 'Cinepolis                      283        88.44%         ',
 'Cines Moderno                  7          2.19%          ',
 'Independiente - Costa Rica     6          1.88%          ',
 'Total                          320       \n',
 '############################################################################################################################',
 'Pe