In [1]:
from google.colab import files
import zipfile
import os
import pandas as pd
import glob

uploaded = files.upload()


Saving 1.zip to 1.zip


In [2]:
zip_path = next(iter(uploaded))
extract_folder = "/content/csvs"

with zipfile.ZipFile(zip_path, 'r') as zip_ref:
    zip_ref.extractall(extract_folder)


In [3]:
archivos = glob.glob(f"{extract_folder}/**/*.csv", recursive=True)

dataframes_validos = []
columnas_clave = ['Producto', 'Descripción de careacterística', 'Cant. movida', 'Hueco']

for archivo in archivos:
    try:
        df = pd.read_csv(archivo, sep=";", encoding="latin1")
        if all(col in df.columns for col in columnas_clave):
            dataframes_validos.append(df)
            print(f"✅ {os.path.basename(archivo)} cargado")
        else:
            print(f"⛔ Columnas faltantes en {os.path.basename(archivo)}")
    except Exception as e:
        print(f"❌ Error leyendo {os.path.basename(archivo)}: {e}")

if not dataframes_validos:
    raise ValueError("No se cargaron archivos válidos")

df_total = pd.concat(dataframes_validos, ignore_index=True)


✅ ExportedData (5).csv cargado
✅ ExportedData (4).csv cargado
✅ ExportedData (9).csv cargado
✅ ExportedData (8).csv cargado
✅ ExportedData (10).csv cargado
✅ ExportedData (1).csv cargado
✅ ExportedData.csv cargado
✅ ExportedData (2).csv cargado
✅ ExportedData (3).csv cargado
✅ ExportedData (6).csv cargado
✅ ExportedData (7).csv cargado


In [4]:
df_total = df_total.rename(columns={
    'Producto': 'producto',
    'Descripción de careacterística': 'talla',
    'Cant. movida': 'cantidad',
    'Hueco': 'ubicacion'
})

for col in ['producto', 'talla', 'cantidad', 'ubicacion']:
    if col not in df_total.columns:
        raise ValueError(f"❌ Falta la columna requerida: '{col}'")

df_total['producto'] = df_total['producto'].astype(str).str.upper().str.strip()
df_total['talla'] = df_total['talla'].astype(str).str.upper().str.strip()
df_total['ubicacion'] = df_total['ubicacion'].astype(str).str.upper().str.strip()
df_total['cantidad'] = pd.to_numeric(df_total['cantidad'], errors='coerce').fillna(0)

df_total['ubicacion'] = df_total['ubicacion'].replace({
    'LOGINSER CENTRAL': 'LOGINSER',
    'LOGINSER': 'LOGINSER',
    'TIENDA': 'TIENDA',
    'TRANSITO LOGINSER': 'LOGINSER'
})

df_total = df_total[df_total['ubicacion'].isin(['TIENDA', 'LOGINSER'])]

df_total.head()

Unnamed: 0,Línea,producto,talla,Referencia de almacén,Valor atributos,cantidad,Unidad,ubicacion,Centro de costos
0,10,18710-102331 - ZAPATILLAS BROOKS ADRENALINE GT...,"TALLA: 42,5 - EUR",1104371D434-425,,1,Unidad,TIENDA,
1,20,17644-94573 - ZAPATILLAS BROOKS ADRENALINE GTS...,TALLA: 40 - EUR,1204261B427-40,,1,Unidad,TIENDA,
2,10,7057 - FAVERO ASSIOMA UNO - PEDALES MEDIDOR PO...,NAN,00772-01,,10,Unidad,TIENDA,
3,20,11221-55455 - CASCO MET VINCI MIPS BLANCO PLAT...,TALLA: M (56-58CM),713637-M,,2,Unidad,TIENDA,
4,10,16451 - SILLÍN PROLOGO SCRATCH-M5 PAS NACK 140...,NAN,SCMPNA0HB00-AM,,1,Unidad,TIENDA,


In [5]:
from IPython.display import display

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

display(df_total)


Unnamed: 0,Línea,producto,talla,Referencia de almacén,Valor atributos,cantidad,Unidad,ubicacion,Centro de costos
0,10,18710-102331 - ZAPATILLAS BROOKS ADRENALINE GT...,"TALLA: 42,5 - EUR",1104371D434-425,,1,Unidad,TIENDA,
1,20,17644-94573 - ZAPATILLAS BROOKS ADRENALINE GTS...,TALLA: 40 - EUR,1204261B427-40,,1,Unidad,TIENDA,
2,10,7057 - FAVERO ASSIOMA UNO - PEDALES MEDIDOR PO...,NAN,00772-01,,10,Unidad,TIENDA,
3,20,11221-55455 - CASCO MET VINCI MIPS BLANCO PLAT...,TALLA: M (56-58CM),713637-M,,2,Unidad,TIENDA,
4,10,16451 - SILLÍN PROLOGO SCRATCH-M5 PAS NACK 140...,NAN,SCMPNA0HB00-AM,,1,Unidad,TIENDA,
5,10,8488-48279 - JUEGO DE RUEDAS ZIPP 303S DISC CA...,GRUPOS: SRAM XDR 12,303DISCCARBONC,,1,Unidad,TIENDA,
6,20,16451 - SILLÍN PROLOGO SCRATCH-M5 PAS NACK 140...,NAN,SCMPNA0HB00-AM,,2,Unidad,TIENDA,
7,10,17067-90799 - ZAPATILLAS NNORMAL KJERAG BLANCO...,TALLA: EU 42 2/3,N1ZKGM1-001-4223,,1,Unidad,TIENDA,
8,20,17068-90817 - ZAPATILLAS NNORMAL KJERAG BLANCO...,TALLA: EU 43 1/3,N1ZKGM1-002-4313,,1,Unidad,TIENDA,
9,40,17069-90849 - ZAPATILLAS NNORMAL KJERAG NEGRO ...,TALLA: EU 43 1/3,N1ZKGM1-003-4313,,1,Unidad,TIENDA,


In [6]:
df_agrupado = df_total.groupby(['producto', 'talla', 'ubicacion'])['cantidad'].sum().reset_index()
display(df_agrupado)

Unnamed: 0,producto,talla,ubicacion,cantidad
0,11221-55455 - CASCO MET VINCI MIPS BLANCO PLAT...,TALLA: M (56-58CM),TIENDA,3
1,15201-79614 - ZAPATILLAS NNORMAL KJERAG BEIGE ...,TALLA: UK 9,TIENDA,1
2,16451 - SILLÍN PROLOGO SCRATCH-M5 PAS NACK 140...,NAN,TIENDA,3
3,16802 - RELOJ SUUNTO RACE S AZUL VERDE,NAN,TIENDA,3
4,17067-90799 - ZAPATILLAS NNORMAL KJERAG BLANCO...,TALLA: EU 42 2/3,TIENDA,1
5,17068-90817 - ZAPATILLAS NNORMAL KJERAG BLANCO...,TALLA: EU 43 1/3,TIENDA,1
6,17069-90849 - ZAPATILLAS NNORMAL KJERAG NEGRO ...,TALLA: EU 43 1/3,TIENDA,1
7,17644-94573 - ZAPATILLAS BROOKS ADRENALINE GTS...,TALLA: 40 - EUR,TIENDA,1
8,17672-94696 - ZAPATILLAS BROOKS ADRENALINE GTS...,"TALLA: 45,5 - EUR",TIENDA,1
9,17836-96079 - ZAPATILLAS NEW BALANCE FUELCELL ...,"TALLA: 41,5 - EUR",TIENDA,1


In [7]:
%pip install fpdf2 tabulate

Collecting fpdf2
  Downloading fpdf2-2.8.4-py2.py3-none-any.whl.metadata (72 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m72.7/72.7 kB[0m [31m513.3 kB/s[0m eta [36m0:00:00[0m
Downloading fpdf2-2.8.4-py2.py3-none-any.whl (251 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m251.7/251.7 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: fpdf2
Successfully installed fpdf2-2.8.4


In [8]:

excel_output_path = "/content/df_agrupado.xlsx"
df_agrupado.to_excel(excel_output_path, index=False)

print(f"Excel file saved to: {excel_output_path}")

Excel file saved to: /content/df_agrupado.xlsx


In [9]:
from google.colab import files

excel_output_path = "/content/df_agrupado.xlsx"
try:
  files.download(excel_output_path)
except FileNotFoundError:
  print(f"Error: The file {excel_output_path} was not found. Please ensure the Excel file was generated successfully.")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [10]:
from fpdf import FPDF
from google.colab import files

class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 11)
        self.cell(0, 10, 'Resumen agrupado de albaranes', ln=True, align='C')
        self.ln(4)

        self.set_font("Arial", 'B', 9)
        headers = ['producto', 'talla', 'ubicacion', 'cantidad']
        for i, header in enumerate(headers):
            self.cell(col_widths[i], 8, header.upper(), border=1, align='C')
        self.ln()

col_widths = [180, 40, 35, 22]
line_height = 8

pdf = PDF(orientation='L', unit='mm', format='A4')
pdf.add_page()

pdf.set_font("Arial", '', 8)

for _, row in df_agrupado.iterrows():
    producto_lines = len(pdf.multi_cell(col_widths[0], line_height, str(row['producto']), border=0, split_only=True))
    row_height = producto_lines * line_height

    if pdf.get_y() + row_height > 190:
        pdf.add_page()

    y_before = pdf.get_y()
    x = pdf.get_x()

    pdf.multi_cell(col_widths[0], line_height, str(row['producto']), border=1)
    y_after = pdf.get_y()
    actual_row_height = y_after - y_before

    pdf.set_xy(x + col_widths[0], y_before)
    pdf.multi_cell(col_widths[1], actual_row_height, str(row['talla']), border=1, align='C')

    pdf.set_xy(x + col_widths[0] + col_widths[1], y_before)
    pdf.multi_cell(col_widths[2], actual_row_height, str(row['ubicacion']), border=1, align='C')

    pdf.set_xy(x + col_widths[0] + col_widths[1] + col_widths[2], y_before)
    pdf.multi_cell(col_widths[3], actual_row_height, str(int(row['cantidad'])), border=1, align='C')

    pdf.set_y(y_before + actual_row_height)

pdf_output_path = "/content/df_agrupado.pdf"
pdf.output(pdf_output_path)

files.download(pdf_output_path)


  self.set_font('Arial', 'B', 11)
  self.cell(0, 10, 'Resumen agrupado de albaranes', ln=True, align='C')
  self.set_font("Arial", 'B', 9)
  pdf.set_font("Arial", '', 8)
  producto_lines = len(pdf.multi_cell(col_widths[0], line_height, str(row['producto']), border=0, split_only=True))


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>