In [26]:
import os
import pandas as pd
import openpyxl
import pandas as pd

def leer_archivo(filename):
    """
    Leer un archivo CSV, XLS o XLSX y devuelve un DataFrame.
    La función detecta automáticamente el tipo de archivo y realiza la lectura correspondiente.
    """
    try:
        if filename.endswith('.csv'):
            df = pd.read_csv(filename, encoding='ISO-8859-1', sep=';')
        elif filename.endswith('.xls'):
            df = pd.read_excel(filename)
            new_filename = filename[:-4] + '.xlsx'  # Crear el nombre del nuevo archivo
            df.to_excel(new_filename, index=False)  # Guardar el DataFrame como .xlsx
            filename = new_filename  # Actualizar el nombre del archivo para las operaciones siguientes
        elif filename.endswith('.xlsx'):
            df = pd.read_excel(filename)
        else:
            print(f"Formato de archivo no soportado: {filename}")
            return None
    except pd.errors.EmptyDataError:
        print(f"El archivo está vacío: {filename}")
        return None
    except FileNotFoundError:
        print(f"El archivo no existe: {filename}")
        return None
    except Exception as e:
        print(f"Error al leer el archivo: {filename}, {str(e)}")
        return None
    
    return df, filename  # Devolver el DataFrame y el nombre del archivo



def eliminar_formas_no_imagenes(filename):
    wb = openpyxl.load_workbook(filename)
    ws = wb.active
    try:
        for shape in ws._shapes:
            if not isinstance(shape, openpyxl.drawing.image.Image):
                ws.remove_shape(shape)
    except AttributeError:
        for image in ws._images:
            ws.remove_image(image)
    wb.save(filename)

In [55]:
import pandas as pd

def filtrar_y_reformatear_mg_cod(df):
    """Filtrar y reformatear un DataFrame"""
    # Supongamos que tu DataFrame se llama df
    df = df.drop(index=range(3))
    df = df.rename(columns={
        df.columns[0]: 'Codigo',
        df.columns[1]: 'Nombre',
        df.columns[2]: 'SKU',
        df.columns[3]: 'Descuento',
        df.columns[4]: 'Descuento 2',
        df.columns[5]: 'Descuento 3',
        df.columns[6]: 'Precio',
        df.columns[7]: 'Vendible'
    })
    df = df[['Codigo', 'Nombre', 'SKU',
            'Descuento','Descuento 2', 'Descuento 3',
            'Precio','Vendible']]

    return df

def filtrar_y_reformatear_mg_sin_cod(df):
    """Filtrar y reformatear un DataFrame"""
    # Supongamos que tu DataFrame se llama df
    df = df.drop(index=range(3))
    df = df.rename(columns={
        df.columns[0]: 'Codigo',
        df.columns[1]: 'Nombre',
        df.columns[2]: 'Stock Actual',
        df.columns[3]: 'Stock Max',
        df.columns[4]: 'Pto. Repos.'
    })
    df = df[['Codigo', 'Nombre', 'Stock ACtual',
             'Stock Max', 'Pto. Repos.']]

    return df

In [56]:
def main_process(filename):
    df, filename = leer_archivo(filename)  # leer archivo en un DataFrame y obtener el nombre del archivo
    if df is not None:
        if filename.endswith('.xlsx'):  # solo eliminar formas no deseadas para archivos .xlsx
            eliminar_formas_no_imagenes(filename)  # eliminar formas no deseadas
        df = filtrar_y_reformatear_mg_cod(df)  # filtrar y reformatear el DataFrame
    return df


# Usar las funciones
filename = '/Users/franciscofurey/00DataScience/Canal/actualizadorPrecios/clients/3/2/2023-07-29/r3__y_cod.xls'
df = main_process(filename)

In [57]:
df

Unnamed: 0,Codigo,Nombre,SKU,Descuento,Descuento 2,Descuento 3,Precio,Vendible
3,70058,APEX-DIVISOR DE PILDORA DE LUJO (70058),76855700587,5,0,0,1616.83431,N
4,77015,APEX-FERULA PARA DEDOS X 2 UNID. (77015),76855770153,5,0,0,1369.38507,N
5,70079,APEX-PASTILLERO AM-PM X 2U.(70079),76855700792,5,0,0,642.1902,N
6,70600,APEX-PASTILLERO X 28 DIV. (70600),76855706008,5,0,0,4076.34662,S
7,70085,APEX-PASTILLERO X 7 DIV XL (70085),76855700853,5,0,0,764.57383,N
...,...,...,...,...,...,...,...,...
106,10-9B,"TRIM-TIJERA PELUQUERIA 5"" (10-9B)",71603109001,5,0,0,5167.3072,S
107,X4,"TRIM-TIJERA PELUQUERO 7""",71603108004,5,0,0,3395.76433,S
108,X5,TRIM-TIJERA PELUQUERO EASY-HOLD,71603136953,5,0,0,2088.75827,N
109,2011,TRIM-TIJERA UÑAS,71603104006,5,0,0,2353.6304,S


In [62]:
import os
import pandas as pd

current_user = 'drogueriamg'
proveedor_id = 1

def rename_files(path):
    files = os.listdir(path)

    for file in files:
        if file.endswith('.xls') or file.endswith('.xlsx'):
            try:
                df = pd.read_excel(os.path.join(path, file), nrows=5)
                if 'Gestión Pedidos/Reposición de Stock' in df.to_string():
                    new_name = f'{current_user}-{proveedor_id}-stock.xls'
                    os.rename(os.path.join(path, file), os.path.join(path, new_name))
                elif 'Articulos' in df.to_string():
                    new_name = f'{current_user}-{proveedor_id}-precios.xls'
                    os.rename(os.path.join(path, file), os.path.join(path, new_name))
                else:
                    new_name = f'{current_user}-{proveedor_id}-proveedor.xls'
                    os.rename(os.path.join(path, file), os.path.join(path, new_name))
            except Exception as e:
                print(f"Error al leer o renombrar el archivo: {file}, {str(e)}")


In [63]:
rename_files('/Users/franciscofurey/00DataScience/Canal/actualizadorPrecios/clients/3/2/2023-07-29/')

Error al leer o renombrar el archivo: ~$r3__y_cod.xls, Excel file format cannot be determined, you must specify an engine manually.
Error al leer o renombrar el archivo: ~$r3.xls, Excel file format cannot be determined, you must specify an engine manually.
