## Eficiencia/Automatización de procesos con Python

* Crear nuevos archivos
* Abrir un archivo Colab
* Crear una copia en nuestro drive
* Guardar archivos
* Comentar código
* Celdas de código y texto
* Ejecutar código
* Limpiar resultados
* Mostrar donde ver las variables y estructuras


## Carga de librerías

In [31]:
import pandas as pd
import os

## Variables

In [3]:
sueldo = 5000
print(sueldo)

5000


In [4]:
sueldo

5000

In [5]:
mascota = "perro"
print(mascota)

perro


In [6]:
mascota

'perro'

## Listas

In [7]:
calificaciones = [6.3, 7.8, 9.9, 8.3, 6.3, 6.3]
print(calificaciones)

[6.3, 7.8, 9.9, 8.3, 6.3, 6.3]


In [10]:
animales = ["perro", "gato", "conejo"]
print(animales)

['perro', 'gato', 'conejo']


In [11]:
animales

['perro', 'gato', 'conejo']

## Funciones

In [14]:
calificaciones

[6.3, 7.8, 9.9, 8.3, 6.3, 6.3]

In [15]:
sum(calificaciones)

44.89999999999999

In [17]:
sum(calificaciones) / len(calificaciones)

7.483333333333332

In [20]:
promedio = sum(calificaciones) / len(calificaciones)
promedio

7.483333333333332

In [21]:
set(calificaciones)

{6.3, 7.8, 8.3, 9.9}

In [26]:
str(sueldo) + " " + mascota

'5000 perro'

In [24]:
str(sueldo) + mascota

'5000perro'

In [29]:
"barco---mar".replace("-", "_")

'barco___mar'

In [34]:
os.path.join("perro", "gato")

'perro/gato'

## Lectura de archivos Excel

In [38]:
# Ruta del archivo
ruta_base = "/content"

# Nombre del archivo en su respectiva ruta
archivo_excel = os.path.join(ruta_base, "4_Datos.xlsx")

In [42]:
# Cargamos los datos a Python
datos = pd.read_excel(archivo_excel, sheet_name="datos_resumen")

# Mostramos los datos
print(datos)

        Fecha Vendedor    Producto  Unidades Vendidas  Precio Unitario  \
0  2024-01-01      Ana  Producto A                  7            12.26   
1  2024-01-02      Ana  Producto B                  4            38.88   
2  2024-01-03    Carla  Producto D                 13            47.54   
3  2024-01-04     Luis  Producto C                 11            10.03   
4  2024-01-05     Luis  Producto C                  8            49.69   
5  2024-01-06     Luis  Producto B                 13            34.70   
6  2024-01-07      Ana  Producto B                  5            34.47   
7  2024-01-08      Ana  Producto C                  7            10.28   
8  2024-01-09    Tomás  Producto A                 10            10.92   
9  2024-01-10      Ana  Producto A                  3            30.99   
10 2024-01-11      Ana  Producto D                  7            25.99   
11 2024-01-12      Ana  Producto A                 11            11.87   
12 2024-01-13     Luis  Producto C    

## Ciclos

In [43]:
calificaciones

[6.3, 7.8, 9.9, 8.3, 6.3, 6.3]

In [45]:
# x toma cada uno de los valores en calificaciones
for x in calificaciones:
    print(x)

6.3
7.8
9.9
8.3
6.3
6.3


In [46]:
for x in calificaciones:
    print(x+1000)

1006.3
1007.8
1009.9
1008.3
1006.3
1006.3


In [47]:
for x in set(calificaciones):
    print(x)

8.3
9.9
6.3
7.8


## Procesamiento de datos

In [60]:
# Filtramos los datos para Luis
datos[datos["Vendedor"] == "Luis"]

Unnamed: 0,Fecha,Vendedor,Producto,Unidades Vendidas,Precio Unitario,Total Venta
3,2024-01-04,Luis,Producto C,11,10.03,110.33
4,2024-01-05,Luis,Producto C,8,49.69,397.52
5,2024-01-06,Luis,Producto B,13,34.7,451.1
12,2024-01-13,Luis,Producto C,11,48.95,538.45
13,2024-01-14,Luis,Producto C,8,19.31,154.48
15,2024-01-16,Luis,Producto A,4,34.74,138.96
17,2024-01-18,Luis,Producto A,8,49.33,394.64


In [61]:
# Almacenamos los datos filtrados para Luis
datos_luis = datos[datos["Vendedor"] == "Luis"]
print(datos_luis)

        Fecha Vendedor    Producto  Unidades Vendidas  Precio Unitario  \
3  2024-01-04     Luis  Producto C                 11            10.03   
4  2024-01-05     Luis  Producto C                  8            49.69   
5  2024-01-06     Luis  Producto B                 13            34.70   
12 2024-01-13     Luis  Producto C                 11            48.95   
13 2024-01-14     Luis  Producto C                  8            19.31   
15 2024-01-16     Luis  Producto A                  4            34.74   
17 2024-01-18     Luis  Producto A                  8            49.33   

    Total Venta  
3        110.33  
4        397.52  
5        451.10  
12       538.45  
13       154.48  
15       138.96  
17       394.64  


In [62]:
# Almacenamos los datos filtrados para Ana
datos_ana = datos[datos["Vendedor"] == "Ana"]
print(datos_ana)

        Fecha Vendedor    Producto  Unidades Vendidas  Precio Unitario  \
0  2024-01-01      Ana  Producto A                  7            12.26   
1  2024-01-02      Ana  Producto B                  4            38.88   
6  2024-01-07      Ana  Producto B                  5            34.47   
7  2024-01-08      Ana  Producto C                  7            10.28   
9  2024-01-10      Ana  Producto A                  3            30.99   
10 2024-01-11      Ana  Producto D                  7            25.99   
11 2024-01-12      Ana  Producto A                 11            11.87   
14 2024-01-15      Ana  Producto C                  5            13.62   

    Total Venta  
0         85.82  
1        155.52  
6        172.35  
7         71.96  
9         92.97  
10       181.93  
11       130.57  
14        68.10  


In [66]:
# Revisamos la columna "Producto" para la data de Ana
print(datos_ana["Total Venta"])

0      85.82
1     155.52
6     172.35
7      71.96
9      92.97
10    181.93
11    130.57
14     68.10
Name: Total Venta, dtype: float64


## Exportación a Excel

In [70]:
# Definimos la ruta de salida
ruta_salida_ana = os.path.join(ruta_base, "datos_ana.xlsx")

# Exportamos el archivo en su respectiva ruta
datos_ana.to_excel(ruta_salida_ana, index=False)

In [75]:
# ------------------
# REVISIÓN COMPLETA DEL PROYECTO
# Dividir el Excel por vendedor
# ------------------

# Definimos la ruta donde leeremos y guardaremos archivos Excel
ruta_base = "/content"

# Creamos la ruta del archivo Excel
archivo_ventas = os.path.join(ruta_base, "4_Datos.xlsx")

# Cargamos el archivo Excel en Python
ventas = pd.read_excel(archivo_ventas, sheet_name="datos")

# Obtenemos los vendedores únicos
vendedores = ventas['Vendedor'].unique()


for v in vendedores:

    # Filtramos por el vendedor del ciclo
    ventas_filtradas = ventas[ventas['Vendedor'] == v]

    # Creamos el nombre del archivo utilizando el nombre del vendedor sin espacios
    nombre_archivo = v.replace(" ", "_") + ".xlsx"

    # Creamos la ruta de salida (carpeta + nombre archivo)
    ruta_salida = os.path.join(ruta_base, nombre_archivo)

    # Exportamos el archivo en su respectiva ruta
    ventas_filtradas.to_excel(ruta_salida, index=False)
