<a href="https://colab.research.google.com/github/Bayinc/GOOGLECOLAB/blob/main/Clase_9.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Funciones para crear nuevas columnas

En esta clase aprenderás cómo crear funciones personalizadas para crear nuevas columnas.

* Este conocimiento es muy útil, ya que en la práctica es una tarea bastante común y tediosa crear nuevas columnas de manera repetitiva.
* Existen varias formas de hacerlo, acá veremos una con pandas y funciones personalizadas.

In [None]:
import pandas as pd

In [None]:
# Creamos la data
data = {
    'Cantidad': [5, 8, 2, 4, 7, 6, 9, 1, 3, 10],
    'Precio': [15, 28, 12, 14, 27, 16, 19, 11, 13, 20],
    'Sucursal': ["A", "A", "A", "A", "B", "B", "B", "B", "C", "C"]
}

df = pd.DataFrame(data)

In [None]:
df.head()

Unnamed: 0,Cantidad,Precio,Sucursal
0,5,15,A
1,8,28,A
2,2,12,A
3,4,14,A
4,7,27,B


In [None]:
# Definimos una función que luego aplicaremos a una columna para crear otra columna
def cuadrado(valor):
    return valor ** 2

In [None]:
# Probamos la función
cuadrado(5)

25

In [None]:
# Crea "Cantidad_Cuadrada" en base a la columna "Cantidad" aplicando la función "cuadrado"
# "apply" aplica la función fila a fila
# "apply" es un método de pandas

df["Cantidad_Cuadrada"] = df["Cantidad"].apply(cuadrado)

print(df)

   Cantidad  Precio Sucursal  Cantidad_Cuadrada
0         5      15        A                 25
1         8      28        A                 64
2         2      12        A                  4
3         4      14        A                 16
4         7      27        B                 49
5         6      16        B                 36
6         9      19        B                 81
7         1      11        B                  1
8         3      13        C                  9
9        10      20        C                100


# Caso aplicado

In [None]:
# Carga de los datos
datos = pd.read_excel("/content/Ventas2.xlsx")
datos.head()

Unnamed: 0,Nombre,Region,Periodo,Monto
0,Kevin,Canada,2019,546
1,Anna,Canada,2019,670
2,Karen,Perú,2019,324
3,Mario,Perú,2019,1212
4,Monica,Perú,2019,1365


In [None]:
# Crear columna "Gran_Monto"
# Retorna "Sí", si el Monto es mayor o igual a 1000
# Retorna "No", si el Monto es menor a 1000

In [None]:
# Creamos la función
def evaluar_monto(monto):
    if monto >= 1000:
        return "Sí"
    else:
        return "No"

In [None]:
# Probamos la función
evaluar_monto(999)

'No'

In [None]:
datos.head(5)

Unnamed: 0,Nombre,Region,Periodo,Monto
0,Kevin,Canada,2019,546
1,Anna,Canada,2019,670
2,Karen,Perú,2019,324
3,Mario,Perú,2019,1212
4,Monica,Perú,2019,1365


In [None]:
# Creamos la columna
datos['Gran_Monto'] = datos['Monto'].apply(evaluar_monto)

In [None]:
# Revisamos el resultado
datos.head()

Unnamed: 0,Nombre,Region,Periodo,Monto,Gran_Monto
0,Kevin,Canada,2019,546,No
1,Anna,Canada,2019,670,No
2,Karen,Perú,2019,324,No
3,Mario,Perú,2019,1212,Sí
4,Monica,Perú,2019,1365,Sí


# Caso aplicado más realista

In [None]:
# Carga de los datos
datos = pd.read_excel("/content/Ventas_Marzo.xlsx")
datos.head()

Unnamed: 0,Sucursal,Monto,Vendedor,Nro_Ventas
0,Centro,1500,Ana,3
1,Norte,2000,Carlos,5
2,Sur,1750,Pedro,2
3,Este,1600,Luis,8
4,Oeste,1800,María,1


In [None]:
# Si número de ventas >=6, "cumple"

def verificar_cumple(nro_ventas):
    return 'Sí' if nro_ventas >= 6 else 'No'

In [None]:
# Si "cumple", aplicar un bono de 10% sobre el monto
# "fila" se utiliza para indicar la fila en la que se está trabajando
# Esto nos permite tomar múltiples columnas para una misma fila como input

def calcular_bono(fila):
    return fila['Monto'] * 0.10 if fila['Cumple'] == 'Sí' else 0

In [None]:
# Aplicar la función "verificar_cumple" para crear la columna "Cumple"

datos['Cumple'] = datos['Nro_Ventas'].apply(verificar_cumple)

datos.head()

Unnamed: 0,Sucursal,Monto,Vendedor,Nro_Ventas,Cumple
0,Centro,1500,Ana,3,No
1,Norte,2000,Carlos,5,No
2,Sur,1750,Pedro,2,No
3,Este,1600,Luis,8,Sí
4,Oeste,1800,María,1,No


In [None]:
# Aplicar la función "calcular_bono" para crear la columna "Bono"
# OJO que ahora estamos aplicando la función sobre el dataframe, no sobre una columna puntual
# Lo anterior indica que podemos tomar valores de varias columnas del dataframe
# axis=1 indica que la función se aplicará fila a fila (igual que para una columna puntual)

datos['Bono'] = datos.apply(calcular_bono, axis=1)

datos.head()

Unnamed: 0,Sucursal,Monto,Vendedor,Nro_Ventas,Cumple,Bono
0,Centro,1500,Ana,3,No,0.0
1,Norte,2000,Carlos,5,No,0.0
2,Sur,1750,Pedro,2,No,0.0
3,Este,1600,Luis,8,Sí,160.0
4,Oeste,1800,María,1,No,0.0


In [None]:
# Exportar los resultados

datos.to_excel("Ventas_Marzo_Listo.xlsx")

# Automatizando el procedimiento

* Aplicaremos el procedimiento al Excel que nosotros indiquemos.
* Primero debemos cargar todos los Excel's al entorno de colab.


In [None]:
#Selección del mes
mes = input("Ingrese el mes: ")

# Carga de los datos
datos = pd.read_excel(f"/content/Ventas_{mes}.xlsx")


# Si número de ventas >=6 cumple
def verificar_cumple(nro_ventas):
    return 'Sí' if nro_ventas >= 6 else 'No'


# Si cumple aplicar un bono de 10% sobre el monto
def calcular_bono(row):
    return row['Monto'] * 0.10 if row['Cumple'] == 'Sí' else 0


# Aplicar la función para crear la columna "Cumple"
datos['Cumple'] = datos['Nro_Ventas'].apply(verificar_cumple)


# Aplicar la función para crear la columna "Bono"
datos['Bono'] = datos.apply(calcular_bono, axis=1)


# Exportar los resultados
datos.to_excel(f"Ventas_{mes}_Listo.xlsx", index=False)

Ingrese el mes: Abril
