## Ejemplo 4: Manipulación de columnas

### 1. Objetivos:
    - Aprender a crear nuevas columnas en un `DataFrame`
    - Aprender a reasignar columnas
    - Aprender a eliminar columnas
 
---
    
### 2. Desarrollo:

In [2]:
import pandas as pd

Tenemos aquí un `DataFrame`:

In [3]:
datos = {
    "Nombre": ["Pepinillo Hernández", "Lúpulo de Dios",
        "Juan Juon", "Jimmy el Patatas",
        "Lorenzo Retaguardias"],
    "Cereal favorito": ["Korn Floks", "Verdurinis",
        "Zumbaritas", "Diabetukis, Papá",
        "Fibra Máxima 3000"],
    "Hora del desayuno": ["11:00", "07:30", "07:00",
        "08:30", "09:30"]
}

df = pd.DataFrame(datos)
df

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno
0,Pepinillo Hernández,Korn Floks,11:00
1,Lúpulo de Dios,Verdurinis,07:30
2,Juan Juon,Zumbaritas,07:00
3,Jimmy el Patatas,"Diabetukis, Papá",08:30
4,Lorenzo Retaguardias,Fibra Máxima 3000,09:30


Agregar una nueva columna de `Frutas` con los valores `["Pera", "Manzana", "Plátano", "Guayaba","Pizza"]` haciendo uso de una Serie:

`variable_dataframe[-nombre de columna-] = ps.Series(-lista de valores-)`

In [4]:
df["Frutas"] = pd.Series(["Pera", "Manzana", "Plátano", "Guayaba","Pizza"])
df

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno,Frutas
0,Pepinillo Hernández,Korn Floks,11:00,Pera
1,Lúpulo de Dios,Verdurinis,07:30,Manzana
2,Juan Juon,Zumbaritas,07:00,Plátano
3,Jimmy el Patatas,"Diabetukis, Papá",08:30,Guayaba
4,Lorenzo Retaguardias,Fibra Máxima 3000,09:30,Pizza


También es posible modificar los valores de las horas del desayuno por:

    "10:30", "06:30", "06:00", "07:00", "08:00"
    
Se usa la misma forma, sólo que en este caso se usa el nombre de una columna que ya existía para remplazar sus valores:

In [6]:
df["Hora del desayuno"] = pd.Series(["10:30", "06:30", "06:00", "07:00", "08:00"])
df

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno,Frutas,Horas del desayuno
0,Pepinillo Hernández,Korn Floks,10:30,Pera,10:30
1,Lúpulo de Dios,Verdurinis,06:30,Manzana,06:30
2,Juan Juon,Zumbaritas,06:00,Plátano,06:00
3,Jimmy el Patatas,"Diabetukis, Papá",07:00,Guayaba,07:00
4,Lorenzo Retaguardias,Fibra Máxima 3000,08:00,Pizza,08:00


Ahora, para eliminar la columna de `Frutas` se hace uso de la forma:

`variable_dataframe.drop(columns=-lista de columnas a borrar-)`

In [7]:
df.drop(columns=["Frutas", "Horas del desayuno"])

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno
0,Pepinillo Hernández,Korn Floks,10:30
1,Lúpulo de Dios,Verdurinis,06:30
2,Juan Juon,Zumbaritas,06:00
3,Jimmy el Patatas,"Diabetukis, Papá",07:00
4,Lorenzo Retaguardias,Fibra Máxima 3000,08:00


In [8]:
df

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno,Frutas,Horas del desayuno
0,Pepinillo Hernández,Korn Floks,10:30,Pera,10:30
1,Lúpulo de Dios,Verdurinis,06:30,Manzana,06:30
2,Juan Juon,Zumbaritas,06:00,Plátano,06:00
3,Jimmy el Patatas,"Diabetukis, Papá",07:00,Guayaba,07:00
4,Lorenzo Retaguardias,Fibra Máxima 3000,08:00,Pizza,08:00


Recuerda que estos métodos sólo regresan "vistas". Para que el cambio permanezca, tenemos que asignar el resultado de la operación a la variable `df` o a alguna otra variable:

In [9]:
df_sin_frutas = df.drop(columns=["Frutas", "Horas del desayuno"])
df_sin_frutas

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno
0,Pepinillo Hernández,Korn Floks,10:30
1,Lúpulo de Dios,Verdurinis,06:30
2,Juan Juon,Zumbaritas,06:00
3,Jimmy el Patatas,"Diabetukis, Papá",07:00
4,Lorenzo Retaguardias,Fibra Máxima 3000,08:00


---
---
## Reto 4: Manipulación de Columnas

### 1. Objetivos:
    - Practicar asignar, reasignar y eliminar columnas de `DataFrames`
 
---
    
### 2. Desarrollo:

a) Transformación de `DataFrames`

Eres de nuevo el Data Wrangler Inc. Tienes el mismo conjunto de datos que en el Reto pasado:

In [None]:
datos_productos = {
    "nombre": ["Pokemaster", "Cegatron", "Pikame Mucho", "Lazarillo de Tormes", "Stevie Wonder", "Needle", "El AyMeDuele"],
    "precio": [10000, 5500, 3500, 750, 15500, 12250, 23000],
    "peso": [1.2, 1.5, 2.3, 5.5, 3.4, 2.4, 8.8],
    "capacidad de destrucción retinal": [3, 7, 6, 8, 9, 2, 10],
    "disponible": [True, False, True, True, False, False, True]
}

indice = [1, 2, 3, 4, 5, 6, 7]

Esta vez el Analista de Datos te hace 3 nuevos pedidos que incluyen la creación de una nueva columna, la asignación de nuevos datos a una columna y la eliminación de un par de columnas.

Crea un `DataFrame` usando `datos_productos` e `indice` y realiza sus pedidos.

In [None]:
## Realiza aquí los imports necesarios

In [None]:
df_productos = 
df_productos

In [None]:
# Agrega por favor una columna con el nombre
# "nivel de dolor" a `df_procutos_2` con los
# valores de columna_nueva
columna_nueva = [4, 7, 6, 8, 9, 7, 3]
df_productos_2 = df_productos.copy()

df_productos_2[] = 
df_productos_2

In [None]:
# Modifica por favor el DataFrame `df_productos_3`
# cambiando la columna `precio` por la información
# contenida en `precios_descuento`
precios_descuento = [8000, 4000, 2000, 500, 14000, 10000, 15000]
df_productos_3 = df_productos.copy()

# modifica df_productos_3 aquí
df_productos_3

In [None]:
# Elimina por favor las columnas "precio" y "peso"
# de `df_productos` y asigna el resultado a
# `df_productos_4`
df_productos_4 =
df_productos_4