## Ejemplo 4: Manipulación de columnas

### 1. Objetivos:
    - Aprender a crear nuevas columnas en un `DataFrame`
    - Aprender a reasignar columnas
    - Aprender a eliminar columnas
 
---
    
### 2. Desarrollo:

In [1]:
import pandas as pd

Tenemos aquí un `DataFrame`:

In [2]:
datos = {
    "Nombre": ["Pepinillo Hernández", "Lúpulo de Dios", "Juan Juon", "Jimmy el Patatas", "Lorenzo Retaguardias"],
    "Cereal favorito": ["Korn Floks", "Verdurinis", "Zumbaritas", "Diabetukis, Papá", "Fibra Máxima 3000"],
    "Hora del desayuno": ["11:00", "07:30", "07:00", "08:30", "09:30"]
}

df = pd.DataFrame(datos)
df

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno
0,Pepinillo Hernández,Korn Floks,11:00
1,Lúpulo de Dios,Verdurinis,07:30
2,Juan Juon,Zumbaritas,07:00
3,Jimmy el Patatas,"Diabetukis, Papá",08:30
4,Lorenzo Retaguardias,Fibra Máxima 3000,09:30


Agregar una nueva columna de `Frutas`:

In [19]:
df["Frutas"] = pd.Series(["Pera", "Manzana", "Plátano", "Guayaba","Pizza"])
df1 = df[["Nombre", "Cereal favorito", "Frutas", "Hora del desayuno"]]
df1

Unnamed: 0,Nombre,Cereal favorito,Frutas,Hora del desayuno
0,Pepinillo Hernández,Korn Floks,Pera,10:30
1,Lúpulo de Dios,Verdurinis,Manzana,06:30
2,Juan Juon,Zumbaritas,Plátano,06:00
3,Jimmy el Patatas,"Diabetukis, Papá",Guayaba,07:00
4,Lorenzo Retaguardias,Fibra Máxima 3000,Pizza,08:00


Modifica los valores de las horas del desayuno por:

    "10:30", "06:30", "06:00", "07:00", "08:00"

In [9]:
df["Hora del desayuno"] = pd.Series(["10:30", "06:30", "06:00", "07:00", "08:00"])
df

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno,Frutas
0,Pepinillo Hernández,Korn Floks,10:30,Pera
1,Lúpulo de Dios,Verdurinis,06:30,Manzana
2,Juan Juon,Zumbaritas,06:00,Plátano
3,Jimmy el Patatas,"Diabetukis, Papá",07:00,Guayaba
4,Lorenzo Retaguardias,Fibra Máxima 3000,08:00,Pizza


Ahora elimina la columna de `Frutas`:

In [22]:
df_sin_frutas = df.drop(columns=["Frutas"])
df_sin_frutas

Unnamed: 0,Nombre,Cereal favorito,Hora del desayuno
0,Pepinillo Hernández,Korn Floks,10:30
1,Lúpulo de Dios,Verdurinis,06:30
2,Juan Juon,Zumbaritas,06:00
3,Jimmy el Patatas,"Diabetukis, Papá",07:00
4,Lorenzo Retaguardias,Fibra Máxima 3000,08:00


Recuerda que estos métodos sólo regresan "vistas". Para que el cambio permanezca, tenemos que asignar el resultado de la operación a la variable `df` o a alguna otra variable:

In [23]:
df_2 = df.drop(columns=["Nombre"])
df_2

Unnamed: 0,Cereal favorito,Hora del desayuno,Frutas
0,Korn Floks,10:30,Pera
1,Verdurinis,06:30,Manzana
2,Zumbaritas,06:00,Plátano
3,"Diabetukis, Papá",07:00,Guayaba
4,Fibra Máxima 3000,08:00,Pizza


---
---
## Reto 4: Manipulación de Columnas

### 1. Objetivos:
    - Practicar asignar, reasignar y eliminar columnas de `DataFrames`
 
---
    
### 2. Desarrollo:

a) Transformación de `DataFrames`

Eres de nuevo el Data Wrangler Inc. Tienes el mismo conjunto de datos que en el Reto pasado:

In [25]:
datos_productos = {
    "nombre": ["Pokemaster", "Cegatron", "Pikame Mucho", "Lazarillo de Tormes", "Stevie Wonder", "Needle", "El AyMeDuele"],
    "precio": [10000, 5500, 3500, 750, 15500, 12250, 23000],
    "peso": [1.2, 1.5, 2.3, 5.5, 3.4, 2.4, 8.8],
    "capacidad de destrucción retinal": [3, 7, 6, 8, 9, 2, 10],
    "disponible": [True, False, True, True, False, False, True]
}

indice = [1, 2, 3, 4, 5, 6, 7]

Esta vez el Analista de Datos te hace 3 nuevos pedidos que incluyen la creación de una nueva columna, la asignación de nuevos datos a una columna y la eliminación de un par de columnas. Crea un `DataFrame` usando `datos_productos` e `indice` y realiza sus pedidos.

In [None]:
## Realiza aquí los imports necesarios

In [26]:
df_productos = pd.DataFrame(datos_productos, index=indice)
df_productos

Unnamed: 0,nombre,precio,peso,capacidad de destrucción retinal,disponible
1,Pokemaster,10000,1.2,3,True
2,Cegatron,5500,1.5,7,False
3,Pikame Mucho,3500,2.3,6,True
4,Lazarillo de Tormes,750,5.5,8,True
5,Stevie Wonder,15500,3.4,9,False
6,Needle,12250,2.4,2,False
7,El AyMeDuele,23000,8.8,10,True


In [32]:
# Agrega por favor una columna con el nombre
# "nivel de dolor" a `df_procutos_2`
columna_nueva = [4, 7, 6, 8, 9, 7, 3]
df_productos_2 = df_productos.copy()
df_productos_2["nivel de color"] = pd.Series(columna_nueva,
    index=indice)
df_productos_2

Unnamed: 0,nombre,precio,peso,capacidad de destrucción retinal,disponible,nivel de color
1,Pokemaster,10000,1.2,3,True,4
2,Cegatron,5500,1.5,7,False,7
3,Pikame Mucho,3500,2.3,6,True,6
4,Lazarillo de Tormes,750,5.5,8,True,8
5,Stevie Wonder,15500,3.4,9,False,9
6,Needle,12250,2.4,2,False,7
7,El AyMeDuele,23000,8.8,10,True,3


In [41]:
# Modifica por favor el `DataFrame` `df_productos_3`
# cambiando la columna `precio` por la información
# contenida en `precios_descuento`
precios_descuento = [8000, 4000, 2000, 500, 14000, 10000, 15000]
df_productos_3 = df_productos.copy()
df_productos_3["precio"] = pd.Series(precios_descuento,
    index=indice)
df_productos_3

Unnamed: 0,nombre,precio,peso,capacidad de destrucción retinal,disponible
1,Pokemaster,8000,1.2,3,True
2,Cegatron,4000,1.5,7,False
3,Pikame Mucho,2000,2.3,6,True
4,Lazarillo de Tormes,500,5.5,8,True
5,Stevie Wonder,14000,3.4,9,False
6,Needle,10000,2.4,2,False
7,El AyMeDuele,15000,8.8,10,True


In [40]:
# Modifica por favor el `DataFrame` `df_productos_3`
# cambiando la columna `precio` por la información
# contenida en `precios_descuento`
precios_descuento = [8000, 4000, 2000, 500, 14000, 10000, 15000]
df_productos_5 = df_productos.copy()
df_productos_5["precio"] = precios_descuento
df_productos_5

Unnamed: 0,nombre,precio,peso,capacidad de destrucción retinal,disponible
1,Pokemaster,8000,1.2,3,True
2,Cegatron,4000,1.5,7,False
3,Pikame Mucho,2000,2.3,6,True
4,Lazarillo de Tormes,500,5.5,8,True
5,Stevie Wonder,14000,3.4,9,False
6,Needle,10000,2.4,2,False
7,El AyMeDuele,15000,8.8,10,True


In [29]:
# Elimina por favor las columnas "precio" y "peso"
# de `df_productos` y asigna el resultado a
# `df_productos_4`
df_productos_4 =
df_productos_4

SyntaxError: invalid syntax (<ipython-input-29-faf3718e3063>, line 4)