### **19 - Modificar o acceder a valores de una columna(s)**

In [2]:
import pandas as pd
import numpy as np

#### **`>` loc( )**

Accede a un grupo de filas y columnas por etiqueta(s) o un array booleano.

##### Ejemplo 1

In [5]:
de = pd.DataFrame([[1, 2], [4, 5], [7, 8]],
     index=['cobra', 'viper', 'sidewinder'],
     columns=['max_speed', 'shield'])

de

Unnamed: 0,max_speed,shield
cobra,1,2
viper,4,5
sidewinder,7,8


In [6]:
de.loc['viper']

max_speed    4
shield       5
Name: viper, dtype: int64

In [7]:
type(de.loc['viper'])

pandas.core.series.Series

In [8]:
de.loc[['viper', 'sidewinder']]

Unnamed: 0,max_speed,shield
viper,4,5
sidewinder,7,8


In [10]:
de.loc[de['shield'] > 6]

Unnamed: 0,max_speed,shield
sidewinder,7,8


In [11]:
de.loc[de['shield'] > 6, ['max_speed']]

Unnamed: 0,max_speed
sidewinder,7


In [12]:
de.loc[(de['max_speed'] > 1) & (de['shield'] < 8)]

Unnamed: 0,max_speed,shield
viper,4,5


In [14]:
de.loc[lambda de: de['shield'] == 8]

Unnamed: 0,max_speed,shield
sidewinder,7,8


In [16]:
de.loc[:, ['shield']]

Unnamed: 0,shield
cobra,2
viper,5
sidewinder,8


Y puedo modificar los valores de toda una columna

In [18]:
de.loc[:, ['shield']] = 30
de

Unnamed: 0,max_speed,shield
cobra,1,30
viper,4,30
sidewinder,7,30


#### **`>` apply( )**

Aplica una función a lo largo de un eje del DataFrame

##### Ejemplo 1

Creamos una función lambda que multiplique todos los valores de la columna **`altura`** por **`2`**

In [None]:
dp = pd.read_csv('datos_persona.csv')
dp

In [17]:
dp['altura'] = dp['altura'].apply(lambda x:x * 2)

dp

Unnamed: 0,indice,sexo,altura,peso,nombre
0,0,F,3.28,68,Javiera
1,1,M,3.06,43,Jose
2,2,M,3.74,90,Tomas
3,3,F,3.34,95,Maria
4,4,M,4.02,100,Jose
5,5,F,2.9,50,Magdalena
6,6,F,3.34,67,Trinidad
7,7,M,3.86,102,Gonzalo
8,8,M,3.44,76,David
9,9,M,3.28,68,Javier


##### Ejemplo 2

Creamos una función que eleve todos los valores de la columna **`peso`** a **`2`**

In [None]:
dp = pd.read_csv('datos_persona.csv')
dp

In [18]:
def square(x):
    return x ** 2

In [19]:
dp['peso'] = dp['peso'].apply(square)

dp

Unnamed: 0,indice,sexo,altura,peso,nombre
0,0,F,3.28,4624,Javiera
1,1,M,3.06,1849,Jose
2,2,M,3.74,8100,Tomas
3,3,F,3.34,9025,Maria
4,4,M,4.02,10000,Jose
5,5,F,2.9,2500,Magdalena
6,6,F,3.34,4489,Trinidad
7,7,M,3.86,10404,Gonzalo
8,8,M,3.44,5776,David
9,9,M,3.28,4624,Javier


#### **`>` where( )**

La función Python Pandas **`DataFrame.where()`** acepta una condición como parámetro y produce resultados en consecuencia. Comprueba la condición para cada valor del DataFrame y selecciona los valores que aceptan la condición. Su funcionalidad es similar a la declaración **`if-else`**. El valor que no acepta la condición es reemplazado por un valor **`NaN`** por defecto.

**`Sintaxis`**: DataFrame.where(
    cond,
    other=NaN,
    inplace=False,
    axis=None,
    level=None,
    errors="raise",
    try_cast=False
)

- **`condition`**:	Es una Series o DataFrame booleana, una estructura de tipo array o, una llamada. Representa la condición/condiciones para comprobar cada valor del DataFrame. Si la condición es True, entonces el valor original no es reemplazado. De lo contrario, es reemplazado por un valor NaN.
- **`other`**:	Es un escalar, Series/DataFrame, o un llamable. Representa el valor que se colocará para el valor original si la condición es False.
- **`inplace`**:	Es un valor booleano. Habla de la operación sobre los datos. Si es True, hace los cambios por sí mismo.
- **`axis`**:	Es un valor entero. Indica el eje de trabajo, ya sea filas o columnas.
- **`level`**:	Es un valor entero. Dice sobre el nivel.
- **`errors`**:	Es una cuerda. Cuenta los errores. Acepta dos opciones: raise o ignore. Si su valor es raise entonces permite que las excepciones sean aumentadas. Si su valor es ignore, entonces ignora las excepciones y devuelve el objeto original si hay un error.
- **`try_cast`**:	Es un valor booleano. Echa la salida de la función al tipo de entrada original si es posible.

##### Ejemplo 1

In [19]:
dataframe = pd.DataFrame(
    {
        "A": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95, 5: 45, 6: 67, 7: 12, 8: 23, 9: 50},
        "B": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45, 5: 35, 6: 74, 7: 52, 8: 93, 9: 18},
    }
)

dataframe

Unnamed: 0,A,B
0,60,90
1,100,75
2,80,82
3,78,64
4,95,45
5,45,35
6,67,74
7,12,52
8,23,93
9,50,18


In [9]:
dataframe1 = dataframe.where(dataframe > 50)
dataframe1

Unnamed: 0,A,B
0,60.0,90.0
1,100.0,75.0
2,80.0,82.0
3,78.0,64.0
4,95.0,
5,,
6,67.0,74.0
7,,52.0
8,,93.0
9,,


In [10]:
dataframe2 = dataframe.where(dataframe > 50, other=9999)
dataframe2

Unnamed: 0,A,B
0,60,90
1,100,75
2,80,82
3,78,64
4,95,9999
5,9999,9999
6,67,74
7,9999,52
8,9999,93
9,9999,9999


In [11]:
dataframe3 = dataframe.where((dataframe == 80) | (dataframe < 50), other=0)
dataframe3

Unnamed: 0,A,B
0,0,0
1,0,0
2,80,0
3,0,0
4,0,45
5,45,35
6,0,0
7,12,0
8,23,0
9,0,18


In [14]:
# Manten todos los valores iguales a 80 y lo demas dale el valor de 99999
dataframe4 = dataframe.where(lambda x: x==80, 99999)
dataframe4

Unnamed: 0,A,B
0,99999,99999
1,99999,99999
2,80,99999
3,99999,99999
4,99999,99999
5,99999,99999
6,99999,99999
7,99999,99999
8,99999,99999
9,99999,99999


In [15]:
# Manten todos los valores distintos a 80 y lo demas dale el valor de 99999
dataframe4 = dataframe.where(lambda x: x!=80, 99999)
dataframe4

Unnamed: 0,A,B
0,60,90
1,100,75
2,99999,82
3,78,64
4,95,45
5,45,35
6,67,74
7,12,52
8,23,93
9,50,18


In [21]:
dataframe5 = dataframe['A'].where(lambda x: x==80, 99999, inplace=True)
dataframe

Unnamed: 0,A,B
0,99999,90
1,99999,75
2,80,82
3,99999,64
4,99999,45
5,99999,35
6,99999,74
7,99999,52
8,99999,93
9,99999,18
