## Acceder a registros usando `.loc[]` (accesor)

In [None]:
import pandas as pd, numpy as np

###  `.loc[ ]` es para acceder a registros mediante ETIQUETAS DE ÍNDICES

En pandas, `.loc[]` es otro método fundamental de selección de datos utilizado con objetos DataFrame y Series. Representa el índice "basado en etiquetas", lo que significa que accedes a los datos utilizando las etiquetas de filas o columnas.

### Características Clave de `.loc[]`
1. **Indexación Basada en Etiquetas**: Te permite seleccionar filas y columnas basadas en sus etiquetas. Las etiquetas pueden ser números, cadenas de texto u otros objetos de Python.

2. **Segmentación con Etiquetas**: `loc[]` usa segmentación basada en etiquetas. Esto significa que la etiqueta final en la segmentación es inclusiva.

3. **Indexación Booleana**: También puedes usar condiciones booleanas para la selección con `loc[]`.

4. **Acceso a Filas y Columnas**: `loc[]` se utiliza para acceder tanto a filas como a columnas por etiquetas.

### Cómo Utilizar `.loc[]`
#### Seleccionando Filas y Columnas
1. **Fila o Columna Única**:
   * Selecciona la fila con la etiqueta de índice 'a': `df.loc['a']`
   * Selecciona la columna con la etiqueta 'A': `df.loc[:, 'A']`

2. **Múltiples Filas o Columnas**:
   * Selecciona filas con etiquetas de índice de 'a' a 'c': `df.loc['a':'c']` (Tanto 'a' como 'c' están incluidos.)
   * Selecciona columnas de 'A' a 'C': `df.loc[:, 'A':'C']`

3. **Filas y Columnas Específicas**:
   * Selecciona filas 'a', 'c' y 'e' y columnas 'A' y 'B': `df.loc[['a', 'c', 'e'], ['A', 'B']]`

4. **Indexación Booleana**:
   * Selecciona filas donde la columna 'A' es mayor que 1: `df.loc[df['A'] > 1]`


In [None]:
#ejemplo:

# Creando DataFrame con etiquetas
data={'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}

df=pd.DataFrame(data,index=['a','b','c'])
df

In [None]:
pd.DataFrame(data)

In [None]:
pd.DataFrame(data).loc[0]

In [None]:
#Usar loc para seleccionar fila con índice 'a'
row_a=df.loc['a']
row_a

In [None]:
#Usar loc para la columna A
column_A=df.loc[:,'A']
column_A

In [None]:
df.loc[:,'A':'C']

In [None]:
#Seleccionando un subconjunto específico
subset=df.loc['a':'b','B':'C'] #subset=subconjunto, una parte del todo. 
subset

# Utilizando nuestro dataset de empleados

In [None]:
df=pd.read_csv('empleados_3.csv',parse_dates=['fh_ant'])
df.head()

In [None]:
df.set_index('fh_ant',inplace=True)
df.sort_index(inplace=True)#ordenando el índice
df.head(7)

In [None]:
df[['salario']].plot()

In [None]:
#Ejemplos: Si queremos acceder al registo con fh_ant '2023-04-23':
df.loc['2023-04-23']

In [None]:
df.loc['2023/04/23']

In [None]:
df.loc['2023.04.23']

In [None]:
df.loc['23-Apr-2023']

In [None]:
df.loc['April 23, 2023']

In [None]:
df.loc['Apr 23, 2023']

In [None]:
df.reset_index(inplace=True)
df.set_index('nombre',inplace=True)
df.head(3)

In [None]:
df.loc['Fernando']

In [None]:
df.loc['Paola']

In [None]:
df.loc['Carlos']

In [None]:
df.sort_index(inplace=True)
df.head()

In [None]:
#Slicing
df.loc['Alejandro':'Natasha'] #aquí el segundo valor sí es inclusivo

In [None]:
df.loc['Alejandro':'Natasha':2] #aquí el segundo valor sí es inclusivo

In [None]:
df.loc['Paola':] #aquí el segundo valor sí es inclusivo

In [None]:
df.loc[:'Dario'] #aquí el segundo valor sí es inclusivo

In [None]:
df.loc[['Ana','Constanza','Natasha']]

In [None]:
df.loc[['Ana','Constanza','Natasha','Carlos']]

In [None]:
'Carlos' in df.index

In [None]:
'Ana' in df.index

## Extraer registros mediante su posición en el índice --> `iloc[ ]`


En pandas, `iloc[]` es un método fundamental para la selección de datos utilizado principalmente en objetos DataFrame y Series. Representa el índice basado en la posición entera, lo que te permite acceder a los datos por su índice entero.

### Características Clave de `iloc[]`
1. **Indexación Entera**: Utiliza la indexación basada en enteros, similar a las listas de Python. Se utiliza para seleccionar filas y columnas por sus posiciones de índice enteras.

2. **Segmentación**: Al igual que con las listas de Python, puedes usar la segmentación con `iloc[]` para seleccionar múltiples filas o columnas.

3. **Basado en Índice**: La indexación se basa estrictamente en la posición entera de la fila/columna, comenzando desde `0`.

### Cómo Usar `iloc[]`

#### Seleccionando Filas y Columnas

1. **Fila o Columna Única**:
   - Selecciona la primera fila: `df.iloc[0]`
   - Selecciona la primera columna: `df.iloc[:, 0]` (El dos puntos `:` indica todas las filas y `0` es el índice de la columna.)

2. **Múltiples Filas o Columnas**:
   - Selecciona las primeras tres filas: `df.iloc[0:3]`
   - Selecciona las primeras tres columnas: `df.iloc[:, 0:3]`
   - Selecciona filas de 1 a 3 y columnas de 2 a 4: `df.iloc[1:4, 2:5]`

3. **Filas y Columnas Específicas**:
   - Selecciona filas 1, 3 y 5 y las primeras dos columnas: `df.iloc[[1, 3, 5], [0, 1]]`

4. **Indexación Negativa**:
   - Selecciona la última fila: `df.iloc[-1]`
   - Selecciona las últimas tres filas: `df.iloc[-3:]`


In [None]:
#ejemplo:

# Creando DataFrame con etiquetas
data={'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}

df=pd.DataFrame(data,index=['a','b','c'])
df

In [None]:
#usando iloc para seleccionar primera fila
primera_fila=df.iloc[0]
primera_fila

In [None]:
#usando iloc para seleccionar segunda columna
segunda_col=df.iloc[:,1]
segunda_col

In [None]:
#subset
subset=df.iloc[0:2,1:3]
subset

In [None]:
df

In [None]:
df=pd.read_csv('empleados_3.csv',parse_dates=['fh_ant'])
df.set_index('fh_ant',inplace=True)
df.sort_index(inplace=True)#ordenando el índice
df.reset_index(inplace=True)
df.set_index('nombre',inplace=True)
df.head(3)
df.sort_index(inplace=True)
df.head()

In [None]:
df.iloc[0] #primera fila

In [None]:
type(df.iloc[0])

In [None]:
df.iloc[[14,17]]

In [None]:
df.iloc[[14,17],[2,4]]

In [None]:
df.iloc[14:17,2:4]

In [None]:
df.iloc[4:8]

In [None]:
#Con iloc[] el segundo valor NO es inclusivo. 

In [None]:
df.reset_index(inplace=True)
df.head()

In [None]:
df.iloc[:4] #primeros 4 registros

In [None]:
#Sí puede por .loc(por etiqueta) e .iloc(por posicion) sí pueden modificar/transformar valores de un DataFrame. 

In [None]:
df.iloc[0,0]='Carlos'

In [None]:
df.iloc[:4]

In [None]:
df.iloc[0,0]=1

In [None]:
df.iloc[:4]

In [None]:
df.iloc[[2,4,5,6,8,50]]

In [None]:
df.iloc[15:] #del 15 al final

In [None]:
#si un valor no existe, nos manda error
df.iloc[650]

In [None]:
#manejo de erroes
try:
    #códiogo que puede fallar 
    x=int(input("n: "))
except ValueError as e:
    print("Entrada invalida:",e)
else:
    print("Todo ok, x=",x) #sólo si NO hubo excepción
finally:
    print("Siempre se ejecuta, limpieza, cerrar")

In [None]:
df.set_index('fh_ant',inplace=True)
df.head(9)

# Extraer combinaciones de renglón-columna

In [None]:
df.loc['2013-04-04']

In [None]:
#df.loc[renglon,columna]
df.loc['2013-04-04','nombre']

In [None]:
df.loc['2013-04-04',['nombre','salario']]

In [None]:
df.loc[['2013-04-04','1991-03-22'],['nombre','salario']]

In [None]:
df.head(3)

In [None]:
df.loc['2013-04-04','nombre':'pct bono']

In [None]:
df.loc[['2013-04-04'],'nombre':'pct bono']

In [None]:
df.sort_index(inplace=True)
df.head()

In [None]:
df.loc['1980-02-18':'1980-07-04','nombre':'es_directivo']

In [None]:
df.loc[:'2020-04-28',:'es_directivo']

In [None]:
df.iloc[10:12,0:5]

In [None]:
df.iloc[10:12,[0,2,3]]

In [None]:
df.reset_index(inplace=True)
df.head()

In [None]:
#Supongan que quieren cambiar una celda. intersección fila-columna
#df.loc[renglon,columna]

In [None]:
df.loc[1,'area']='marketing'
df.head()

In [None]:
#quiero cambiar múltiples valores:
#Sup quiero cambiar, para Paola, los valores del bono y de equipo
df.loc[1,['pct bono','area']]=[13,'finanzas']
df.head()

In [None]:
df.set_index('area',inplace=True)
df.head(3)

In [None]:
df.index.isna()

In [None]:
#Si quieren ver las variables 'género' y fh_ant para los registros que tienen nulo 
#en el índice
df[df.index.isna()].loc[:,['fh_ant','genero']]

In [None]:
df.reset_index(inplace=True)
df.head()

In [None]:
df.nombre.value_counts()

In [None]:
#supongamos que queremos cambiar el nombre: siempre que diga Alejandro, ahora que diga Alex

In [None]:
is_Alejandro = df['nombre']=='Alejandro'
is_Alejandro

In [None]:
df.loc[is_Alejandro,:]

In [None]:
df.loc[is_Alejandro,'nombre']

In [None]:
df.loc[is_Alejandro,'nombre']='Alex'

In [None]:
df.loc[is_Alejandro,'nombre']

In [None]:
df.loc[is_Alejandro,:]

In [None]:
is_Alejandro.sum()

In [None]:
any(is_Alejandro) #hay al menos uno

In [None]:
is_Alejandro.idxmax() #posicion donde ocurre el primer True

In [None]:
is_Alejandro

In [None]:
for renglon in is_Alejandro.index:
    print (renglon)

In [None]:
is_Alejandro

In [None]:
[i for i in is_Alejandro.index if is_Alejandro[i]]

In [None]:
#Si quisiéramos saber todas las posiciones con Valor igual a True de is_Alejandro:
#list_comprehension


In [None]:
is_Alejandro[12]

In [None]:
df.iloc[[i for i in is_Alejandro.index if is_Alejandro[i]]]

# List Comprehension

La comprensión de listas en Python es una forma concisa de crear listas. Ofrece una sintaxis más corta cuando quieres crear una nueva lista basada en los valores de una lista existente.

### Características Clave de las Comprensiones de Lista
1. **Concisa**: Permite escribir menos líneas de código para realizar operaciones comunes de listas, como filtrar elementos o aplicar una función a cada elemento.
2. **Expresiva**: Hace que el código sea más legible y expresivo.
3. **Eficiente**: En muchos casos, las comprensiones de lista son más eficientes en términos de tiempo de ejecución y uso de memoria que los bucles for tradicionales.

### Cómo Usar las Comprensiones de Lista

#### Sintaxis Básica
La sintaxis básica de una comprensión de lista es:
```python
[new_item for item in iterable if condition]
```

* new_item: La expresión que define cómo modificar los elementos del iterable.
* iterable: La colección de elementos que queremos iterar.
* condicion: Un filtro opcional para incluir solo aquellos elementos que cumplan con la condición.


In [None]:
#Ejemplo 1
cuadrados=[x**2 for x in range(10)]
cuadrados

In [None]:
#Ejemplo 2
lista=[1,2,3,4,5]
pares=[x for x in lista if x%2==0]
pares

In [None]:
df.head()

In [None]:
#formas de borrar columnas de un df com método pop
df.pop('genero')

In [None]:
df

In [None]:
df.pop('fh_ant')

In [None]:
df

In [None]:
#otro metodo para quitar mas usado es el drop
df.drop(1) #quitando el renglon con índice igual a 1
#drop no es permenante, a menos que inplce=True

In [None]:
#también pueden quitar columnas con drop
df.drop("area",axis=1)

###  Utilizando nuestro dataset de empleados

## Extraer registros mediante su posición en el índice --> `iloc[ ]`

En pandas, `iloc[]` es un método fundamental para la selección de datos utilizado principalmente en objetos DataFrame y Series. Representa el índice basado en la posición entera, lo que te permite acceder a los datos por su índice entero.

### Características Clave de `iloc[]`
1. **Indexación Entera**: Utiliza la indexación basada en enteros, similar a las listas de Python. Se utiliza para seleccionar filas y columnas por sus posiciones de índice enteras.

2. **Segmentación**: Al igual que con las listas de Python, puedes usar la segmentación con `iloc[]` para seleccionar múltiples filas o columnas.

3. **Basado en Índice**: La indexación se basa estrictamente en la posición entera de la fila/columna, comenzando desde `0`.

### Cómo Usar `iloc[]`

#### Seleccionando Filas y Columnas

1. **Fila o Columna Única**:
   - Selecciona la primera fila: `df.iloc[0]`
   - Selecciona la primera columna: `df.iloc[:, 0]` (El dos puntos `:` indica todas las filas y `0` es el índice de la columna.)

2. **Múltiples Filas o Columnas**:
   - Selecciona las primeras tres filas: `df.iloc[0:3]`
   - Selecciona las primeras tres columnas: `df.iloc[:, 0:3]`
   - Selecciona filas de 1 a 3 y columnas de 2 a 4: `df.iloc[1:4, 2:5]`

3. **Filas y Columnas Específicas**:
   - Selecciona filas 1, 3 y 5 y las primeras dos columnas: `df.iloc[[1, 3, 5], [0, 1]]`

4. **Indexación Negativa**:
   - Selecciona la última fila: `df.iloc[-1]`
   - Selecciona las últimas tres filas: `df.iloc[-3:]`


## Extraer combinaciones de renglon -columna

If variable is True <-> if variable (cuando variable es de tipo booleana)

## List Comprehension

La comprensión de listas en Python es una forma concisa de crear listas. Ofrece una sintaxis más corta cuando quieres crear una nueva lista basada en los valores de una lista existente.

### Características Clave de las Comprensiones de Lista
1. **Concisa**: Permite escribir menos líneas de código para realizar operaciones comunes de listas, como filtrar elementos o aplicar una función a cada elemento.
2. **Expresiva**: Hace que el código sea más legible y expresivo.
3. **Eficiente**: En muchos casos, las comprensiones de lista son más eficientes en términos de tiempo de ejecución y uso de memoria que los bucles for tradicionales.

### Cómo Usar las Comprensiones de Lista

#### Sintaxis Básica
La sintaxis básica de una comprensión de lista es:
```python
[new_item for item in iterable if condition]
```

* new_item: La expresión que define cómo modificar los elementos del iterable.
* iterable: La colección de elementos que queremos iterar.
* condicion: Un filtro opcional para incluir solo aquellos elementos que cumplan con la condición.
