<div style="width: 90%; height: 100px; background-color: #ffffff; border: 3px solid #d62d20; text-align: center; line-height: 100px; color: #0057e7; font-size: 24px; font-weight: bold; border-radius:6px;">
    📉 Diferencias entre los e iloc en Pandas 📈
</div>

<div style="text-align:center; border: 1px solid black; padding: 10px;">
    <img src="https://i.ytimg.com/vi/p9eIhvmALgo/maxresdefault.jpg" alt="Descripción de la imagen" style="width: 50%; height: auto;">
</div>


La selección de elementos en los DataFrames de Pandas se puede realizar mediante dos metodos: **loc** e **iloc**. Aunque, en algunos casos, pueden parecer intercambiables, no es asi. Existen importantes diferencias entre **loc** e **iloc**. Conocer estas permite seleccionar la opción más adecuadas en cada caso.

- Prinicpal diferencias entre **loc** e **iloc**

La principal diferencia que existe entre loc e iloc es que en `loc` se usan las etiquetas (los nombres asignados tanto a las filas como a las columnas) mientras que en `iloc` se usan los índices de los elementos (la posición en la fila o la columna, comenzando a contar en 0). Algo que se puede usar para recordar cual se debe usar, al trabajar con índice se debe emplear el que comienza por **i**.


- Seleccionar los elementos de un DataFrame con **loc** e **iloc**

Para analizar las diferencias entre loc e iloc se puede crear un conjunto de datos aleatorio en el que se asignan los nombres tanto a las filas como a las columnas. Por ejemplo, como el del siguiente codigo.

![image.png](attachment:image.png)

In [1]:
import numpy as np
import pandas  as pd

In [41]:
np.random.seed(0)

df = pd.DataFrame(np.random.randint(low = 10 ,high = 20,size = (5,3)),
                  index= ['A','B','C','D','E'],
                  columns = ['col1','col2','col3'])
display(df)

Unnamed: 0,col1,col2,col3
A,15,10,13
B,13,17,19
C,13,15,12
D,14,17,16
E,18,18,11


## **loc**

- Selección de filas con **loc**

Ahora, para seleccionar la fila que se ha etiquetado como 'A' se debe usar `loc`con el nombre de la fila entre cochetes

In [50]:
display(df.loc['A'])
print(type(df.loc['A']))

col1    15
col2    10
col3    13
Name: A, dtype: int64

<class 'pandas.core.series.Series'>


In [46]:
display(df.loc[['A']])
print(type(df.loc[['A']]))

Unnamed: 0,col1,col2,col3
A,15,10,13


<class 'pandas.core.frame.DataFrame'>


Si se desea seleccionar más de una fila se puede usar una lista con todos los nombres de todas las filas que se desee.

In [51]:
df.loc[['A','C']]

Unnamed: 0,col1,col2,col3
A,15,10,13
C,13,15,12


Tambien se puede seleccionar un rango. Para ello se pondra el nombre de la primera fila, dos puntos y el de la última que se desee mostrar.

In [53]:
df.loc['B':'D']

Unnamed: 0,col1,col2,col3
B,13,17,19
C,13,15,12
D,14,17,16


Notese que, en este caso, a diferencia de los rangos definidos en Python, la ultima fila tambien se incluira en la selección.

## **iloc**

- Selección de filas con **iloc**

La misma selección de elementos que se ha realizado en la selección anterior se puede hacer con **iloc**, solamente que ahora se debe indicar el indice y no el nombre. Asi, para seleccionar la primera fila se indicara con un 0.

In [54]:
df.iloc[0]

col1    15
col2    10
col3    13
Name: A, dtype: int64

In [61]:
df.iloc[[-1]]

Unnamed: 0,col1,col2,col3
E,18,18,11


In [55]:
df.iloc[[0]]

Unnamed: 0,col1,col2,col3
A,15,10,13


Al igual que antes se puede usar una lista para seleccionar más de un elemento.

In [59]:
df.iloc[[1,4]]

Unnamed: 0,col1,col2,col3
B,13,17,19
E,18,18,11


Tambien se puede usar rangos separando los indices con dos puntos. Solo que, a diferencia de **loc** , el ultimo indice no se incluira en la selección, por lo que se debe indicar el siguiente.

In [62]:
df.iloc[1:4]

Unnamed: 0,col1,col2,col3
B,13,17,19
C,13,15,12
D,14,17,16


Notese que en antes con **loc** se usó `B`: `D` y ahora ha sido necesario indicar 1:4 para obtener el mismo resultado. Una diferencia importante entre **loc** e **iloc**.

- Selección de columnas con **loc** e **iloc**

Tanto `loc` como `iloc` admiten como segundo parámetro la columna o columnas que se desea seleccionar. Usando la misma sintaxis que para las filas. Si se desea obtener los valores de todas las filas se debe pasar dos puntos como primer parámetro. Así, para obtener los valores de la segunda columna del conjunto de datos con loc se debería hacer.

In [63]:
df.loc[:,'col2']

A    10
B    17
C    15
D    17
E    18
Name: col2, dtype: int64

Mientras que para obtener los mismos resultados con `iloc`el comando sería el siguiente:

In [66]:
df.iloc[:,1]

A    10
B    17
C    15
D    17
E    18
Name: col2, dtype: int64

Siendo posible emplear todo lo visto hasta ahora para seleccionar un subconjunto de filas o columnas. Por ejemplo, para seleccionar un rango de filas y un listado de columnas con `loc`se puede usar.

In [69]:
df.loc['A':'C','col1':'col3']

Unnamed: 0,col1,col2,col3
A,15,10,13
B,13,17,19
C,13,15,12


In [71]:
df.loc['A':'C',['col2','col3']]

Unnamed: 0,col2,col3
A,10,13
B,17,19
C,15,12


In [70]:
df.loc[['A','C'],['col1','col3']]

Unnamed: 0,col1,col3
A,15,13
C,13,12


comando que tiene su equivalente con **iloc**

In [72]:
df.iloc[0:2,1:3]

Unnamed: 0,col2,col3
A,10,13
B,17,19


In [73]:
df.iloc[0:2,[0,1]]

Unnamed: 0,col1,col2
A,15,10
B,13,17


In [75]:
df.iloc[[0,3],[1,2]]

Unnamed: 0,col2,col3
A,10,13
D,17,16


<div style="width: 90%; height: 100px; background-color: #ffffff; border: 3px solid #d62d20; text-align: center; line-height: 100px; color: #0057e7; font-size: 24px; font-weight: bold; border-radius:6px;">
    Gracias por su atencion 😎
</div>