# Acceder a Elementos del DataFrame con 'loc' e 'iloc'

Ahora veamos cómo podemos acceder a diferentes partes de nuestros DataFrames. Y cuando digo acceder a *partes* me refiero justamente a eso, no solo a elementos individuales, sino a segmentos enteros que representen algún interés para nosotros como científicos de datos.

Antonces ahora vamos a aprender la diferencia entre `loc` e `iloc`, y cómo usarlos para acceder a diferentes partes de nuestros DataFrames.

Vamos primero con `loc`, que se utiliza para seleccionar filas y columnas **a partir de sus etiquetas**.

In [1]:
import pandas as pd

In [2]:
df = pd.DataFrame({
    'Col1': [100, 200, 300],
    'Col2': [400, 500, 600],
    'Col3': [700, 800, 900]
}, index=['fila1', 'fila2', 'fila3'])

df

Unnamed: 0,Col1,Col2,Col3
fila1,100,400,700
fila2,200,500,800
fila3,300,600,900


In [3]:
df.loc['fila1']

Col1    100
Col2    400
Col3    700
Name: fila1, dtype: int64

En este caso, a través de la etiqueta **fila1**, he recibido todos los datos almacenados en esa fila, y los he recibido indexados con las etiquetas de las columnas.

Esto tiene pinta de ser una serie. Permíteme comprobarlo.

In [4]:
type(df.loc['fila1'])

pandas.core.series.Series

También podemos pasar una **lista** de etiquetas.

In [5]:
df.loc[['fila1', 'fila3']]

Unnamed: 0,Col1,Col2,Col3
fila1,100,400,700
fila3,300,600,900


Epa. Esto ya no parece una serie ¿será un DataFrame?

In [6]:
type(df.loc[['fila1', 'fila3']])

pandas.core.frame.DataFrame

Y ya que estamos probemos con una **segmentación**.

In [7]:
df.loc['fila2':'fila3']

Unnamed: 0,Col1,Col2,Col3
fila2,200,500,800
fila3,300,600,900


Observa que a diferencia de la segmentación habitual en el resto de python, cuando segmentamos con `loc`, el número final **sí es inclusivo**.

También podemos pasarle una **lista de booleanos**, pero siempre tiene que ser del mismo largo que el eje que queremos seleccionar.

In [8]:
df.loc[[False, True, False]]

Unnamed: 0,Col1,Col2,Col3
fila2,200,500,800


También podemos seleccionar aquellas filas que cumplan alguna condición.

In [9]:
df.loc[df['Col1'] > 150]

Unnamed: 0,Col1,Col2,Col3
fila2,200,500,800
fila3,300,600,900


Si queremos traer **columnas** en vez de filas, tenemos que hacerlo de la siguiente manera:

In [10]:
df.loc[:, ['Col1', 'Col2']]

Unnamed: 0,Col1,Col2
fila1,100,400
fila2,200,500
fila3,300,600


En resumen, `loc` nos permite seleccionar filas y columnas basándonos en sus **etiquetas**. Y esta es la diferencia principal con su hermana casi gemela que es `iloc`, que hace básicamente lo mismo pero no basándose en las etiquetas, sino en las **posiciones numéricas**.

In [11]:
df.iloc[0]

Col1    100
Col2    400
Col3    700
Name: fila1, dtype: int64

El resto es básicamente igual, pero cambiando las etiquetas por posiciones. Por ejemplo si queremos seleccionar varias columnas:

In [12]:
df.iloc[:, [0,1]]

Unnamed: 0,Col1,Col2
fila1,100,400
fila2,200,500
fila3,300,600


Si quiero seleccionar un rango de filas:

In [13]:
df.iloc[1:3]

Unnamed: 0,Col1,Col2,Col3
fila2,200,500,800
fila3,300,600,900


Aquí observa que al cambiar a índices, nuestro número final dejó de ser inclusivo, y ahora tenemos que poner el índice siguiente para incluir al que nos interesa.

Entonces, aunque `loc` e `iloc` pueden parecer similares, es importante recordar que `loc` trabaja con etiquetas e `iloc` con posiciones numéricas. 

Cuál vas a elegir, depende de cómo desees acceder a los datos de tu DataFrame.