## Corchetes (1)


En el código de muestra, los mismos datos de automóviles se importan de un archivo CSV como un DataFrame de Pandas. Para seleccionar solo la columna *cars_per_cap* de *cars*, puede usar:

**cars['cars_per_cap']**  
**cars[['cars_per_cap']]**

La versión de un corchete ofrece una Serie Pandas, la versión de doble corchete ofrece un DataFrame de Pandas.

**Actividad**

* Use corchetes individuales para imprimir un Series de la columna *country* de *cars* .
* Use corchetes dobles para imprimir un DataFrame de la columna *country* de *carsun* .
* Use corchetes dobles para imprimir un DataFrame con las columnas *country* y *drives_right* de *cars*, en este orden.

In [3]:
# Import cars data
import pandas as pd
cars = pd.read_csv('data/cars.csv', sep =';', index_col=0)

# Print out country column as Pandas Series
print(cars['country'])

# Print out country column as Pandas DataFrame
print(cars[['country']])

# Print out DataFrame with country and drives_right columns
print(cars[['country', 'drives_right']])

US     United States
AUS        Australia
JPN            Japan
IN             India
RU            Russia
MOR          Morocco
EG             Egypt
Name: country, dtype: object
           country
US   United States
AUS      Australia
JPN          Japan
IN           India
RU          Russia
MOR        Morocco
EG           Egypt
           country  drives_right
US   United States          True
AUS      Australia         False
JPN          Japan         False
IN           India         False
RU          Russia          True
MOR        Morocco          True
EG           Egypt          True


## Corchetes (2)

Los corchetes pueden hacer más que solo seleccionar columnas. También puede usarlos para obtener filas u observaciones de un DataFrame. La siguiente llamada selecciona las primeras cinco filas del DataFrame *cars*:

**cars[0:5]**

El resultado es otro DataFrame que contiene solo las filas que especificó.

Preste atención: solo puede seleccionar filas usando corchetes si especifica un corte, como 0:4. Además, está utilizando los índices enteros de las filas aquí, ¡no las etiquetas de las filas!

**Actividad**

* Seleccione las primeras 3 observaciones de *cars* e imprímalas.
* Seleccione la cuarta, quinta y sexta observación, correspondiente a los índices de fila 3, 4 y 5, e imprímalos.


In [5]:
# Import cars data
import pandas as pd
cars = pd.read_csv('data/cars.csv', sep =';', index_col=0)

# Print out first 3 observations
print(cars[0:3])

# Print out fourth, fifth and sixth observation
print(cars[3:6])

     cars_per_cap        country  drives_right
US            809  United States          True
AUS           731      Australia         False
JPN           588          Japan         False
     cars_per_cap  country  drives_right
IN             18    India         False
RU            200   Russia          True
MOR            70  Morocco          True


## loc e iloc (1)

Con *loc* y *iloc* puede hacer prácticamente cualquier operación de selección de datos en DataFrames que se le ocurra. *loc* está basado en etiquetas, lo que significa que debe especificar filas y columnas en función de sus etiquetas de fila y columna. *iloc* está basado en un índice entero, por lo que debe especificar filas y columnas por su índice entero como lo hizo en el ejercicio anterior.

Pruebe los siguientes comandos en Jupyter para experimentar *loc* y *iloc* seleccionar observaciones. Cada par de comandos aquí da el mismo resultado.

**cars.loc['RU']  
cars.iloc[4]**

**cars.loc[['RU']]  
cars.iloc[[4]]**

**cars.loc[['RU', 'AUS']]  
cars.iloc[[4, 1]]**

**Actividad**

* Use *loc* o *iloc* para seleccionar la observación correspondiente a Japón como Serie. La etiqueta de esta fila es JPN, el índice es 2. Asegúrese de imprimir la serie resultante.
* Use *loc* o *iloc* para seleccionar las observaciones de Australia y Egipto como un DataFrame. Puede conocer las etiquetas / índices de estas filas inspeccionando *cars*. Asegúrese de imprimir el DataFrame resultante.

In [7]:
# Import cars data
import pandas as pd
cars = pd.read_csv('data/cars.csv', sep =';', index_col=0)

# Print out observation for Japan
print(cars.loc['JPN'])

# Print out observations for Australia and Egypt
print(cars.loc[['AUS', 'EG']])

cars_per_cap      588
country         Japan
drives_right    False
Name: JPN, dtype: object
     cars_per_cap    country  drives_right
AUS           731  Australia         False
EG             45      Egypt          True


## loc e iloc (2)

*loc* y *iloc* también le permite seleccionar tanto filas como columnas de un DataFrame. Para experimentar, pruebe los siguientes comandos. Nuevamente, los comandos emparejados producen el mismo resultado.

**cars.loc['IN', 'cars_per_cap']  
cars.iloc[3, 0]**

**cars.loc[['IN', 'RU'], 'cars_per_cap']  
cars.iloc[[3, 4], 0]**

**cars.loc[['IN', 'RU'], ['cars_per_cap', 'country']]  
cars.iloc[[3, 4], [0, 1]]**

**Actividad**

* Imprima el valor de *drives_right* de la fila correspondiente a Marruecos (su etiqueta de fila es *MOR*)
* Imprima un sub-DataFrame, que contiene las observaciones para Rusia y Marruecos y las columnas *country* y *drives_right*.

In [9]:
# Import cars data
import pandas as pd
cars = pd.read_csv('data/cars.csv', sep =';', index_col=0)

# Print out drives_right value of Morocco
print(cars.loc['MOR','drives_right'])

# Print sub-DataFrame
print(cars.loc[['RU', 'MOR'],['country', 'drives_right']])

True
     country  drives_right
RU    Russia          True
MOR  Morocco          True


## loc e iloc (3)

También es posible seleccionar solo columnas con *loc* y *iloc*. En ambos casos, simplemente coloca dos puntos para ir de principio a fin delante de la coma:

**cars.loc[:, 'country']  
cars.iloc[:, 1]**

**cars.loc[:, ['country','drives_right']]  
cars.iloc[:, [1, 2]]**

**Actividad**

* Imprima la columna *drives_right* como una serie con *loc* o *iloc*.
* Imprima la columna *drives_right* como un DataFrame con *loc* o *iloc*.
* Imprima las cars_per_cap y drives_right columnas como un DataFrame con *loc* o *iloc*.

In [11]:
# Import cars data
import pandas as pd
cars = pd.read_csv('data/cars.csv', sep =';', index_col=0)

# Print out drives_right column as Series
print(cars.loc[:,'drives_right'])

# Print out drives_right column as DataFrame
print(cars.loc[:,['drives_right']])

# Print out cars_per_cap and drives_right as DataFrame
print(cars.loc[:,['cars_per_cap','drives_right']])


US      True
AUS    False
JPN    False
IN     False
RU      True
MOR     True
EG      True
Name: drives_right, dtype: bool
     drives_right
US           True
AUS         False
JPN         False
IN          False
RU           True
MOR          True
EG           True
     cars_per_cap  drives_right
US            809          True
AUS           731         False
JPN           588         False
IN             18         False
RU            200          True
MOR            70          True
EG             45          True
