## Del diccionario al DataFrame (1)
```Pandas``` es una biblioteca de código abierto que proporciona estructuras de datos y herramientas de análisis de datos de alto rendimiento y fáciles de usar para Python. ¡Suena prometedor!

El DataFrame es una de las estructuras de datos más importantes de ```Pandas```. Básicamente es una forma de almacenar datos tabulares donde puedes etiquetar las filas y las columnas. Una forma de crear un ```DataFrame``` es desde un ```diccionario```.

En los ejercicios siguientes trabajarás con datos de vehículos de diferentes países. Cada observación corresponde a un país y las columnas proporcionan información sobre el número de vehículos per cápita, si las personas conducen a la izquierda o a la derecha, etc.

Se definen tres listas en el script:

```names```, que contiene los nombres de los países para los que hay datos disponibles.

```dr```, una lista con valores booleanos que indica si las personas conducen a la izquierda o a la derecha en el país correspondiente.

```cpc```, el número de vehículos de motor por cada 1000 personas en el país correspondiente.

Cada clave del diccionario es una etiqueta de columna y cada valor es una lista que contiene los elementos de la columna.

In [2]:
# Listas predefinidas
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr =  [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]

# Import pandas as pd
import pandas as pd

# Crea el diccionario my_dict con tres pares clave:valor: my_dict
my_dict = {"country" : names, "drives_right" : dr, "cars_per_cap" : cpc}

# Construye un DataFrame cars a partir de my_dict: cars
cars = pd.DataFrame(my_dict)

# Imprime cars
print(cars)

         country  drives_right  cars_per_cap
0  United States          True           809
1      Australia         False           731
2          Japan         False           588
3          India         False            18
4         Russia          True           200
5        Morocco          True            70
6          Egypt          True            45


## Del diccionario al DataFrame (2)
El código Python que resuelve el ejercicio anterior se incluye en el código. ¿Has notado que las etiquetas de las filas (es decir, las etiquetas de las diferentes observaciones) se establecieron automáticamente en números enteros del 0 al 6?

Para solucionar esto, se ha creado una lista ```row_labels```. Puedes usarla para especificar las etiquetas de las filas del ```DataFrame``` de ```cars```. Para ello, configura el atributo ```index``` de ```cars```, al que puedes acceder como ```cars.index```.

In [4]:
import pandas as pd

# Construye un DataFrame cars
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr =  [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]
cars_dict = { 'country':names, 'drives_right':dr, 'cars_per_cap':cpc }
cars = pd.DataFrame(cars_dict)
print(cars)

# Definición de row_labels
row_labels = ['US', 'AUS', 'JPN', 'IN', 'RU', 'MOR', 'EG']

# Especifica las etiquetas de las filas de los coches
cars.index = row_labels

# Vuelve a imprimir cars
print(cars)

         country  drives_right  cars_per_cap
0  United States          True           809
1      Australia         False           731
2          Japan         False           588
3          India         False            18
4         Russia          True           200
5        Morocco          True            70
6          Egypt          True            45
           country  drives_right  cars_per_cap
US   United States          True           809
AUS      Australia         False           731
JPN          Japan         False           588
IN           India         False            18
RU          Russia          True           200
MOR        Morocco          True            70
EG           Egypt          True            45


## CSV a DataFrame (1)
Poner datos en un diccionario y luego crear un ```DataFrame``` funciona, pero no es muy eficiente. ¿Qué pasa si se trata de millones de observaciones? En esos casos, los datos suelen estar disponibles como archivos con una estructura regular. Uno de esos tipos de archivos es el archivo CSV, que es la abreviatura de «valores separados por comas» en inglés.

Para importar datos CSV a Python como un ```Pandas``` ```DataFrame```, puedes usar ```read_csv()```.

Vamos a explorar esta función con los mismos datos de los coches de los ejercicios anteriores. Esta vez, sin embargo, los datos están disponibles en un archivo CSV denominado ```cars.csv```. Está disponible en tu directorio de trabajo actual, por lo que la ruta al archivo es simplemente ```'cars.csv'```.

In [None]:
# Importa pandas as pd
import pandas as pd

# Importa el archivo cars.csv data: cars
cars = pd.read_csv("cars.csv")

# Imprime coches
print(cars)

```python
  Unnamed: 0  cars_per_cap        country  drives_right
0         US           809  United States          True
1        AUS           731      Australia         False
2        JPN           588          Japan         False
3         IN            18          India         False
4         RU           200         Russia          True
5        MOR            70        Morocco          True
6         EG            45          Egypt          True
```

## CSV a DataFrame (2)
Tu llamada a ```read_csv()``` para importar los datos del CSV no generó ningún error, pero el resultado no es del todo lo que queríamos. Las etiquetas de fila se importaron como otra columna sin nombre.

¿Recuerdas ```index_col```, un argumento de ```read_csv()```, que puedes usar para especificar qué columna del archivo CSV debe usarse como etiqueta de fila? Bueno, ¡eso es exactamente lo que necesitas aquí!

El código Python que resuelve el ejercicio anterior ya está incluido; ¿puedes hacer los cambios apropiados para corregir la importación de datos?

In [None]:
# Importa pandas as pd
import pandas as pd

# Corrige la importación incluyendo index_col
cars = pd.read_csv('cars.csv', index_col = 0)

# Imprime coches
print(cars)

```python
     cars_per_cap        country  drives_right
US            809  United States          True
AUS           731      Australia         False
JPN           588          Japan         False
IN             18          India         False
RU            200         Russia          True
MOR            70        Morocco          True
EG             45          Egypt          True
```

## Square Brackets (corchetes) (1)
En el vídeo, viste que puedes indexar y seleccionar Pandas DataFrames de muchas formas diferentes. La forma más simple, pero no la más poderosa, es usar corchetes.

En el código de ejemplo, se importan los mismos datos de cars desde un archivo CSV como un Pandas ```DataFrame```. Para seleccionar solo la columna ```cars_per_cap``` de ```cars```, puedes usar:
```python
cars['cars_per_cap']
cars[['cars_per_cap']]
```
La versión de un solo corchete ofrece una serie Pandas, la versión de doble corchete proporciona un Pandas ```DataFrame```.

In [None]:
# Importa datos de cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Imprime la columna country como Pandas Series
print(cars["country"])

# Imprime la columna country como Pandas DataFrame
print(cars[["country"]])

# Imprime DataFrame con las columnas country y drives_right
print(cars[["country", "drives_right"]])

```python
US     United States
AUS        Australia
JPN            Japan
IN             India
RU            Russia
MOR          Morocco
EG             Egypt
Name: country, dtype: object

           country
US   United States
AUS      Australia
JPN          Japan
IN           India
RU          Russia
MOR        Morocco
EG           Egypt

           country  drives_right
US   United States          True
AUS      Australia         False
JPN          Japan         False
IN           India         False
RU          Russia          True
MOR        Morocco          True
EG           Egypt          True
```

## Square Brackets (corchetes) (2)
Los corchetes permiten mucho más que seleccionar columnas. También puedes usarlos para obtener filas u observaciones de un ```DataFrame```. La siguiente llamada selecciona las cinco primeras filas del ```DataFrame``` ```cars```:
```python
cars[0:5]
```
El resultado es otro ```DataFrame``` que contiene solo las filas que especificaste.

Presta atención: Solo puedes seleccionar filas con corchetes si especificas un sector, por ejemplo 0:4. Además, aquí está utilizando los índices enteros de las filas, ¡no las etiquetas de las filas!

In [None]:
# Importa datos de cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Imprime las 3 primeras observaciones
print(cars[:3])

# Imprime la cuarta, quinta y sexta observación
print(cars[3:6])

```python
     cars_per_cap        country  drives_right
US            809  United States          True
AUS           731      Australia         False
JPN           588          Japan         False

     cars_per_cap  country  drives_right
IN             18    India         False
RU            200   Russia          True
MOR            70  Morocco          True
```

## loc and iloc (1)
Con ```loc``` and ```iloc``` puedes realizar prácticamente cualquier operación de selección de datos en ```DataFrames``` que se te ocurra. ```loc``` se basa en etiquetas, lo que significa que debes especificar filas y columnas en función de sus etiquetas de fila y columna. ```iloc``` se basa en índices de enteros, por lo que debes especificar las filas y columnas por su índice de enteros, como hiciste en el ejercicio anterior.
```python
#Devuelve una Serie de Pandas
cars.loc['RU']
cars.iloc[4]

#devuelve un DataFrame de Pandas
cars.loc[['RU']]
cars.iloc[[4]]

cars.loc[['RU', 'AUS']]
cars.iloc[[4, 1]]
```
Como antes, se incluye un código que importa los datos de los coches como un ```Pandas DataFrame```.

In [None]:
# Importa datos de cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Imprime la observación de Japón
print(cars.loc["JPN"])

# Imprime las observaciones de Australia y Egipto
print(cars.loc[["AUS", "EG"]])

```python
cars_per_cap      588
country         Japan
drives_right    False
Name: JPN, dtype: object

     cars_per_cap    country  drives_right
AUS           731  Australia         False
EG             45      Egypt          True
```

## loc and iloc (2)
```loc``` y ```iloc``` también te permiten seleccionar filas y columnas de un ```DataFrame```. Para experimentar con esto, prueba los siguientes comandos: Una vez más, los comandos emparejados producen el mismo resultado.
```python
cars.loc['IN', 'cars_per_cap']
cars.iloc[3, 0]

cars.loc[['IN', 'RU'], 'cars_per_cap']
cars.iloc[[3, 4], 0]

cars.loc[['IN', 'RU'], ['cars_per_cap', 'country']]
cars.iloc[[3, 4], [0, 1]]
```

In [None]:
# Importa datos de cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Imprime el valor drives_right de Marruecos
print(cars.loc["MOR", "drives_right"])
print(cars.iloc[5, 2])

# Imprime el sub-DataFrame
print(cars.loc[["RU", "MOR"], ["country", "drives_right"]])
print(cars.iloc[[4, 5], [1, 2]])

```python
True

True

     country  drives_right
RU    Russia          True
MOR  Morocco          True

     country  drives_right
RU    Russia          True
MOR  Morocco          True
```

## loc and iloc (3)
También es posible seleccionar solo las columnas con ```loc``` y ```iloc```. En ambos casos, basta con poner una fracción que vaya de principio a fin delante de la coma
```python
cars.loc[:, 'country']
cars.iloc[:, 1]

cars.loc[:, ['country','drives_right']]
cars.iloc[:, [1, 2]]
```

In [None]:
# Importa datos de cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Imprime la columna drives_right como Serie
print(cars.loc[:, "drives_right"])
print(cars.iloc[:, 2])

# Imprime la columna drives_right como DataFrame
print(cars.loc[:, ["drives_right"]])
print(cars.iloc[:, [2]])

# Imprime cars_per_cap y drives_right como DataFrame
print(cars.loc[:, ["cars_per_cap", "drives_right"]])
print(cars.iloc[:, [0, 2]])

```python
US      True
AUS    False
JPN    False
IN     False
RU      True
MOR     True
EG      True
Name: drives_right, dtype: bool

US      True
AUS    False
JPN    False
IN     False
RU      True
MOR     True
EG      True
Name: drives_right, dtype: bool

     drives_right
US           True
AUS         False
JPN         False
IN          False
RU           True
MOR          True
EG           True

     drives_right
US           True
AUS         False
JPN         False
IN          False
RU           True
MOR          True
EG           True

     cars_per_cap  drives_right
US            809          True
AUS           731         False
JPN           588         False
IN             18         False
RU            200          True
MOR            70          True
EG             45          True

     cars_per_cap  drives_right
US            809          True
AUS           731         False
JPN           588         False
IN             18         False
RU            200          True
MOR            70          True
EG             45          True
```