# Introducción a Pandas
## ¿Qué es Pandas?
Pandas es una biblioteca de Python que proporciona estructuras de datos y herramientas de análisis de datos. Es ampliamente utilizada en la ciencia de datos, estadísticas, y en campos relacionados para facilitar la manipulación y el análisis de grandes conjuntos de datos.

In [1]:
import pandas as pd

## Concepto de DataFrame
Un DataFrame en Pandas es una estructura de datos bidimensional, como una hoja de cálculo, con columnas de diferentes tipos. Es similar a una tabla SQL o una hoja de datos en Excel. Los DataFrames permiten almacenar y manipular datos tabulados en filas y columnas.

## Creación de un DataFrame a partir de un Diccionario
Pandas permite crear DataFrames a partir de diccionarios de listas. Cada lista en el diccionario se convierte en una columna en el DataFrame. Aquí hay un ejemplo:

In [3]:
# Listas predefinidas
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr =  [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]

# Importar pandas como pd
import pandas as pd

# Crear diccionario my_dict con tres pares clave:valor
my_dict = { 
    'country': names, 
    'drives_right': dr,
    'cars_per_cap': cpc,
}

# Construir un DataFrame cars a partir de my_dict
cars = pd.DataFrame(my_dict)

# Imprimir cars
print(cars)


         country  drives_right  cars_per_cap
0  United States          True           809
1      Australia         False           731
2          Japan         False           588
3          India         False            18
4         Russia          True           200
5        Morocco          True            70
6          Egypt          True            45


# Asignación de Etiquetas a las Filas en un DataFrame

Después de crear un DataFrame, puedes asignar etiquetas personalizadas a las filas. Esto es útil para hacer referencia a las filas por nombres más significativos en lugar de por índices numéricos. Aquí hay un ejemplo que continúa con el DataFrame cars:

In [4]:
# Construir el DataFrame 'cars'
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr =  [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]
cars_dict = { 'country':names, 'drives_right':dr, 'cars_per_cap':cpc }
cars = pd.DataFrame(cars_dict)
print(cars)

# Definición de 'row_labels'
row_labels = ['US', 'AUS', 'JPN', 'IN', 'RU', 'MOR', 'EG']

# Especificar las etiquetas de fila de 'cars'
cars.index = row_labels

# Imprimir 'cars' nuevamente
print(cars)


         country  drives_right  cars_per_cap
0  United States          True           809
1      Australia         False           731
2          Japan         False           588
3          India         False            18
4         Russia          True           200
5        Morocco          True            70
6          Egypt          True            45
           country  drives_right  cars_per_cap
US   United States          True           809
AUS      Australia         False           731
JPN          Japan         False           588
IN           India         False            18
RU          Russia          True           200
MOR        Morocco          True            70
EG           Egypt          True            45


# Creación de un DataFrame a partir de un Archivo CSV

In [5]:
import pandas as pd

# Importar el archivo CSV 'cars.csv' en un DataFrame
cars = pd.read_csv('cars.csv')

# Imprimir el DataFrame 'cars'
print(cars)


  Unnamed: 0  cars_per_cap        country  drives_right
0         US           809  United States          True
1        AUS           731      Australia         False
2        JPN           588          Japan         False
3         IN            18          India         False
4         RU           200         Russia          True
5        MOR            70        Morocco          True
6         EG            45          Egypt          True


In [None]:
#