## Analsis de datos con Pandas (Core)
### Objetivo

El objetivo de este desafío es evaluar tus habilidades en el manejo de datos utilizando Pandas. Trabajarás con un dataset real extraído de Kaggle y aplicarás técnicas de carga, exploración, filtrado y slicing de datos.

### Dataset
Utilizaremos el dataset de «Video Game Sales» que contiene información sobre las ventas de videojuegos en diferentes regiones del mundo. El dataset incluye detalles sobre el nombre del juego, la plataforma, el año de lanzamiento, el género, el editor, y las ventas en diferentes regiones. Puedes descargar el dataset desde Kaggle.

### Preparación del Entorno
    - Asegúrate de tener instalado Pandas en tu entorno de trabajo.
    - Descarga el archivo vgsales.csv desde Kaggle y colócalo en tu directorio de trabajo.

### Cargar los Datos
    - Carga el archivo vgsales.csv en un DataFrame de Pandas.
    - Muestra las primeras 10 filas del DataFrame para confirmar que los datos se han cargado correctamente.

In [None]:
import pandas as pd

# Cargar datos desde un archivo CSV
df = pd.read_csv('../data/vgsales.csv')

# Ver las primeras
print("Primeras filas del DataFrame:")
print(df.head(10))

### Exploración Inicial de los Datos
    - Muestra las últimas 5 filas del DataFrame.
    - Utiliza el método info() para obtener información general sobre el DataFrame, incluyendo el número de entradas, nombres de las columnas, tipos de datos y memoria utilizada.
    - Genera estadísticas descriptivas del DataFrame utilizando el método describe().

In [None]:
print("Últimas filas del DataFrame:")
print(df.tail(5))

print("Información del DataFrame:")
print(df.info())

print("Estadísticas descriptivas del DataFrame:")
print(df.describe())

### Inspección de los Datos
    - Inspecciona los tipos de datos de cada columna utilizando el atributo dtypes.
    - Cuenta los valores únicos en la columna Genre utilizando el método value_counts().
    - Muestra todos los valores únicos en la columna Platform utilizando el método unique().

In [None]:
# Inspeccionar los tipos de datos de las columnas
print("Tipos de datos de las columnas:")
print(df.dtypes)

# Contar valores únicos en una columna específica
print("Conteo de valores únicos en la columna 'Genre':")
print(df['Genre'].value_counts())

# Obtener valores únicos en una columna específica
print("nValores únicos en la columna 'Platform':")
print(df['Platform'].unique())

### Filtrado de Datos
    - Filtra el DataFrame para mostrar solo las filas donde las ventas en América del Norte (NA_Sales) sean mayores a 1 millón.
    - Filtra el DataFrame para mostrar solo las filas donde las ventas en Japón (JP_Sales) sean menores a 0.1 millón.
    - Utilizando el método query(), filtra el DataFrame para mostrar las filas donde el género sea Action y las ventas globales (Global_Sales) sean mayores a 2 millones.

In [None]:
# Filtrado de ventas NA_SALES > 1m
ventas_mayores_a_1_millon = df[(df['NA_Sales'] > 1)]
print(ventas_mayores_a_1_millon)
print('-----------------------------------------', end='\n')

# Filtrado de ventas NA_SALES > 1m
ventas_menores_a_0_1_millon = df[(df['JP_Sales'] < 0.1)]
print(ventas_menores_a_0_1_millon)
print('-----------------------------------------', end='\n')

# Metodo query
query_result = df.query('Genre == "Action" & Global_Sales > 2')
print(query_result)
print('-----------------------------------------', end='\n')

### Slicing de Datos
    - Selecciona y muestra solo las columnas Name y Global_Sales del DataFrame.
    - Utilizando loc[], selecciona y muestra las filas de la 5 a la 10 (inclusive) y las columnas Name y Genre.
    - Utilizando iloc[], selecciona y muestra las primeras 5 filas y las primeras 3 columnas del DataFrame.

In [None]:
print(df.head(5))
print('-----------------------------------------', end='\n')

# Seleccionar Name y Global_Sales
sliced_rows = df[['Name','Global_Sales']]
print(sliced_rows)
print('-----------------------------------------', end='\n')

# Seleccionar filas y columnas específicas con loc
loc_result = df.loc[5:10, ['Name', 'Genre']]
print(loc_result)
print('-----------------------------------------', end='\n')

# Seleccionar filas y columnas específicas con iloc
iloc_result = df.iloc[0:5, 0:3]
print(iloc_result)
print('-----------------------------------------', end='\n')