### Análisis de datos con Pandas

**Objetivo**

Evaluar las habilidades en el manejo de datos utilizando `pandas`. Se trabaja con un dataset real de Kaggle y se aplicará técnicas de carga, exploración, filtrado y slicing de datos.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

**Dataset**

Utilizar el dataset de **«Video Game Sales»** que contiene información sobre las ventas de videojuegos en diferentes regiones del mundo. El dataset incluye detalles sobre el nombre del juego, la plataforma, el año de lanzamiento, el género, el editor, y las ventas en diferentes regiones.

**Instrucciones**

* **Preparación del Entorno**<br> Se debe tener instalado `pandas` en el entorno de trabajo.<br> Descargar el archivo `vgsales.csv` desde Kaggle y colócarlo en tu directorio de trabajo.


In [None]:
import pandas as pd

* **Cargar los Datos**<br>
Cargar el archivo vgsales.csv en un DataFrame de `pandas`.<br> Mostrar las primeras 10 filas del DataFrame para confirmar que los datos se han cargado correctamente.


In [None]:
# Cargar datos desde un archivo CSV
df = pd.read_csv('ruta/al/data_practice_1.csv')

# Ver las primeras 10 filas del DataFrame
print("Primeras 10 filas del DataFrame:")
print(df.head(10))

* **Exploración Inicial de los Datos**<br>
Mostrar las últimas 5 filas del DataFrame.<br>
Utilizar el método `info()` para obtener información general sobre el DataFrame, incluyendo el número de entradas, nombres de las columnas, tipos de datos y memoria utilizada.<br>
Generar estadísticas descriptivas del DataFrame utilizando el método `describe()`.


In [None]:
# Ver las últimas 5 filas del DataFrame
print("Últimas filas del DataFrame:")
print(df.tail())

# Obtener información general sobre el DataFrame
print("Información del DataFrame:")
print(df.info())

# Generar estadísticas descriptivas
print("nEstadísticas descriptivas del DataFrame:")
print(df.describe())

* **Inspección de los Datos**<br>
Inspeccionar los tipos de datos de cada columna utilizando el atributo `dtypes`.
Contar los valores únicos en la columna Genre utilizando el método `value_counts()`.
Mostrar todos los valores únicos en la columna Platform utilizando el método `unique()`.


In [None]:
# Inspeccionar los tipos de datos de las columnas
print("nTipos de datos de las columnas:")
print(df.dtypes)

# Contar valores únicos en una columna específica
print("nConteo de valores únicos en la columna 'nombre_columna':")
print(df['nombre_columna'].value_counts())

# Obtener valores únicos en una columna específica
print("nValores únicos en la columna 'nombre_columna':")
print(df['nombre_columna'].unique())

* **Filtrado de Datos**<br>
Filtrar el DataFrame para mostrar solo las filas donde las ventas en América del Norte (NA_Sales) sean mayores a 1 millón.<br>
Filtrar el DataFrame para mostrar solo las filas donde las ventas en Japón (JP_Sales) sean menores a 0.1 millón.<br>
Utilizar el método `query()`, filtrar el DataFrame para mostrar las filas donde el género sea Action y las ventas globales (Global_Sales) sean mayores a 2 millones.

In [None]:
# Filtrar para mostrar solo las filas donde las ventas en América del Norte sean mayores a 1 millón
na_sales_filter = df[df['NA_Sales'] > 1.0]
print("Filas donde las ventas en América del Norte son mayores a 1 millón:")
print(na_sales_filter)

# Filtrar para mostrar solo las filas donde las ventas en Japón son menores a 0.1 millón
jp_sales_filter = df[df['JP_Sales'] < 0.1]
print("Filas donde las ventas en Japón son menores a 0.1 millón:")
print(jp_sales_filter)

# Filtrar utilizando query para mostrar Action con Global_Sales mayores a 2 millones
action_sales_filter = df.query("Genre == 'Action' and Global_Sales > 2.0")
print("Filas donde el género es Action y las ventas globales son mayores a 2 millones:")
print(action_sales_filter)


* **Slicing de Datos**<br>
Seleccionar y mostrar solo las columnas Name y Global_Sales del DataFrame.<br>
Utilizar `loc[]`, seleccionar y mostrar las filas de la 5 a la 10 (inclusive) y las columnas Name y Genre.<br>
Utilizar `iloc[]`, seleccionar y mostrar las primeras 5 filas y las primeras 3 columnas del DataFrame.

In [None]:
# Seleccionar y mostrar solo las columnas Name y Global_Sales
name_global_sales = df[['Name', 'Global_Sales']]
print("Columnas 'Name' y 'Global_Sales':")
print(name_global_sales)

# Utilizar loc[] para seleccionar las filas de la 5 a la 10 y las columnas Name y Genre
rows_5_to_10 = df.loc[4:9, ['Name', 'Genre']]
print("Filas de la 5 a la 10 y columnas 'Name' y 'Genre':")
print(rows_5_to_10)

# Utilizar iloc[] para seleccionar las primeras 5 filas y las primeras 3 columnas
first_5_rows_first_3_cols = df.iloc[:5, :3]
print("Primeras 5 filas y primeras 3 columnas:")
print(first_5_rows_first_3_cols)