# Ejercicios de Análisis de Datos

## Ejercicio 1: Análisis Exploratorio de Datos de Estudiantes

Este ejercicio se basa en el script `PROGRAMA_1` y utiliza el dataset `student-mat.csv`.

### Importación de Librerías

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os

# Configuración para mostrar todas las columnas y gráficos en línea
pd.set_option('display.max_columns', None)
%matplotlib inline

### 1. Carga del Dataset

Cargamos el archivo `student-mat.csv` desde la ruta `datos/ejer_1/`.

In [None]:
# Construye la ruta al archivo CSV
# La ruta es relativa a la ubicación de la carpeta raíz del proyecto
nombre_archivo = "student-mat.csv"
ruta = os.path.join("..", "datos", "ejer_1", nombre_archivo)

try:
    print(f"Intentando cargar el dataset desde: {ruta}")
    df = pd.read_csv(ruta, sep=';')
    print("✅ Dataset cargado exitosamente.")
except FileNotFoundError:
    print(f"❌ ERROR: No se pudo encontrar el archivo en la ruta esperada:\n{ruta}")
    print(f"\nPor favor, asegúrate de que la estructura de carpetas es correcta.")
except Exception as e:
    print(f"❌ Ocurrió un error inesperado al cargar el archivo: {e}")

### 2. Exploración Básica

In [None]:
# Dimensiones del dataset (filas, columnas)
print("=== DIMENSIONES DEL DATASET ===")
print(df.shape)

# Información general de las columnas y tipos de datos
print("\n=== INFORMACIÓN GENERAL ===")
df.info()

In [None]:
# Estadísticas descriptivas para todas las columnas
print("\n=== ESTADÍSTICAS DESCRIPTIVAS ===")
display(df.describe(include='all').T)

### 3. Valores Nulos

In [None]:
# Contar valores nulos por columna
print("\n=== VALORES NULOS ===")
valores_nulos = df.isnull().sum()
print(valores_nulos[valores_nulos > 0])

### 4. Visualización de Datos

In [None]:
# Graficar la distribución de edades de los estudiantes
if 'age' in df.columns:
    plt.figure(figsize=(10, 6))
    df['age'].value_counts().sort_index().plot(kind='bar', color='skyblue')
    plt.title('Distribución de Edades de los Estudiantes')
    plt.xlabel('Edad')
    plt.ylabel('Cantidad de Estudiantes')
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.show()
else:
    print("⚠️ No se encontró una columna llamada 'age' en el dataset.")

resultados

