# 🎓 Proyecto de Gestión de Estudiantes

## 📝 Descripción
Este proyecto implementa un sistema de **gestión académica** en Python que permite registrar estudiantes, calcular promedios y generar reportes de aprobación o reprobación, utilizando **Pandas** y **NumPy**.  
El objetivo es aplicar conceptos de programación y análisis de datos para manejar información educativa de manera estructurada y exportable.

---

## 🎯 Objetivos del Proyecto
- Registrar información de estudiantes: **nombre**, **materia**, **nota**.
- Generar reportes de estudiantes aprobados y reprobados.
- Calcular promedios por materia.
- Visualizar todos los registros cargados.
- Guardar resultados en un archivo CSV.

---

## 📂 Fuente de Datos
- **Tipo:** Datos ingresados manualmente por el usuario en la consola.
- **Archivos manejados:**
  - `estudiantes.csv` – Almacena los datos persistentes entre ejecuciones.
  - `reporte_final.csv` – Contiene el reporte final con estado de aprobación.
- **Estructura de datos:**  
  - `nombre` (string)  
  - `materia` (string)  
  - `nota` (float, entre 0 y 100)  
  - `status` (Aprobado/Reprobado)

---

## 🛠 Tecnologías y Herramientas Utilizadas
- **Python**
  - Funciones personalizadas
  - Validación de entradas
  - Listas por comprensión
  - Manejo de archivos
- **Pandas** – Manipulación de datos y cálculos de promedios.
- **NumPy** – Generación condicional de valores en columnas.
- **CSV** – Persistencia de datos.

---

## 🔍 Funcionalidades del Menú
1. **Agregar estudiante** – Solicita nombre, materia y nota (valida que esté entre 0 y 100).
2. **Ver estudiantes aprobados/reprobados** – Filtra y muestra según nota ≥ 60 (Aprobado) o menor a 60 (Reprobado).
3. **Ver promedio por materia** – Calcula el promedio de notas agrupado por materia.
4. **Ver todos los registros** – Muestra la tabla completa de estudiantes.
5. **Guardar archivo final** – Genera `reporte_final.csv` con las columnas `nombre`, `nota`, `status`.
6. **Salir** – Guarda automáticamente los datos en `estudiantes.csv` para mantenerlos en futuras ejecuciones.

---

## 📈 Ejemplo de Resultados Esperados
**Reporte de Aprobados/Reprobados:**
| nombre       | nota  | status    |
|--------------|-------|-----------|
| Juan Pérez   | 85.0  | Aprobado  |
| María López  | 52.0  | Reprobado |

**Promedio por Materia:**
| materia     | promedio |
|-------------|----------|
| Matemáticas | 73.5     |
| Historia    | 66.0     |

---

## 💡 Conclusiones
Este ejercicio permite poner en práctica:
- Validación y procesamiento de datos de entrada.
- Uso combinado de **funciones, Pandas y NumPy** para análisis.
- Persistencia de datos en archivos CSV.
- Exportación de reportes listos para revisión.



In [68]:
import pandas as pd
import numpy as np

ARCHIVO = 'estudiantes.csv'


## 🔧 Explicación detallada de `cargar_datos()`

### 🧠 ¿Qué hace esta función?
`cargar_datos()` intenta **cargar un archivo CSV** llamado `estudiantes.csv` (usando la variable global `ARCHIVO`).  
- Si el archivo **existe**, lo **lee** y devuelve un **DataFrame de pandas** con su contenido.  
- Si el archivo **no existe**, devuelve un **DataFrame vacío** con las **columnas predefinidas**: `['nombre', 'materia', 'nota']`.  
Esto permite que el resto del programa funcione sin errores aunque sea la primera vez que lo ejecutas.

---

### 🧰 Herramientas y conceptos usados (y por qué)

- **`pandas` (alias `pd`)**: Librería para manejar datos en forma de tablas (**DataFrame**).  
  - **`pd.read_csv(ARCHIVO)`**: Lee un archivo CSV y lo convierte en un DataFrame.
  - **`pd.DataFrame(columns=[...])`**: Crea un DataFrame vacío con las columnas que necesitas desde el inicio.
- **Palabras reservadas de Python**:
  - **`def`**: Define una función.
  - **`try`** / **`except`**: Manejo de errores. Permiten “intentar” algo y capturar fallos controladamente.
  - **`return`**: Devuelve un valor desde la función (el DataFrame).
- **Excepción específica**:
  - **`FileNotFoundError`**: Error que lanza Python cuando el archivo **no existe**. Lo capturamos para devolver un DataFrame vacío en su lugar.
- **Variables empleadas**:
  - **`ARCHIVO`**: Variable **global** (definida fuera) con el nombre del archivo a leer. Centraliza el nombre del CSV para cambiarlo en un solo lugar.
  - **Valor devuelto**: Un **DataFrame** que el resto del programa usará para agregar, filtrar, agrupar o guardar datos.

---



In [69]:
# Carga inicial
def cargar_datos():
    try:
        return pd.read_csv(ARCHIVO)
    except FileNotFoundError:
        return pd.DataFrame(columns=['nombre', 'materia', 'nota'])


## 🧮 Explicación detallada de `validar_nota(nota_str)`

### 🧠 ¿Qué hace esta función?
`validar_nota` recibe un **texto** (`nota_str`) que viene del usuario (por ejemplo, desde `input()`), intenta **convertirlo a número** y verifica que esté **entre 0 y 100** (incluyendo los extremos).  
- Si todo va bien, **devuelve** la nota como `float`.  
- Si el texto no es numérico o el número está fuera del rango, **no lanza error**: **imprime** un mensaje de ayuda y **devuelve `None`**.  
Así, otras partes del programa (como un `while nota is None`) pueden **volver a pedir la nota** hasta que sea válida.

---

### 🛠 Herramientas, palabras reservadas y variables (y por qué se usan)

- **`def`**: palabra reservada para **definir funciones**. Permite encapsular la lógica de validación y reutilizarla.
- **Parámetro** `nota_str`: nombre que indica que la **entrada es texto** (string). Ideal cuando la nota viene de `input()`.
- **`try` / `except`**: **manejo de excepciones**. Se intenta convertir a número y, si falla, se captura el error sin romper el programa.
  - **`ValueError`**: excepción que ocurre cuando `float(...)` **no puede** convertir el texto a número (por ejemplo `"abc"`).
- **`float(nota_str)`**: función integrada de Python para **convertir a número decimal** (admite `"85"`, `"85.0"`, `"  72 "`).  
  > Nota: **no** admite coma decimal (`"85,5"`) en configuración estándar; eso produciría `ValueError`.
- **Comparación encadenada** `0 <= nota <= 100`: verificación **inclusive** del rango (equivale a `nota >= 0 and nota <= 100`).
- **`if` / `else`**: control de flujo para decidir **qué devolver** o **qué mensaje imprimir**.
- **`return`**: devuelve el resultado de la validación.  
  - **`return nota`** si es válida.  
  - **`return None`** si es inválida, para que el código que llama a esta función sepa que **debe volver a pedir** el dato.
- **`print(...)`**: **retroalimentación** al usuario cuando hay un error (dato fuera de rango o no numérico).

---


In [70]:
# Validación de nota
def validar_nota(nota_str):
    try:
        nota = float(nota_str)
        if 0 <= nota <= 100:
            return nota
        else:
            print("La nota debe estar entre 0 y 100.")
    except ValueError:
        print("La nota debe ser numérica.")
    return None




## ➕ Explicación detallada de `agregar_estudiante(df)`

### 🧠 ¿Qué hace esta función?
`agregar_estudiante` pide por consola **nombre**, **materia** y **nota** de un estudiante; valida la nota con `validar_nota`; crea un **nuevo registro** como `DataFrame` y lo **concatena** al `DataFrame` existente `df`.  
Devuelve **un nuevo `DataFrame`** con la fila agregada (no modifica `df` “en sitio”; debes reasignar).

> Uso típico:
> ```python
> df = agregar_estudiante(df)  # importante reasignar
> ```

---

### 🛠 Herramientas, palabras reservadas y variables (y por qué)

- **`input()`**: obtiene texto del usuario desde la consola.
- **`.strip()`**: limpia espacios al inicio/fin para evitar nombres/materias con espacios “fantasma”.
- **`while`** + **comparación de identidad** `is None`: repite la solicitud **hasta** que la nota sea válida. Se usa `is None` (y no `not nota`) porque `0.0` es **válido** pero “falsy”.
- **`validar_nota(...)`**: función de apoyo que convierte a `float` y valida rango `0–100`. Si es inválida, devuelve `None` y el bucle vuelve a pedir.
- **`pd.DataFrame(...)`**: crea un `DataFrame` con **una fila nueva**.
  - Se crea desde una **lista de listas** `[[nombre, materia, nota]]`.
  - Se usa `columns=df.columns` para **garantizar el mismo esquema** (mismas columnas y orden) que `df`.
- **`pd.concat([df, nuevo], ignore_index=True)`**: une `df` con la fila nueva y **reindexa** (0, 1, 2, ...).  
  - `ignore_index=True` evita índices duplicados y mantiene el índice limpio y consecutivo.
- **`return`**: devuelve el nuevo `DataFrame` ya con el registro agregado.

---



In [71]:
# Agregar datos
def agregar_estudiante(df):
    nombre = input("Nombre del estudiante: ").strip()
    materia = input("Materia: ").strip()
    nota = None
    while nota is None:
        nota = validar_nota(input("Nota (0-100): "))
    nuevo = pd.DataFrame([[nombre, materia, nota]], columns=df.columns)
    return pd.concat([df, nuevo], ignore_index=True)



# 🟦 Explicación detallada de la función `reporte_aprobados(df)`

### 🧠 ¿Qué hace esta función?
La función `reporte_aprobados` recibe un **DataFrame** de pandas (`df`) con los datos de estudiantes y **muestra en la consola** dos listados separados:  
- **Estudiantes aprobados** (nota >= 60)  
- **Estudiantes reprobados** (nota < 60)  

La función **no devuelve** (no `return`) nada: su propósito es imprimir resultados para que el usuario los lea.

---

### 🛠 Herramientas, palabras reservadas y variables (y por qué se usan)

- **Pandas (`pd`)**: librería para manipular tablas (`DataFrame`). Aquí se usa para filtrar y seleccionar filas/columnas.  
- **Palabras reservadas**:
  - `def` — declara la función.
  - No usa `return` (porque solo imprime).
- **Variables**:
  - `df` — parámetro: el `DataFrame` de entrada que debe contener al menos la columna `nota`.
  - `aprobados` — `DataFrame` temporal con filas donde `nota >= 60`.
  - `reprobados` — `DataFrame` temporal con filas donde `nota < 60`.
- **Técnicas usadas**:
  - **Indexación booleana**: `df[condición]` para filtrar filas.
  - **Selección de columnas**: `[['nombre','nota','status']]` para mostrar solo esas columnas.
  - **`print()`**: muestra texto y tablas en la consola.

---



In [81]:
# Reporte de aprobados
def reporte_aprobados(df):
    print("\nEstudiantes aprobados:")
    aprobados = df[df['nota'] >= 60]
    print(aprobados[['nombre', 'nota', 'status']])

    print("\nEstudiantes reprobados:")
    reprobados = df[df['nota'] < 60]
    print(reprobados[['nombre', 'nota', 'status']])

 


# 🟦 Explicación detallada de la función `promedio_por_materia(df)`

### 🧠 ¿Qué hace esta función?
La función `promedio_por_materia` calcula y muestra en consola el **promedio de notas de los estudiantes agrupados por materia**.  
Usa la librería **pandas** para agrupar los datos y realizar el cálculo automáticamente.

---

### 🛠 Herramientas, palabras reservadas y variables

- **Pandas (`pd`)**: librería para manejo de tablas (`DataFrame`).
- **Palabras reservadas**:
  - `def` — define la función.
- **Variables**:
  - `df` — parámetro de entrada, un DataFrame que debe tener al menos las columnas `materia` y `nota`.
- **Funciones y métodos utilizados**:
  - `print()` — para mostrar resultados en la consola.
  - `df.groupby('materia')` — agrupa las filas del DataFrame según los valores de la columna `'materia'`.
  - `['nota']` — selecciona la columna de notas dentro de cada grupo.
  - `.mean()` — calcula el promedio de las notas en cada grupo.
  - `.round(2)` — redondea los resultados a 2 decimales.

---



In [73]:
# Promedio por materia
def promedio_por_materia(df):
    print("\nPromedio por materia:")
    print(df.groupby('materia')['nota'].mean().round(2))



# 🟦 Explicación detallada de la función `ver_todo(df)`

### 🧠 ¿Qué hace esta función?
La función `ver_todo` muestra **todos los registros del DataFrame** en la consola.  
Es útil para **visualizar rápidamente** el contenido completo de tu dataset de estudiantes sin aplicar filtros ni cálculos.

---

### 🛠 Herramientas, palabras reservadas y variables

- **Pandas (`pd`)**: aunque aquí no se usan métodos complejos, `df` es un DataFrame de pandas.  
- **Palabras reservadas**:
  - `def` — declara la función.
- **Variables**:
  - `df` — el DataFrame de entrada con todos los datos de estudiantes.
- **Funciones usadas**:
  - `print()` — imprime texto y tablas en la consola.

---



In [74]:
# Ver todo
def ver_todo(df):
    print("\nTodos los registros:")
    print(df)



# 🟦 Explicación detallada de la función `guardar_archivo(df)`

### 🧠 ¿Qué hace esta función?
La función `guardar_archivo` crea un **archivo CSV** con los datos de los estudiantes y una columna adicional llamada `status`, indicando si el estudiante está **aprobado** o **reprobado** según su nota.  
Luego imprime un mensaje confirmando que el archivo se guardó correctamente.

---

### 🛠 Herramientas, palabras reservadas y variables

- **Pandas (`pd`)**: para manipular y guardar DataFrames.  
- **NumPy (`np`)**: para usar la función `np.where` que permite asignar valores condicionalmente.  
- **Palabras reservadas**:
  - `def` — declara la función.
- **Variables**:
  - `df` — DataFrame de entrada con los datos originales.
  - `df_guardar` — copia del DataFrame para no modificar los datos originales.
- **Funciones y métodos utilizados**:
  - `df.copy()` — crea una copia del DataFrame para trabajar sin alterar el original.
  - `np.where(condición, valor_si_true, valor_si_false)` — asigna valores según una condición.
  - `to_csv('nombre_archivo.csv', index=False)` — guarda el DataFrame en un archivo CSV sin incluir el índice.
  - `print()` — muestra un mensaje en la consola.

---



In [79]:
# Guardar archivo con columna 'reprobado'
def guardar_archivo(df):
    df_guardar = df.copy()
    df_guardar['status'] = np.where(df_guardar['nota'] < 60, 'Aprobado', 'Reprobado')
    df_guardar[['nombre', 'nota', 'status']].to_csv('reporte_final.csv', index=False)
    print("Archivo 'reporte_final.csv' guardado correctamente.")




# 🟦 Explicación detallada de la función `menu()`

### 🧠 ¿Qué hace esta función?
La función `menu` es el **bucle principal del programa**, encargado de:
- Mostrar un menú de opciones en la consola.
- Recibir la elección del usuario.
- Ejecutar la acción correspondiente (agregar datos, mostrar reportes, guardar archivo, etc.).
- Repetir el proceso hasta que el usuario decida salir.

Es la **interfaz de interacción** del programa con el usuario.

---

### 🛠 Herramientas, palabras reservadas y variables

- **Pandas (`pd`)**: el DataFrame `df` se manipula con pandas.  
- **Palabras reservadas**:
  - `def` — define la función.
  - `while` — inicia un bucle que se repite hasta que se cumple una condición (`break`).
  - `if/elif/else` — controla la lógica de decisión según la opción ingresada.
  - `break` — termina el bucle `while` para salir del menú.
- **Variables**:
  - `df` — DataFrame que almacena todos los datos de los estudiantes.
  - `opcion` — cadena que captura la elección del usuario.
- **Funciones usadas dentro del menú**:
  - `cargar_datos()` — carga los datos iniciales desde el CSV.
  - `agregar_estudiante(df)` — permite agregar un estudiante.
  - `reporte_aprobados(df)` — muestra los estudiantes aprobados/reprobados.
  - `promedio_por_materia(df)` — calcula promedio por materia.
  - `ver_todo(df)` — imprime todos los registros.
  - `guardar_archivo(df)` — guarda un CSV con la información.
  - `input()` — recibe texto ingresado por el usuario.
  - `print()` — muestra mensajes en consola.

---


In [76]:
# Menú principal
def menu():
    df = cargar_datos()
    while True:
        print("\n--- MENÚ ---")
        print("1. Agregar estudiante")
        print("2. Ver estudiantes aprobados")
        print("3. Ver promedio por materia")
        print("4. Ver todos los registros")
        print("5. Guardar archivo final")
        print("6. Salir")
        opcion = input("Seleccione una opción: ").strip()
        
        if opcion == '1':
            df = agregar_estudiante(df)
        elif opcion == '2':
            reporte_aprobados(df)
        elif opcion == '3':
            promedio_por_materia(df)
        elif opcion == '4':
            ver_todo(df)
        elif opcion == '5':
            guardar_archivo(df)
        elif opcion == '6':
            df.to_csv(ARCHIVO, index=False)
            print("Datos guardados en 'estudiantes.csv'. ¡Hasta pronto!")
            break
        else:
            print("Opción inválida. Intente de nuevo.")


In [80]:
menu()


--- MENÚ ---
1. Agregar estudiante
2. Ver estudiantes aprobados
3. Ver promedio por materia
4. Ver todos los registros
5. Guardar archivo final
6. Salir
Opción inválida. Intente de nuevo.

--- MENÚ ---
1. Agregar estudiante
2. Ver estudiantes aprobados
3. Ver promedio por materia
4. Ver todos los registros
5. Guardar archivo final
6. Salir

--- MENÚ ---
1. Agregar estudiante
2. Ver estudiantes aprobados
3. Ver promedio por materia
4. Ver todos los registros
5. Guardar archivo final
6. Salir

Estudiantes aprobados:
  nombre materia  nota
0    Ana     SQL  99.0
2   Luis   Mongo  78.0
3   Juan     SQL  88.0

--- MENÚ ---
1. Agregar estudiante
2. Ver estudiantes aprobados
3. Ver promedio por materia
4. Ver todos los registros
5. Guardar archivo final
6. Salir

Promedio por materia:
materia
Mongo     66.5
Python    58.0
SQL       93.5
Name: nota, dtype: float64

--- MENÚ ---
1. Agregar estudiante
2. Ver estudiantes aprobados
3. Ver promedio por materia
4. Ver todos los registros
5. Guardar