# **Ejercicio Integrador: An√°lisis de Rendimiento Acad√©mico**

#### Contexto:
Eres docente de una escuela secundaria y tienes los resultados de ex√°menes de 4 asignaturas (Matem√°ticas, Historia, Ciencias, Lengua) de 30 estudiantes. Los datos est√°n organizados en una matriz NumPy de forma `(30, 4)`, donde cada fila representa a un estudiante y cada columna a una asignatura.

Algunos valores faltan (por ausencias) y se han registrado como `np.nan`.



#### **Parte 1: Preparaci√≥n de los datos**
1. Genera una matriz `notas` de tama√±o `(30, 4)` con valores aleatorios entre 0 y 10 (con un decimal), usando `np.random.uniform`.
2. Reemplaza aleatoriamente el **10% de los valores** por `np.nan` para simular ausencias.

> Pista: puedes usar `np.random.choice` para seleccionar √≠ndices.



#### **Parte 2: An√°lisis b√°sico**
3. Calcula el **promedio general** de todas las notas **ignorando los `nan`**.
4. Calcula el **promedio por asignatura** (una lista de 4 valores).
5. Calcula el **promedio por estudiante** (un array de 30 valores). Si un estudiante no tiene ninguna nota v√°lida, su promedio debe ser `np.nan`.



#### **Parte 3: Consultas espec√≠ficas**
6. Determina cu√°ntos estudiantes tienen **promedio ‚â• 7.0**.
7. Encuentra los √≠ndices (n√∫meros de estudiante) de quienes tienen **menos de 4.0 en Matem√°ticas**.
8. Calcula el **porcentaje de datos faltantes** en la matriz completa.



#### **Parte 4: Transformaci√≥n y validaci√≥n**
9. Crea una nueva matriz `notas_completas` donde todos los `np.nan` se reemplacen por el **promedio de su respectiva asignatura** (calculado en punto 4).
10. Define una funci√≥n `es_aprobado(promedio)` que retorne `True` si `promedio >= 6.0`. Aplica esta funci√≥n al array de promedios por estudiante y cuenta cu√°ntos aprobaron.



#### **Parte 5: B√∫squeda**
11. Identifica al **estudiante con mayor mejora** entre la primera asignatura (Matem√°ticas) y la √∫ltima (Lengua), **ignorando casos donde alguna nota sea `nan`**. Devuelve su √≠ndice y la diferencia de notas.



#### **Parte 6: Bonus**
12. Encapsula tu c√≥digo como una clase python en un m√≥dulo para poder reutilizarlo en m√°s proyectos.

## Soluci√≥n

In [None]:
import numpy as np

# Fijar semilla para reproducibilidad
np.random.seed(42)

# ====================================================
# PARTE 1: PREPARACI√ìN DE LOS DATOS
# ====================================================

# 1. Generar matriz (30, 4) con notas entre 0 y 10 (1 decimal)
notas = np.round(np.random.uniform(0, 10, size=(30, 4)), 1)

# 2. Reemplazar 10% de los valores por np.nan
total_vals = notas.size
num_nans = int(0.10 * total_vals)
flat_indices = np.random.choice(total_vals, size=num_nans, replace=False)
rows, cols = np.unravel_index(flat_indices, notas.shape)
notas[rows, cols] = np.nan

print("‚úÖ Matriz de notas generada con", np.isnan(notas).sum(), "valores faltantes.")

# ====================================================
# PARTE 2: AN√ÅLISIS B√ÅSICO
# ====================================================

# 3. Promedio general (ignorando NaN)
promedio_general = np.nanmean(notas)

# 4. Promedio por asignatura (eje 0: filas ‚Üí estudiantes)
promedio_asignatura = np.nanmean(notas, axis=0)

# 5. Promedio por estudiante (eje 1: columnas ‚Üí asignaturas)
promedio_estudiante = np.nanmean(notas, axis=1)

print(f"\nüìä Promedio general: {promedio_general:.2f}")
print(f"üìö Promedios por asignatura: Mat={promedio_asignatura[0]:.2f}, "
      f"Hist={promedio_asignatura[1]:.2f}, Cien={promedio_asignatura[2]:.2f}, "
      f"Leng={promedio_asignatura[3]:.2f}")

# ====================================================
# PARTE 3: CONSULTAS ESPEC√çFICAS
# ====================================================

# 6. Estudiantes con promedio ‚â• 7.0
estudiantes_con_7_o_mas = np.sum(promedio_estudiante >= 7.0)

# 7. √çndices con nota < 4.0 en Matem√°ticas (col 0)
indices_baja_matematica = np.where(notas[:, 0] < 4.0)[0]

# 8. Porcentaje de datos faltantes
porcentaje_faltantes = (np.isnan(notas).sum() / notas.size) * 100

print(f"\nüìà Estudiantes con promedio ‚â• 7.0: {estudiantes_con_7_o_mas}")
print(f"üìâ Estudiantes con <4.0 en Matem√°ticas: {indices_baja_matematica}")
print(f"‚ùì Porcentaje de datos faltantes: {porcentaje_faltantes:.1f}%")

# ====================================================
# PARTE 4: TRANSFORMACI√ìN Y VALIDACI√ìN
# ====================================================

# 9. Rellenar NaN con promedio de cada asignatura
notas_completas = notas.copy()
for j in range(notas.shape[1]):
    col_mean = promedio_asignatura[j]
    notas_completas[:, j] = np.where(np.isnan(notas[:, j]), col_mean, notas[:, j])


# Verificaci√≥n
assert not np.isnan(notas_completas).any(), "¬°A√∫n hay NaN en notas_completas!"

# -------------------------------------------------
## Alternativa usando np.where y np.take

# Calcular la media de cada columna ignorando NaN
col_means = np.nanmean(notas, axis=0)

# Encontrar posiciones donde hay NaN
inds = np.where(np.isnan(notas))

# Reemplazar NaN con las medias correspondientes de cada columna
notas_sin_nan = notas.copy()  # Evitar modificar el original
notas_sin_nan[inds] = np.take(col_means, inds[1])

# Ahora arr no tiene NaN
print('notas_sin_nan:',notas_sin_nan)
# -------------------------------------------------

# 10. Contar aprobados (promedio ‚â• 6.0)
def es_aprobado(promedio):
    return promedio >= 6.0

cantidad_aprobados = np.sum(es_aprobado(promedio_estudiante))
print(f"\n‚úÖ Cantidad de estudiantes aprobados (‚â•6.0): {cantidad_aprobados}")

# ====================================================
# PARTE 5: DESAF√çO
# ====================================================

# 11. Estudiante con mayor mejora: Lengua - Matem√°ticas
mat = notas[:, 0]
leng = notas[:, 3]
validos = ~(np.isnan(mat) | np.isnan(leng))  # ambos no NaN

if np.any(validos):
    diferencias = leng[validos] - mat[validos]
    # Recuperar el √≠ndice original del estudiante
    idx_validos = np.where(validos)[0]
    idx_max = idx_validos[np.argmax(diferencias)]
    mejora = diferencias.max()
    print(f"\nüèÜ Mayor mejora: Estudiante {idx_max} (mejora = {mejora:.2f})")
else:
    print("\n‚ö†Ô∏è No hay estudiantes con ambas notas completas.")

‚úÖ Matriz de notas generada con 12 valores faltantes.

üìä Promedio general: 4.72
üìö Promedios por asignatura: Mat=4.45, Hist=4.73, Cien=4.57, Leng=5.09

üìà Estudiantes con promedio ‚â• 7.0: 2
üìâ Estudiantes con <4.0 en Matem√°ticas: [ 0  1  4  8  9 10 11 14 15 16 17 18 21 25 27]
‚ùì Porcentaje de datos faltantes: 10.0%
notas_sin_nan: [[3.7        9.5        7.3        5.09285714]
 [1.6        1.6        0.6        5.09285714]
 [6.         7.1        0.2        9.7       ]
 [4.45185185 4.73333333 4.56538462 1.8       ]
 [3.         5.2        4.3        2.9       ]
 [4.45185185 4.73333333 2.9        3.7       ]
 [4.6        7.9        2.         5.1       ]
 [5.9        0.5        6.1        1.7       ]
 [0.7        4.73333333 4.56538462 8.1       ]
 [3.         1.         6.8        4.4       ]
 [1.2        5.         0.3        9.1       ]
 [2.6        6.6        4.56538462 5.2       ]
 [4.45185185 1.8        9.7        7.8       ]
 [9.4        8.9        6.         9.2      

In [3]:
import  numpy as np
help(np.random.choice)

Help on method choice in module numpy.random.mtrand:

choice(a, size=None, replace=True, p=None) method of numpy.random.mtrand.RandomState instance
    choice(a, size=None, replace=True, p=None)

    Generates a random sample from a given 1-D array

    .. versionadded:: 1.7.0

    .. note::
        New code should use the `~numpy.random.Generator.choice`
        method of a `~numpy.random.Generator` instance instead;
        please see the :ref:`random-quick-start`.

        This function uses the C-long dtype, which is 32bit on windows
        and otherwise 64bit on 64bit platforms (and 32bit on 32bit ones).
        Since NumPy 2.0, NumPy's default integer is 32bit on 32bit platforms
        and 64bit on 64bit platforms.


    Parameters
    ----------
    a : 1-D array-like or int
        If an ndarray, a random sample is generated from its elements.
        If an int, the random sample is generated as if it were ``np.arange(a)``
    size : int or tuple of ints, optional
        Out