<a href="https://colab.research.google.com/github/diegoVasquez600/Advanced_Programming/blob/main/Taller1_ProgramacionAvanzada.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Taller 1: Álgebra Lineal para Machine Learning
## Módulo: Programación Avanzada
**Institución Universitaria Pascual Bravo**

Este taller tiene como objetivo aplicar conceptos de álgebra lineal en problemas prácticos de ingeniería de software e inteligencia artificial. Deberán completar las secciones de código marcadas como `TODO`.

# 1. Diagnóstico

## 1.1 Predicción

Considere la transformación:

$$
A =
\begin{bmatrix}
2 & 1\\
0 & 1
\end{bmatrix}
$$

Antes de ejecutar el código:

1. ¿Qué le ocurrirá a un cuadrado dibujado en el plano?
2. ¿Se conservarán los ángulos?
3. ¿Alguna dirección permanecerá sin rotar?
4. ¿Cuál vector crees que podría ser un autovector?

Escribe tu predicción aquí.


## 1.2 Aplicación de PCA

Aplica PCA directamente sobre los datos del código a continuación (sin restar la media).

Luego:

1. ¿Qué observa?
2. ¿Por qué el resultado es incorrecto?
3. ¿Qué operación falta y por qué es necesaria geométricamente?


In [None]:
# dataset SIN centrar
np.random.seed(3)
data = np.random.multivariate_normal([5,5], [[3,2],[2,2]], 200)

plt.scatter(data[:,0], data[:,1])
plt.gca().set_aspect('equal')
plt.title("Datos sin centrar")
plt.show()

## 1.3 El siguiente código intenta implementar PCA pero es incorrecto.

1. Identifique el error.
2. Explique por qué ocurre.
3. Corríjalo.


In [None]:
X = np.random.multivariate_normal(
    mean=[0,0],
    cov=[[3,2],[2,2]],
    size=300
)
cov = np.cov(X)
eigvals, eigvecs = np.linalg.eig(cov)

#2. Taller

### 2.1. Operaciones con Vectores: Sistema de Detección de Anomalías
Imagina que monitoreas un servidor. El estado del sistema se representa como un vector $v = [CPU, RAM, DISCO]$.

**Reto:** Calcula la similitud coseno entre el estado actual del servidor y un vector que representa un 'estado crítico'. Si la similitud es muy alta, el sistema debe disparar una alerta.

$$cos(\theta) = \frac{A \cdot B}{||A|| ||B||}$$

Genere al menos 100 vectores con valores aleatorios, pruebe diferentes distribuciones, concluya.

In [None]:
import numpy as np

def calcular_similitud(v_actual, v_critico):
    # TODO: Implementa la formula de similitud coseno usando np.dot y np.linalg.norm
    pass

estado_actual = np.array([95, 88, 70])
estado_critico = np.array([100, 100, 100])

similitud = calcular_similitud(estado_actual, estado_critico)
print(f"Similitud con estado crítico: {similitud}")

### 2.2. Transformaciones Lineales y Matrices: Procesamiento de Imágenes
Una imagen en escala de grises puede interpretarse como una matriz:

$$
I \in \mathbb{R}^{m\times n}
$$

donde cada entrada representa la intensidad luminosa de un píxel:

- 0 → negro
- 255 → blanco

Desde el punto de vista del álgebra lineal, la imagen es un vector en un espacio de alta dimensión:

$$
\mathbb{R}^{mn}
$$

y cualquier operación que transforme todos los píxeles de la misma forma puede interpretarse como una **transformación lineal**.

---



Un cambio de brillo puede modelarse como:

$$
T(I) = \alpha I
$$

donde $\alpha > 1$ aumenta el brillo.

**Reto:** Crea una función que reciba una matriz (imagen) y aplique una transformación de escalamiento (multiplicación escalar) para aumentar el brillo, asegurando que los valores no superen 255.

¿Por qué esta operación es una transformación lineal?

¿Qué propiedad de las transformaciones lineales se viola al recortar los valores a 255?

Pruebe con:

$\alpha = 0.5$

$\alpha = 1.5$

$\alpha = 3$

Explique qué ocurre geométricamente con matriz imagen en cada caso.

Pruebe con una imagen real de tamaño pequeño (e.g. 256x256)

In [None]:
def ajustar_brillo(imagen_matriz, factor):
    # TODO: Multiplica la matriz por el factor y usa np.clip para mantener los valores entre 0 y 255
    pass

imagen_ejemplo = np.array([[10, 20], [30, 40]])
print(ajustar_brillo(imagen_ejemplo, 1.5))

###2.3. PCA

Un laboratorio instaló **tres sensores** para medir temperatura en una sala de servidores.

Sin embargo:

- Dos sensores están muy cerca entre sí.
- El tercero está en una ubicación diferente.

El sistema almacena los datos como:

$$
X \in \mathbb{R}^{n\times 3}
$$

donde cada fila es un instante de tiempo y cada columna un sensor.

Su tarea es investigar si realmente necesitamos los 3 sensores o si alguno es redundante. Para ello debe llevar a cabo los siguientes pasos:

1. Visualice los datos. Responda si los vectores parecen independientes.
2. Ejecute PCA siguiendo los pasos vistos en la sesión. Preste particular atención a la matriz de covarianza y a los autovalores y autovectores encontrados. Concluya sobre eso.
3. Proyecte los datos en el nuevo espacio. Reduzca dimensionalidad y concluya sobre los datos iniciales del problema

In [None]:
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(4)

n = 200

sensor1 = 25 + 2*np.sin(np.linspace(0,8,n)) + np.random.normal(0,0.3,n)
sensor2 = sensor1 + np.random.normal(0,0.2,n)
sensor3 = 22 + 0.5*np.sin(np.linspace(0,8,n)+1) + np.random.normal(0,0.5,n)

X = np.column_stack((sensor1, sensor2, sensor3))

print(X.shape)