# Introducción

En este notebook se presentarán algunas herramientas útiles para cualquier persona que trabaje en programación. El objetivo de esta clase es que se familiaricen con estas herramientas y puedan decidir cuáles son las más adecuadas para cada uno de sus proyectos y futuro trabajo.

Es importante destacar que muchas de estas herramientas están diseñadas para usarse en un entorno local, es decir, en el computador que ustedes están utilizando. Por esta razón, será necesario aprender a instalar y gestionar todas las dependencias y librerías, que hasta ahora hemos dado por sentado que están disponibles en Google Colab. En muchos casos, esta instalación puede resultar compleja, especialmente para aquellas librerías que requieren uso de GPU.

Trabajar en un entorno local presenta tanto ventajas como desventajas. Entre las principales ventajas se encuentra la facilidad para acceder a datos almacenados localmente, como imágenes, audios o cualquier otro tipo de archivo, los cuales suelen ser difíciles de manejar en plataformas en línea. Por otro lado, la mayor desventaja radica en las limitaciones de cómputo propias del equipo local, lo cual puede restringir el rendimiento y la capacidad de procesamiento.

# Python

Instalar python: https://www.python.org/downloads/release/python-3109/

[[https://www.python.org/downloads/]]

# Editores de código

## Introducción: Editores de código

Como ya hemos visto en clases, todo el código que escribimos es, en esencia, texto. El lenguaje de programación interpreta estas líneas según una sintaxis específica para cada caso, ejecutando las instrucciones correspondientes.

Para que el computador pueda interpretar y ejecutar este código, es necesario que tenga instalado internamente el lenguaje de programación correspondiente. Este, a su vez, no requiere más que la consola para funcionar.

La consola varía según el sistema operativo. En Windows, se llama "cmd" (Símbolo del sistema), mientras que en Mac se denomina "Terminal". En ambos casos, acceder a ella es sencillo: basta con buscar "cmd" o "Terminal" en la barra de búsqueda o Spotlight, lo que abrirá una ventana de consola similar a esta:

Ejemplo windows:

![texto del vínculo](https://upload.wikimedia.org/wikipedia/commons/b/b3/Command_Prompt_on_Windows_10_RTM.png)

Ejemplo Mac:

<img src="https://help.apple.com/assets/65DFB7A79DFEC61A7A0517AC/65DFB7A793CD15C0410BA37D/es_419/ff5c51a873b9efb253e9f0d0d6f19d53.png" alt="texto del vínculo" width="700"/>

Con la consola abierta, si Python ya está instalado, basta con escribir "python" para que el equipo comience a interpretar comandos en ese lenguaje. Esto mostrará una interfaz similar a la siguiente:

Correr Python en la consola:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/ConsolaPython.png" alt="texto del vínculo" width="700"/>

Además, si tienes un script (archivo de Python), puedes ejecutarlo directamente desde la consola escribiendo python NombreArchivo.py. Por ejemplo, si el script se llama HolaMundo.py y contiene únicamente la línea de código print("Hola Mundo"), su ejecución en la consola sería como se muestra en la siguiente imagen:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/ConsolaPython2.png" alt="texto del vínculo" width="700"/>

Si lo analizamos, esta interfaz resulta poco práctica y, en general, incómoda, pues uno espera contar con la misma facilidad que ofrece un notebook. Por eso, en la práctica, para evitar trabajar directamente en la consola, se utilizan los editores de código. Estas aplicaciones permiten visualizar el código de forma más intuitiva, resaltando con colores diferentes secciones y mostrando claramente la sintaxis del lenguaje. Todo esto tiene como objetivo alejarnos lo máximo posible de la consola y facilitar la programación.


Comandos utilies de la consola:



*   cd
*   cd ..
*   cls
*   exit



## Visual Studio Code

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/9a/Visual_Studio_Code_1.35_icon.svg/1200px-Visual_Studio_Code_1.35_icon.svg.png" width="100"/>

Link descarga: https://code.visualstudio.com/download

Visual Studio Code es un editor de código que generalmente se destaca como uno de los mejores. A diferencia de otros editores, Visual Studio Code está conectado a un servidor de extensiones que permite mejorar y personalizar la interfaz según las necesidades del usuario, de forma progresiva.

Sin embargo, antes de explorar estas funcionalidades avanzadas, es importante entender lo básico de este editor.

A continuación, se muestra la pestaña de inicio al abrir Visual Studio Code:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/VisualStudioBordes.png" width="700"/>

La imagen muestra enmarcadas las barras de opciones y algunos íconos, cuya función general es la siguiente:

* Barra superior: Permite editar las vistas, abrir terminales, cambiar de carpeta, entre otras opciones.

* Barra lateral izquierda: Muestra los archivos de la carpeta abierta y las extensiones instaladas en Visual Studio Code.

* Ícono de engranaje: Desde aquí se puede cambiar el perfil del usuario y modificar el tema del editor.

* Ícono de lupa: Permite hacer zoom en la interfaz.


### Extensiones

Tal como se mencionó anteriormente, Visual Studio Code ofrece una serie de extensiones que permiten personalizar y mejorar la interfaz y experiencia del usuario. Para esta clase, recomiendo instalar las siguientes extensiones:

* Python [Pylance + Python Debugger]: Proporciona soporte avanzado para Python, incluyendo autocompletado inteligente, análisis de código, y herramientas para depuración.

* Jupyter Notebook: Permite abrir, editar y ejecutar archivos Jupyter Notebook (.ipynb) directamente desde Visual Studio Code, facilitando el trabajo con notebooks de manera local.

* vscode-icons: Mejora la visualización de archivos y carpetas añadiendo íconos personalizados según el tipo de archivo, haciendo la navegación más intuitiva.

* Project Manager: Facilita la organización y el acceso rápido a diferentes proyectos desde una misma interfaz, permitiendo cambiar entre ellos de manera sencilla.

Con todas estas extensiones, editar código resulta mucho más intuitivo y cómodo, disminuyendo las diferencias entre trabajar en Google Colab y hacerlo localmente.

Lo último que debemos considerar son las librerías que Google Colab tiene preinstaladas. Como Colab incluye muchas dependencias listas para usar al crear un notebook, primero debemos instalar manualmente estas librerías en nuestro entorno local para poder ejecutar código similar sin inconvenientes.


### Entorno Virtual

Antes de instalar las librerías faltantes, es importante crear un entorno virtual. Un entorno virtual es una buena práctica para gestionar instalaciones de librerías, ya que crea una especie de “mini-perfil” que mantiene las dependencias dentro de una carpeta específica sin afectar al resto del sistema. Esto es especialmente relevante cuando trabajamos en múltiples proyectos que pueden requerir diferentes versiones de una misma librería, algo que sería imposible manejar sin entornos virtuales.

Además, esta práctica es fundamental para proyectos grandes, donde la reproducibilidad es clave: se espera poder ejecutar el mismo código en distintos equipos sin problemas. Por ello, se han desarrollado métodos para “congelar” y “clonar” entornos virtuales, asegurando que las mismas dependencias estén disponibles en diferentes máquinas. Este proceso de congelamiento y clonación lo abordaremos en las actividades prácticas.

Para crear un entorno virtual en Visual Studio Code, se deben seguir estos pasos:

1. Seleccionar la carpeta donde trabajaremos (esto es extremadamente importante).

2. Presionar Ctrl + Shift + P y escribir > Python: Create Environment...

3. Elegir la versión de Python que se desea usar (en caso de tener más de una instalada).

Esto creará automáticamente el entorno virtual, generando una carpeta llamada por defecto ".venv". Además, en la esquina inferior derecha aparecerá indicado que la versión de Python activa corresponde a este entorno, por ejemplo: Python 3.12.10 (".venv").

Ejemplo:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/VisualStudio2.png" width="700"/>


#### Instalar librerías

Con esto ya podemos instalar las librerías que necesitaremos, para ello el método más común corresponde al uso de la función "pip", la cual viene instalada internamente en Python. Para instalar una librería basta simplemente con colocar "pip install NombreLibreria", en donde uno puede hacer esta operación directamente en la terminal de visual o desde un archivo/notebook colocando la misma línea pero incluyendo un "!" al inicio de esta ("!pip install NombreLibreria").

Ejemplos:

*   pip install numpy (terminal) / !pip install numpy (notebook)
*   pip install scikit-learn (terminal)/ !pip install scikit-learn (notebook)

En ciertos casos, algunas librerías poseen nombres complejos que a priori no son el mismo con el que se llaman directamente, en dichos casos se aconseja buscar directamente la instalación de ellas, en donde por lo general siempre mostraran como instalarla por medio de "pip".

Para instalar una versión especifica de una librería, uno debe llamar a la función pip de este modo "pip install NombreLibreria==1.15.0" en donde siempre podemos desinstalar una libreria ya instalada (dado que queremos otra version) por medio de "pip uninstall NombreLibreria" (hay que apretar Y, cuando aparezca el input). Del mismo modo, uno puede hacer esto "pip install --force-reinstall NombreLibreria==Version" que en una sola línea desinstala e instala nuevamente la librería deseada.

Ejemplo de uso de pip install:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/VisualStudio3.png" width="1000"/>

Cabe destacar que ciertas librerías tienen dependencia con otras librerías, en donde se espera tener versiones compatibles entre ellas, ejemplo de esto es el caso de TensorFlow y Numpy, en donde ciertas versiones antiguas de TensorFlow llaman versiones antiguas de Numpy, por ello no basta solamente con descargar una sino que hay que tener las dos específicas. Además, en ciertos casos esta discrepancia generara errores en el código evitando la ejecución correcta de este.

#### Congelar un ambiente virtual

Teniendo el ambiente creado con las librerías deseadas, uno puede "congelar" su ambiente por medio de la función "pip", en donde uno puede generar un archivo denominado "requariments.txt" con todas las librerías asociadas a su ambiente. La creación de dicho archivo se hace por medio de esta línea de código:

*   pip freeze > requirements.txt (terminal)

Esto crea un archivo de texto con el nombre de las librerías instaladas en el ambiente virtual, el cual puede ser utilizado posteriormente para clonar en otro ambiente.


#### Clonar un ambiente virtual

Teniendo el archivo "requiariments.txt", uno puede clonar las librerias de un ambiente virtual desde uno nuevo, por medio de pip aplicando la siguiente operacion:

*   pip install -r requirements.txt (terminal)

En donde se tiene pensado que el archivo requirements es exactamente el mismo que el creado en la seccion de congelar. Esto resulta muy util cuando uno quiere replicar resultados de codigos presentes en repositorios, en donde por lo general las personas suben su requirements.txt para poder ser clonados.

Ej: https://github.com/milesial/Pytorch-UNet/blob/master/requirements.txt

# Actividad 1: Entornos virtuales

Ejecute en su computador el código de la clase 3 para dos entornos virtuales distintos. Para ello, siga los siguientes pasos:


1.   Cree dos carpetas distintas, y cree para cada una de ellas un entorno virtual.
2.   Descargue los datos del problema "mnist.csv" y guarde una copia en ambas carpetas.
3.   Para uno de los entornos, instale todas las librerías necesarias y ejecute el código.
4.   Congele dicho entorno virtual y clonelo en la otra carpeta respectiva, verificando que este nuevo entorno también pueda ejecutar dicho código.

Ojo: Se asume que el código sea ejecutado desde un archivo .py

Link mnist.csv: https://github.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/blob/main/data/mnist.csv





In [None]:
# Codigo clase 3

# Librerias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import sklearn.decomposition
from sklearn.metrics import (homogeneity_score,completeness_score,v_measure_score)
from sklearn.manifold import (Isomap,LocallyLinearEmbedding,MDS,TSNE)
from sklearn.preprocessing import MinMaxScaler

#Lectura de datos
mnist = pd.read_csv("mnist.csv")
y = mnist['label']

#Función para graficar "bonito"
def plot_embedding(X, title, ax=None):
    X = MinMaxScaler().fit_transform(X)
    for digit in np.unique(mnist.label):
        ax.scatter(
            *X[y == digit].T,
            marker=f"${digit}$",
            s=60,
            color=plt.cm.tab10(digit),
            alpha=0.3,
            zorder=2,
        )
    shown_images = np.array([[1.0, 1.0]])  # just something big
    ax.set_title(title)


#Misma descomposición PCA de la clase pasada
pca_mnist_2d = sklearn.decomposition.PCA(2)
mnist_2d=pca_mnist_2d.fit_transform(mnist.iloc[:,:-1])

#Ajustamos un embedding de 2 dimensiones para visualización.
tsne_mnist_2d = TSNE(2, perplexity=30.0, random_state=11, init="random")
mnist_2d_tsne=tsne_mnist_2d.fit_transform(mnist.iloc[:,:-1])

#Primero deben instancias las figuras y luego entregar la posicisión de esta a la función
_, ax = plt.subplots(2 , figsize=(8, 8))

#TNSE
plot_embedding(mnist_2d_tsne, "TNSE", ax[0])

#PCA
plot_embedding(mnist_2d, "PCA", ax[1])

#Para que aparezca la imagen
plt.show()

# Rendimiento y GPU

En la Actividad 1 pudieron haber enfrentado una serie de problemas de rendimiento, esto tiene que ser un indicador constante que deben observar al ejecutar código de forma local, dado que ahora deben considerar todos los procesos secundarios presentes en su computador.

Una forma de observar el rendimiento es por medio del administrador de tareas, el cual se puede abrir con el comando "Ctrl + Alt + Supr", aca existe una pestaña llamada Rendimiento que se ve de la siguiente forma:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/RendimientoCPU.png" width="800"/>

Dicha pestaña, permite saber el gasto de memoria RAM que se está utilizando en el momento, en donde como se observa mi equipo posee 8GB de RAM, de los cuales solo puede utilizar 5.9GB, gastando en ese preciso momento 5,1GB en otros procesos. Para ver los procesos específicos hay que dirigirse a la pestaña con el mismo nombre, en donde aparecen de forma automática los procesos que están gastando más memoria en ese momento:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/RendimientoCPU2.png" width="800"/>

Por lo general, los procesos que gastan más recursos son los que se están ejecutando en ese preciso momento, en donde para la imagen anterior no es sorpresa que Google Chrome y Visual Studio Code sean los que están consumiendo más. Por ello, si es que se requiere realizar una tarea que ocupe mucha memoria, es recomendable cerrar todos los procesos secundarios. Esto se puede hacer de manera directa (cerrando las aplicaciones), o desde el mismo administrador de tareas colocando "finalizar tarea".

Cabe destacar que existen muchas operaciones de Python que consumen una gran cantidad de memoria de manera innecesaria, en donde si uno está trabajando con una memoria limitada, debe ser capaz de poder administrar sus recursos de forma eficiente. A continuación hay algunos ejemplos:


## Ejemplo 1: Print de una matriz enorme (muy ineficiente)

In [None]:
import numpy as np

# Crear una matriz de 10000 x 10000 de números aleatorios
matriz = np.random.rand(10000, 10000)

# Imprimir la matriz completa (consumo de memoria + consola colapsada)
print(matriz)

## Ejemplo 2: Lista gigante en memoria (innecesariamente almacenada)

In [None]:
# Crear una lista con 1 millón de strings grandes
lista = ["x" * 1000 for _ in range(1000000)]

print("Lista creada")

## Ejemplo 3: Acumulación innecesaria en un bucle

In [None]:
import random

# Se guardan todos los resultados aunque no se usen
datos = []
for _ in range(10000000):
    datos.append(random.random() * 1000)

##GPU

Para el caso de la GPU es similar, solo que por lo general esta presenta menos memoria. Ahora, no todos los PC poseen una GPU, en donde importa mucho el modelo y cantidad de memoria que estas poseen dado que afectaran directo en el entrenamiento de modelos de Deep Learning. La forma de verificar que modelo se tiene puede ser por medio del mismo administrador de tareas, en donde existirá una pestaña adicional en el rendimiento con el nombre de GPU:

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/GPU1.png" width="800"/>

Acá mi PC, muestra que poseo dos GPU ambas de distinta marca, en donde la GPU 0 presenta 4GB de ram y es de la marca NVIDIA GeForce GTX 1650. Esta tarjeta gráfica corresponde a la que utiliza mi equipo internamente para la mayoría de los procesos, en donde es en la práctica la que yo utilizo para entrenar modelos de Deep Learning, la cual claramente es inferior a la que ofrece Google Colab (T4 de 20GB).


### Librerias de Deep Learning y CUDA

Para poder utilizar las tarjetas gráficas de NVIDIA con las librerías de Deep Learning, es necesario ajustar el CUDA toolkit que presenta nuestro equipo, en donde estas librerías funcionan en medida de la versión de CUDA que presentamos. Por ello, es relevante saber dos cosas:

1.   La versión de CUDA compatible con nuestra tarjeta gráfica / GPU.
2.   La versión de la librería que utilizaremos para verificar si es compatible con nuestra versión de CUDA.

Por ende, los siguientes links son relevantes:

CUDA por GPU: https://developer.nvidia.com/cuda-gpus

TensorFlow por CUDA: https://www.tensorflow.org/install/source?hl=es-419#gpu

Pytorch por CUDA: https://pytorch.org/get-started/locally/

En medida de la versión de CUDA que tengamos, podremos escoger que versione de TensorFlow o pytorch podremos utilizar. Además, tal como se ve en esas tablas existe un margen de holgura, en donde tarjetas gráficas pueden actualizar su versión de CUDA al igual que utilizar versiones previas. Esta modificación como tal puede ser compleja y tediosa pero existe la posibilidad.

Ahora en muchos dispositivos esto puede venir instaurado internamente, por lo cual no es necesario una instalación de CUDA especifica, para verificar esto se utiliza la "cmd", en donde el comando "nvidia-smi" muestra la información referente a la tarjeta gráfica de NVIDIA.

<img src="https://raw.githubusercontent.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/refs/heads/main/data/Clase10/GPU2.png" width="800"/>

En dicha imagen aparece en la esquina superior derecha la versión de CUDA de mi GPU, y abajo los procesos que se están ejecutando, que en este caso son ninguno.




# Actividad 2: Ejecución de código con GPU

In [None]:
# Codigo TORCH 1
import torch

def verificar_gpus():
    if torch.cuda.is_available():
        num_gpus = torch.cuda.device_count()
        print(f"Se detectaron {num_gpus} GPU(s):")
        for i in range(num_gpus):
            nombre_gpu = torch.cuda.get_device_name(i)
            memoria_total = torch.cuda.get_device_properties(i).total_memory / (1024 ** 3)  # en GB
            print(f"  GPU {i}: {nombre_gpu}, Memoria total: {memoria_total:.2f} GB")
    else:
        print("No se detectaron GPUs disponibles.")

if __name__ == "__main__":
    verificar_gpus()

In [None]:
# Codigo TORCH 2
import torch

def crear_tensor_grande_en_gpu():
    tamano_en_gb = 1
    bytes_por_elemento = 4  # float32
    num_elementos = (tamano_en_gb * 1024**3) // bytes_por_elemento

    # Crear el tensor
    tensor = torch.rand(num_elementos, dtype=torch.float32)
    print(f"Tensor creado con {num_elementos:,} elementos (~1 GB).")

    if torch.cuda.is_available():
        tensor_gpu = tensor.to("cuda")
        print("Tensor movido a GPU.")
        print(f"Dispositivo del tensor: {tensor_gpu.device}")
    else:
        print("No hay GPU disponible. El tensor permanece en CPU.")

if __name__ == "__main__":
    crear_tensor_grande_en_gpu()
    input()

# Extra

Link dataset: https://github.com/MaxWesterhout/Sistemas-de-Diagnostico-y-Tratamiento-I/blob/main/data/activity_recognition.csv

In [None]:
import pandas as pd
import numpy as np
import sklearn
import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler, LabelEncoder
from torch.utils.data import DataLoader, TensorDataset
from sklearn.metrics import accuracy_score

# Comprobar si hay GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Dispositivo:", device)

# 1. Cargar los datos
data = pd.read_csv("activity_recognition.csv")
features = data.iloc[:, :-1]
labels = data['activity']

# 2. Normalizar los datos
scaler = MinMaxScaler()
features_scaled = scaler.fit_transform(features)

# 3. Codificar etiquetas (One-Hot Encoding)
encoder = LabelEncoder()
labels_encoded = encoder.fit_transform(labels)
num_classes = len(np.unique(labels_encoded))

# Convertir a one-hot encoding manualmente
labels_onehot = np.eye(num_classes)[labels_encoded]

# 4. Separar conjuntos de entrenamiento, validación y prueba
X_train, X_test, y_train, y_test = train_test_split(features_scaled, labels_onehot, random_state=11)
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.1, random_state=11)

# 5. Convertir a tensores de PyTorch
X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train, dtype=torch.float32)

X_val_tensor = torch.tensor(X_val, dtype=torch.float32)
y_val_tensor = torch.tensor(y_val, dtype=torch.float32)

X_test_tensor = torch.tensor(X_test, dtype=torch.float32)
y_test_tensor = torch.tensor(y_test, dtype=torch.float32)

# 6. Crear DataLoaders
batch_size = 5
train_loader = DataLoader(TensorDataset(X_train_tensor, y_train_tensor), batch_size=batch_size, shuffle=True)
val_loader = DataLoader(TensorDataset(X_val_tensor, y_val_tensor), batch_size=batch_size)

# 7. Definir modelo
class MLP(nn.Module):
    def __init__(self, input_size, num_classes):
        super(MLP, self).__init__()
        self.net = nn.Sequential(
            nn.Linear(input_size, 128),
            nn.ReLU(),
            nn.Linear(128, num_classes),
            nn.Softmax(dim=1)  # para multiclase
        )

    def forward(self, x):
        return self.net(x)

model = MLP(X_train.shape[1], num_classes).to(device)

# 8. Compilar modelo
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 9. Entrenamiento
epochs = 10
for epoch in range(epochs):
    model.train()
    total_loss = 0
    for X_batch, y_batch in train_loader:
        X_batch = X_batch.to(device)
        y_batch = y_batch.to(device)

        outputs = model(X_batch)
        loss = criterion(outputs, torch.argmax(y_batch, dim=1))

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_loss += loss.item()

    print(f"Época {epoch+1}/{epochs} - Pérdida: {total_loss:.4f}")

    # Validación
    model.eval()
    with torch.no_grad():
        val_preds = model(X_val_tensor.to(device))
        val_preds_labels = torch.argmax(val_preds, dim=1).cpu().numpy()
        val_true_labels = torch.argmax(y_val_tensor, dim=1).numpy()
        acc = accuracy_score(val_true_labels, val_preds_labels)
        print(f"  -> Exactitud en validación: {acc:.4f}")