# Imágenes

En este notebook generaremos las imágenes necesarias para presentar en la tesis.

In [None]:
# librerias numericas
import pandas as pd
import numpy as np

# librerias de graficas
import matplotlib.pyplot as plt
import seaborn as sns

# librerias ML
from sklearn.preprocessing import StandardScaler # para estandarizar datos
from sklearn.decomposition import PCA # para el PCA

In [None]:
# importación de los datos
datos_voltajes = pd.read_csv('df_datos_voltajes.csv', index_col='Unnamed: 0')

## Imagen 1

Boxplots de ritmo cardiaco

In [None]:
# columnas sobre ritmo cardiaco
columnas = ['min_RC', 'media_RC', 'max_RC', 'sd_RC']
nombres = ['mínimo ritmo cardiaco', 'media ritmo cardiaco', 'máximo ritmo cardiaco', 'desviación estandar ritmo cardiaco']
labels = ['NORM', 'MI', 'STTC', 'STTC/MI']
z = 0

# creamos la figura
fig, axs = plt.subplots(2,2, figsize=(6, 7))

#graficamos con un for
for columna, ubicacion, nombre in zip(columnas, axs.flatten(), nombres):
    Q1,Q3 = np.quantile(datos_voltajes[columna].dropna(),[0.25,0.75])
    RIQ = Q3-Q1
    li = Q1 - 2*RIQ
    ls = Q3 + 3.5*RIQ
    sns.boxplot(datos_voltajes, x=columna, hue='categoria', ax=ubicacion)
    ubicacion.set_xlim([li,ls])
    ubicacion.set_xlabel(nombre)
    ubicacion.get_legend().remove() # quitamos las leyendas individuales de los gráficos
    if z == 0: # para el primer ciclo...
        handles, _ = ubicacion.get_legend_handles_labels() # obtenemos la info de leyendas
        z =+ 1 # cambiamos z para no volver a sacar la info
# agregamos la leyenda global
fig.legend(handles, labels, loc='upper center', ncols=4, bbox_to_anchor=(0.55, 0.98))

# Ajuste manual
plt.subplots_adjust(top=0.92, right=1)
plt.savefig('../imagenes/ritmo_cardiaco.png', dpi=300, bbox_inches='tight')
plt.show()

## Imagen 2

Boxplots de onda P

In [None]:
# columnas de la onda
columnas = ['min_P', 'media_P', 'max_P', 'sd_P']
nombres = ['mínimo onda P', 'media onda P', 'máximo onda P', 'desviación estandar onda P']
labels = ['NORM', 'MI', 'STTC', 'STTC/MI']
z = 0

# creamos la figura
fig, axs = plt.subplots(2,2, figsize=(6, 7))

#graficamos con un for
for columna, ubicacion, nombre in zip(columnas, axs.flatten(), nombres):
    Q1,Q3 = np.quantile(datos_voltajes[columna].dropna(),[0.25,0.75])
    RIQ = Q3-Q1
    li = Q1 - 2*RIQ
    ls = Q3 + 3.5*RIQ
    sns.boxplot(datos_voltajes, x=columna, hue='categoria', ax=ubicacion)
    ubicacion.set_xlim([li,ls])
    ubicacion.set_xlabel(nombre)
    ubicacion.get_legend().remove() # quitamos las leyendas individuales de los gráficos
    if z == 0: # para el primer ciclo...
        handles, _ = ubicacion.get_legend_handles_labels() # obtenemos la info de leyendas
        z =+ 1 # cambiamos z para no volver a sacar la info
# agregamos la leyenda global
fig.legend(handles, labels, loc='upper center', ncols=4, bbox_to_anchor=(0.55, 0.98))

# Ajuste manual
plt.subplots_adjust(top=0.92, right=1)
plt.savefig('../imagenes/onda_p.png', dpi=300, bbox_inches='tight')
plt.show()

## Imagen 3

onda r

In [None]:
# columnas de la onda
columnas = ['min_R', 'media_R', 'max_R', 'sd_R']
nombres = ['mínimo onda R', 'media onda R', 'máximo onda R', 'desviación estandar onda R']
labels = ['NORM', 'MI', 'STTC', 'STTC/MI']
z = 0

# creamos la figura
fig, axs = plt.subplots(2,2, figsize=(6, 7))

#graficamos con un for
for columna, ubicacion, nombre in zip(columnas, axs.flatten(), nombres):
    Q1,Q3 = np.quantile(datos_voltajes[columna].dropna(),[0.25,0.75])
    RIQ = Q3-Q1
    li = Q1 - 2*RIQ
    ls = Q3 + 3.5*RIQ
    sns.boxplot(datos_voltajes, x=columna, hue='categoria', ax=ubicacion)
    ubicacion.set_xlim([li,ls])
    ubicacion.set_xlabel(nombre)
    ubicacion.get_legend().remove() # quitamos las leyendas individuales de los gráficos
    if z == 0: # para el primer ciclo...
        handles, _ = ubicacion.get_legend_handles_labels() # obtenemos la info de leyendas
        z =+ 1 # cambiamos z para no volver a sacar la info
# agregamos la leyenda global
fig.legend(handles, labels, loc='upper center', ncols=4, bbox_to_anchor=(0.55, 0.98))

# Ajuste manual
plt.subplots_adjust(top=0.92, right=1)
plt.savefig('../imagenes/onda_r.png', dpi=300, bbox_inches='tight')
plt.show()

# Imagen 4

onda T

In [None]:
# columnas de la onda
columnas = ['min_T', 'media_T', 'max_T', 'sd_T']
nombres = ['mínimo onda T', 'media onda T', 'máximo onda T', 'desviación estandar onda T']
labels = ['NORM', 'MI', 'STTC', 'STTC/MI']
z = 0

# creamos la figura
fig, axs = plt.subplots(2,2, figsize=(6, 7))

#graficamos con un for
for columna, ubicacion, nombre in zip(columnas, axs.flatten(), nombres):
    Q1,Q3 = np.quantile(datos_voltajes[columna].dropna(),[0.25,0.75])
    RIQ = Q3-Q1
    li = Q1 - 2*RIQ
    ls = Q3 + 3.5*RIQ
    sns.boxplot(datos_voltajes, x=columna, hue='categoria', ax=ubicacion)
    ubicacion.set_xlim([li,ls])
    ubicacion.set_xlabel(nombre)
    ubicacion.get_legend().remove() # quitamos las leyendas individuales de los gráficos
    if z == 0: # para el primer ciclo...
        handles, _ = ubicacion.get_legend_handles_labels() # obtenemos la info de leyendas
        z =+ 1 # cambiamos z para no volver a sacar la info
# agregamos la leyenda global
fig.legend(handles, labels, loc='upper center', ncols=4, bbox_to_anchor=(0.55, 0.98))

# Ajuste manual
plt.subplots_adjust(top=0.92, right=1)
plt.savefig('../imagenes/onda_t.png', dpi=300, bbox_inches='tight')
plt.show()

## imagen 5

Correlaciones

In [None]:
# matríz de correlación
fig, ax = plt.subplots(figsize=(10,10))
datos_correlacion = datos_voltajes[datos_voltajes.columns[2:-5]].corr()
sns.heatmap(datos_correlacion,
            annot=True,
            fmt=".1f",
            cmap=sns.color_palette("vlag",as_cmap=True),
            xticklabels=datos_correlacion.columns.values,
            yticklabels=datos_correlacion.columns.values)
plt.savefig('../imagenes/corr.png', dpi=300, bbox_inches='tight')
plt.show()

## imagen 6

PCA

In [None]:
# PCA

# primero arreglamos los datos
datos_pca_originales = datos_voltajes.drop(['id_ecg','categoria','patient_id','sex'],axis=1).dropna() # quitamos algunas columnas no numéricas y los NA.
scaler = StandardScaler() # llamamos al normalizador
datos_pca = scaler.fit_transform(datos_pca_originales) # normalizamos

# aplicamos PCA
pca = PCA(n_components=2) # llamamos al PCAdor
datos_pca = pca.fit_transform(datos_pca) # aplicamos PCA

# calculamos los pesos de cada variable en cada componente (se usan abajo)
componentes = pca.components_  # Matriz de pesos: cada fila es un componente (PC1, PC2, ...)
componentes = pd.DataFrame(componentes, columns=datos_pca_originales.columns) # transformamos los valores en un df

print(pca.explained_variance_ratio_)

In [None]:
# gráfico de barras con el peso de cada variable en cada componente principal
plt.figure(figsize=(8, 6))
componentes.T.plot(kind='bar', figsize=(10, 6), legend=True)
plt.ylabel('Cargas (Pesos)')
plt.xlabel('Variables')
plt.grid(axis='y')
plt.xticks(rotation=45)
plt.legend(handles, ['PC1','PC2'], loc='upper right')
plt.savefig('../imagenes/pca.png', dpi=300, bbox_inches='tight')
plt.show()