In [None]:
import pandas as pd
import numpy as np
import os
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap

## **Estadísticas generales (visualización de caja y bigotes)**

In [None]:
# Obtener datos 
nombre_archivo = os.path.join('..', 'datos', 'datos_procesados', 'nodos.csv')
datos = pd.read_csv(nombre_archivo)

# Filtrar columnas de interes
columnas0 = ['edad','edad_rango','cv','cd4_a']
data0 = pd.DataFrame(datos, columns = columnas0)

# Reemplazar datos nulos
for column in data0:
        data0[column] = data0[column].replace(np.nan, '')

data_cv = data0[(data0['cv'] != '') & (data0['edad'] != '')]
data_cv = data_cv[['edad','edad_rango','cv']].sort_values('edad_rango')
data_cv = data_cv[data_cv['edad_rango'].notna()]
data_cv = data_cv[data_cv['edad_rango']!= '']

data_cd4a = data0[(data0['cd4_a'] != '') & (data0['edad'] != '')]
data_cd4a = data_cd4a[['edad','edad_rango','cd4_a']].sort_values('edad_rango')
data_cd4a = data_cd4a[data_cd4a['edad_rango'].notna()]
data_cd4a = data_cd4a[data_cd4a['edad_rango']!= '']



In [None]:
data_cv.head()

In [None]:
data_cd4a.head()

#### Conteo de linfocitos con respecto a edad

<img src = "../datos/imagenes/conteo_linfocitos.png" width= "800"/>

In [None]:
# Crear marco de figura 
fig, ax = plt.subplots(figsize=(12, 6))

# Definir los rangos y colores de la cuadrícula
gradientes = [0, 200, 500, 1400] 
colors = ['#BCDEF9', '#76B0F8', '#2379F9']  

# Agregar gradiente a la cuadrícula 
for i in range(len(gradientes) - 1):
    ax.fill_betweenx(
        y = [gradientes[i], gradientes[i + 1]],
        x1 = -0.5,
        x2 = len(data_cd4a['edad_rango'].unique()) - 0.5,
        color = colors[i],
        alpha = 0.3
    )

# Propiedades de cuadrícula 
sns.set_style("whitegrid")
sns.set_context("notebook")
plt.rc("grid", color = "#7D7D7D", linestyle = "--", linewidth = 0.7)

# Dibujar gráfica 
sns.boxplot(data = data_cd4a, x = "edad_rango", y = "cd4_a", showmeans = True, meanprops = {"marker":"o", "markeredgecolor":"#A834F6", "markerfacecolor":"#A834F6"},
            fill = False, width = 0.7, dodge = False, ax = ax, color = "#A834F6")
sns.despine(top = True, right = True, left = True, bottom = True)

# Cambiar tipo de linea en los bigotes 
for line in ax.get_lines():
    xdata = line.get_xdata()  
    ydata = line.get_ydata()  

    if len(xdata) == 2 and abs(ydata[1] - ydata[0]) > 0:  
        line.set_linestyle('--') 
        line.set_color("#A834F6")
        line.set_linewidth(1)

# Editar leyendas de ejes 
ax.set_xlabel("Rango de edades", fontsize = 14, labelpad = 15, weight = "bold")
ax.set_ylabel("Conteo de células T CD4+", fontsize = 14, labelpad = 15, weight = "bold")

# Editar eje y 
ax.set_ylim(0, 1400)
cifras_especificas = [0, 200, 400, 600, 800, 1000, 1200, 1400 ]
plt.gca().set_yticks(cifras_especificas) 

plt.show()

#### Carga viral con respecto a edad

<img src = "../datos/imagenes/carga_viral.png" width= "800"/>

In [None]:

# Crear marco de figura 
fig, ax = plt.subplots(figsize=(12, 6))
sns.despine(top = True, right = True, left = True, bottom = True)

# Propiedades de cuadrícula
sns.set_style("whitegrid")
sns.set_context("notebook")
plt.rc("grid", color = "#7D7D7D", linestyle = "--", linewidth = 0.7)

# Dibujar gráfica 
sns.boxplot(data = data_cv, x = "edad_rango", y = "cv", showmeans = True, meanprops = {"marker":"o", "markeredgecolor":"#3221ED", "markerfacecolor":"#3221ED"},
            fill = False, width = 0.7, dodge = False, ax = ax, color = "#3221ED")

# Cambiar tipo de linea en los bigotes 
for line in ax.get_lines():
    xdata = line.get_xdata()  
    ydata = line.get_ydata()  

    if len(xdata) == 2 and abs(ydata[1] - ydata[0]) > 0:  
        line.set_linestyle('--') 
        line.set_color("#3221ED")
        line.set_linewidth(1)

#  Editar leyendas de ejes 
ax.set_xlabel("Rango de edades", fontsize = 14, labelpad = 15, weight = "bold")
ax.set_ylabel("Carga Viral", fontsize = 14, labelpad = 15, weight = "bold")

# Editar eje y 
ax.set_ylim(1.5, 7.5)
cifras_especificas = [2, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0]
plt.gca().set_yticks(cifras_especificas) 

plt.show()