**ESTUDI ESTADISTIC PATCHES_THRESHOLDS**

In [25]:
import pandas as pd


csv_path = "patches_thresholds.csv"  # Asegúrate de que el nombre del archivo sea correcto
data = pd.read_csv(csv_path)

# Convertir la columna 'threshold' en una lista
data_list = data['threshold'].tolist()

# Imprimir la lista resultante
print(data_list)

[95.0, 104.0, 104.0, 50.0, 104.0]


In [26]:
import numpy as np
from scipy.stats import norm

def estudio_estadistico(valores, nivel_confianza=0.95):
    """
    Realiza un estudio estadístico básico de una lista de valores.

    :param valores: Lista de valores numéricos.
    :param nivel_confianza: Nivel de confianza para el intervalo (por defecto 0.95).
    :return: Diccionario con las métricas calculadas.
    """
    if not valores:
        return "La lista está vacía. Proporcione valores válidos."

    # Convertir a un array de numpy para facilidad de cálculo
    valores_np = np.array(valores)

    # Cálculos básicos
    media = np.mean(valores_np)
    std_dev = np.std(valores_np, ddof=1)  # ddof=1 para muestra
    n = len(valores_np)

    # Calcular el intervalo de confianza
    z = norm.ppf(1 - (1 - nivel_confianza) / 2)  # Valor crítico z
    margen_error = z * (std_dev / np.sqrt(n))
    intervalo_confianza = (media - margen_error, media + margen_error)

    # Cálculos estadísticos
    estadisticas = {
        'media': media,
        'mediana': np.median(valores_np),
        'desviacion_estandar': std_dev,
        'varianza': np.var(valores_np, ddof=1),
        'rango': np.ptp(valores_np),
        'minimo': np.min(valores_np),
        'maximo': np.max(valores_np),
        'percentil_25': np.percentile(valores_np, 25),
        'percentil_50': np.percentile(valores_np, 50),
        'percentil_75': np.percentile(valores_np, 75),
        'intervalo_confianza': intervalo_confianza
    }

    return estadisticas

resultado = estudio_estadistico(data_list)

# Mostrar el resultado
for clave, valor in resultado.items():
    if clave == 'intervalo_confianza':
        print(f"{clave.capitalize()}: {valor[0]:.2f} a {valor[1]:.2f}")
    else:
        print(f"{clave.capitalize()}: {valor}")


Media: 91.4
Mediana: 104.0
Desviacion_estandar: 23.469128658729534
Varianza: 550.8
Rango: 54.0
Minimo: 50.0
Maximo: 104.0
Percentil_25: 95.0
Percentil_50: 104.0
Percentil_75: 104.0
Intervalo_confianza: 70.83 a 111.97


**ESTUDI ESTADISTIC PATIENT_THRESHOLDS**

In [27]:
import pandas as pd


csv_path = "patient_thresholds.csv"  # Asegúrate de que el nombre del archivo sea correcto
data = pd.read_csv(csv_path)

# Convertir la columna 'threshold' en una lista
data_list = data['threshold'].tolist()

# Imprimir la lista resultante
print(data_list)

[0.0845665961945031, 0.0972515856236786, 0.0972515856236786, 0.1775898520084566, 0.0739957716701902]


In [28]:
import numpy as np
from scipy.stats import norm

def estudio_estadistico(valores, nivel_confianza=0.95):
    """
    Realiza un estudio estadístico básico de una lista de valores.

    :param valores: Lista de valores numéricos.
    :param nivel_confianza: Nivel de confianza para el intervalo (por defecto 0.95).
    :return: Diccionario con las métricas calculadas.
    """
    if not valores:
        return "La lista está vacía. Proporcione valores válidos."

    # Convertir a un array de numpy para facilidad de cálculo
    valores_np = np.array(valores)

    # Cálculos básicos
    media = np.mean(valores_np)
    std_dev = np.std(valores_np, ddof=1)  # ddof=1 para muestra
    n = len(valores_np)

    # Calcular el intervalo de confianza
    z = norm.ppf(1 - (1 - nivel_confianza) / 2)  # Valor crítico z
    margen_error = z * (std_dev / np.sqrt(n))
    intervalo_confianza = (media - margen_error, media + margen_error)

    # Cálculos estadísticos
    estadisticas = {
        'media': media,
        'mediana': np.median(valores_np),
        'desviacion_estandar': std_dev,
        'varianza': np.var(valores_np, ddof=1),
        'rango': np.ptp(valores_np),
        'minimo': np.min(valores_np),
        'maximo': np.max(valores_np),
        'percentil_25': np.percentile(valores_np, 25),
        'percentil_50': np.percentile(valores_np, 50),
        'percentil_75': np.percentile(valores_np, 75),
        'intervalo_confianza': intervalo_confianza
    }

    return estadisticas

resultado = estudio_estadistico(data_list)

# Mostrar el resultado
for clave, valor in resultado.items():
    if clave == 'intervalo_confianza':
        print(f"{clave.capitalize()}: {valor[0]:.2f} a {valor[1]:.2f}")
    else:
        print(f"{clave.capitalize()}: {valor}")


Media: 0.10613107822410142
Mediana: 0.0972515856236786
Desviacion_estandar: 0.041114936279180496
Varianza: 0.0016904379852410727
Rango: 0.10359408033826639
Minimo: 0.0739957716701902
Maximo: 0.1775898520084566
Percentil_25: 0.0845665961945031
Percentil_50: 0.0972515856236786
Percentil_75: 0.0972515856236786
Intervalo_confianza: 0.07 a 0.14


**ESTUDI ESTADISTIC METRICS_TH1**

In [35]:
import pandas as pd

csv_path = "metrics_th1.csv"  # Asegúrate de que el nombre del archivo sea correcto
data = pd.read_csv(csv_path)
data = data.drop(columns=['fold'])

In [37]:
import pandas as pd
import numpy as np
from scipy.stats import norm
from tabulate import tabulate

def calcular_estadisticas(data, nivel_confianza=0.95):
    """
    Calcula estadísticas básicas para todas las columnas numéricas de un DataFrame.

    :param data: DataFrame con columnas numéricas.
    :param nivel_confianza: Nivel de confianza para el intervalo (por defecto 0.95).
    :return: DataFrame con las estadísticas por columna.
    """
    resultados = {}
    columnas_numericas = data.select_dtypes(include=[np.number]).columns

    for columna in columnas_numericas:
        valores = data[columna].dropna()  # Excluir valores NaN
        media = np.mean(valores)
        mediana = np.median(valores)
        std_dev = np.std(valores, ddof=1)
        varianza = np.var(valores, ddof=1)
        rango = np.ptp(valores)
        minimo = np.min(valores)
        maximo = np.max(valores)
        percentil_25 = np.percentile(valores, 25)
        percentil_75 = np.percentile(valores, 75)

        # Intervalo de confianza
        n = len(valores)
        z = norm.ppf(1 - (1 - nivel_confianza) / 2)
        margen_error = z * (std_dev / np.sqrt(n))
        intervalo_confianza = (media - margen_error, media + margen_error)

        # Guardar resultados
        resultados[columna] = {
            'Media': media,
            'Mediana': mediana,
            'Desviación Estándar': std_dev,
            'Varianza': varianza,
            'Rango': rango,
            'Mínimo': minimo,
            'Máximo': maximo,
            'Percentil 25': percentil_25,
            'Percentil 75': percentil_75,
            'IC 95%': intervalo_confianza,

        }

    return pd.DataFrame(resultados)

# Calcular estadísticas para las columnas del archivo
estadisticas = calcular_estadisticas(data)

# Mostrar las estadísticas en formato tabla por pantalla
print(tabulate(estadisticas, headers="keys", tablefmt="grid"))


+---------------------+------------------------------------------+------------------------------------------+-----------------------------------------+------------------------------------------+-----------------------------------------+-----------------------------------------+-------------------------------------------+----------------------------------------+
|                     | accuracy                                 | precision                                | recall                                  | f1_score                                 | tp                                      | tn                                      | fp                                        | fn                                     |
| Media               | 0.802253380898596                        | 0.8054933790077985                       | 0.7829248816485659                      | 0.7798867448873521                       | 174.6                                   | 209.4                              

**ESTUDI ESTADISTIC METRICS_TH1_TRAIN**

In [38]:
import pandas as pd

csv_path = "metrics_th1_train.csv"  # Asegúrate de que el nombre del archivo sea correcto
data = pd.read_csv(csv_path)
data = data.drop(columns=['fold'])

In [39]:
import pandas as pd
import numpy as np
from scipy.stats import norm
from tabulate import tabulate

def calcular_estadisticas(data, nivel_confianza=0.95):
    """
    Calcula estadísticas básicas para todas las columnas numéricas de un DataFrame.

    :param data: DataFrame con columnas numéricas.
    :param nivel_confianza: Nivel de confianza para el intervalo (por defecto 0.95).
    :return: DataFrame con las estadísticas por columna.
    """
    resultados = {}
    columnas_numericas = data.select_dtypes(include=[np.number]).columns

    for columna in columnas_numericas:
        valores = data[columna].dropna()  # Excluir valores NaN
        media = np.mean(valores)
        mediana = np.median(valores)
        std_dev = np.std(valores, ddof=1)
        varianza = np.var(valores, ddof=1)
        rango = np.ptp(valores)
        minimo = np.min(valores)
        maximo = np.max(valores)
        percentil_25 = np.percentile(valores, 25)
        percentil_75 = np.percentile(valores, 75)

        # Intervalo de confianza
        n = len(valores)
        z = norm.ppf(1 - (1 - nivel_confianza) / 2)
        margen_error = z * (std_dev / np.sqrt(n))
        intervalo_confianza = (media - margen_error, media + margen_error)

        # Guardar resultados
        resultados[columna] = {
            'Media': media,
            'Mediana': mediana,
            'Desviación Estándar': std_dev,
            'Varianza': varianza,
            'Rango': rango,
            'Mínimo': minimo,
            'Máximo': maximo,
            'Percentil 25': percentil_25,
            'Percentil 75': percentil_75,
            'IC 95%': intervalo_confianza,

        }

    return pd.DataFrame(resultados)

# Calcular estadísticas para las columnas del archivo
estadisticas = calcular_estadisticas(data)

# Mostrar las estadísticas en formato tabla por pantalla
print(tabulate(estadisticas, headers="keys", tablefmt="grid"))

+---------------------+------------------------------------------+-----------------------------------------+------------------------------------------+------------------------------------------+----------------------------------------+----------------------------------------+------------------------------------------+----------------------------------------+
|                     | accuracy                                 | precision                               | recall                                   | f1_score                                 | tp                                     | tn                                     | fp                                       | fn                                     |
| Media               | 0.8212452743049262                       | 0.8353058929979345                      | 0.8519680670774173                       | 0.8434514255955105                       | 1055.6                                 | 730.4                                  | 2

**ESTUDI ESTADISTIC METRICS_TH2**

In [42]:
import pandas as pd

csv_path = "metrics_th2.csv"  # Asegúrate de que el nombre del archivo sea correcto
data = pd.read_csv(csv_path)
data = data.drop(columns=['fold'])

In [43]:
import pandas as pd
import numpy as np
from scipy.stats import norm
from tabulate import tabulate

def calcular_estadisticas(data, nivel_confianza=0.95):
    """
    Calcula estadísticas básicas para todas las columnas numéricas de un DataFrame.

    :param data: DataFrame con columnas numéricas.
    :param nivel_confianza: Nivel de confianza para el intervalo (por defecto 0.95).
    :return: DataFrame con las estadísticas por columna.
    """
    resultados = {}
    columnas_numericas = data.select_dtypes(include=[np.number]).columns

    for columna in columnas_numericas:
        valores = data[columna].dropna()  # Excluir valores NaN
        media = np.mean(valores)
        mediana = np.median(valores)
        std_dev = np.std(valores, ddof=1)
        varianza = np.var(valores, ddof=1)
        rango = np.ptp(valores)
        minimo = np.min(valores)
        maximo = np.max(valores)
        percentil_25 = np.percentile(valores, 25)
        percentil_75 = np.percentile(valores, 75)

        # Intervalo de confianza
        n = len(valores)
        z = norm.ppf(1 - (1 - nivel_confianza) / 2)
        margen_error = z * (std_dev / np.sqrt(n))
        intervalo_confianza = (media - margen_error, media + margen_error)

        # Guardar resultados
        resultados[columna] = {
            'Media': media,
            'Mediana': mediana,
            'Desviación Estándar': std_dev,
            'Varianza': varianza,
            'Rango': rango,
            'Mínimo': minimo,
            'Máximo': maximo,
            'Percentil 25': percentil_25,
            'Percentil 75': percentil_75,
            'IC 95%': intervalo_confianza,

        }

    return pd.DataFrame(resultados)

# Calcular estadísticas para las columnas del archivo
estadisticas = calcular_estadisticas(data)

# Mostrar las estadísticas en formato tabla por pantalla
print(tabulate(estadisticas, headers="keys", tablefmt="grid"))

+---------------------+-------------------------------------------+-------------------------------------------+-------------------------------------------+-------------------------------------------+----------------------------------------+-----------------------------------------+------------------------------------------+----------------------------------------+
|                     | accuracy                                  | precision                                 | recall                                    | f1_score                                  | tp                                     | tn                                      | fp                                       | fn                                     |
| Media               | 0.5225806451612904                        | 0.4502564102564103                        | 0.48250000000000004                       | 0.46477252299283656                       | 6.8                                    | 9.4                      

**ESTUDI ESTADISTIC METRICS_TH2_TRAIN**

In [44]:
import pandas as pd

csv_path = "metrics_th2_train.csv"  # Asegúrate de que el nombre del archivo sea correcto
data = pd.read_csv(csv_path)
data = data.drop(columns=['fold'])

In [45]:
import pandas as pd
import numpy as np
from scipy.stats import norm
from tabulate import tabulate

def calcular_estadisticas(data, nivel_confianza=0.95):
    """
    Calcula estadísticas básicas para todas las columnas numéricas de un DataFrame.

    :param data: DataFrame con columnas numéricas.
    :param nivel_confianza: Nivel de confianza para el intervalo (por defecto 0.95).
    :return: DataFrame con las estadísticas por columna.
    """
    resultados = {}
    columnas_numericas = data.select_dtypes(include=[np.number]).columns

    for columna in columnas_numericas:
        valores = data[columna].dropna()  # Excluir valores NaN
        media = np.mean(valores)
        mediana = np.median(valores)
        std_dev = np.std(valores, ddof=1)
        varianza = np.var(valores, ddof=1)
        rango = np.ptp(valores)
        minimo = np.min(valores)
        maximo = np.max(valores)
        percentil_25 = np.percentile(valores, 25)
        percentil_75 = np.percentile(valores, 75)

        # Intervalo de confianza
        n = len(valores)
        z = norm.ppf(1 - (1 - nivel_confianza) / 2)
        margen_error = z * (std_dev / np.sqrt(n))
        intervalo_confianza = (media - margen_error, media + margen_error)

        # Guardar resultados
        resultados[columna] = {
            'Media': media,
            'Mediana': mediana,
            'Desviación Estándar': std_dev,
            'Varianza': varianza,
            'Rango': rango,
            'Mínimo': minimo,
            'Máximo': maximo,
            'Percentil 25': percentil_25,
            'Percentil 75': percentil_75,
            'IC 95%': intervalo_confianza,

        }

    return pd.DataFrame(resultados)

# Calcular estadísticas para las columnas del archivo
estadisticas = calcular_estadisticas(data)

# Mostrar las estadísticas en formato tabla por pantalla
print(tabulate(estadisticas, headers="keys", tablefmt="grid"))

+---------------------+-------------------------------------------+------------------------------------------+------------------------------------------+------------------------------------------+-----------------------------------------+------------------------------------------+-----------------------------------------+-----------------------------------------+
|                     | accuracy                                  | precision                                | recall                                   | f1_score                                 | tp                                      | tn                                       | fp                                      | fn                                      |
| Media               | 0.4991869918699187                        | 0.518887379609378                        | 0.5707611073669979                       | 0.5435544024077167                       | 36.8                                    | 24.6                         