# P2 B - Regresión Logística
Hecho por:
- Jaime Benedi
- Miguel Sevilla

El hecho de si hay riesgo cardiovascular depende de diversos factores como por ejemplo la presión arterial y el colesterol.
1. Genera un dataset sintético que va a contener 800 instancias que representen personas. Cada persona va a tener los siguientes atributos:
    - Valores de presión arterial y colesterol. Ten en cuenta que el nivel normal de colesterol se considera por debajo de 180, aunque puede variar entre 120 y 250, y el nivel normal de presión arterial sistólica se encuentra entre 100 y 120, aunque puede variar entre 70 y 180.
    - Valores aleatorios de otro atributo que simule otros datos de la persona (pueden ser inventado).
2. Para cada instancia, calcula la probabilidad de tener problemas vasculares. Ten en cuenta las consideraciones sobre los valores de presión arterial y colesterol.
3. En base a un umbral, para cada instancia (teniendo en cuenta la probabilidad calculada en el punto 2), determina la clase de tener riesgo cardiovascular (1) o no (0).

## Librerías a usar

In [1]:
from sklearn.linear_model import LogisticRegression
import matplotlib.pyplot as plt
import numpy as np

## Generación de datos

Definiremos la generación de datos para las variables de presión arterial, colesterol e índice de grasa corporal (elegida por nosotros). El riesgo de enfermedad cardiovascular vendrá dado por la tenencia de mínimo un riesgo entre todas las variables. La generación de datos se hará por:

In [2]:
def genDataset(
    minPres : float,
    maxPres : float, 
    avgPres : float,
    funcPres,
    minCol : float,
    maxCol : float, 
    avgCol : float,
    funcCol,
    minOther : float,
    maxOther : float, 
    avgOther : float,
    funcOther,
    size: int
) -> tuple[np.ndarray, np.ndarray, np.ndarray, np.ndarray]:
    
    xPres = np.random.normal(avgPres, (maxPres - minPres)/avgPres, size)
    xCol = np.random.normal(avgCol, (maxCol - minCol)/avgCol, size)
    xOther = np.random.normal(avgOther, (maxOther - minOther)/avgOther, size)
    
    y = np.zeros(size, int)
    
    for i in range(size) :
        if (funcPres(xPres[i]) or funcCol(xCol[i]) or funcOther(xOther[i])) :
            y[i] = 1
            
    return xPres, xCol, xOther, y

Donde los criterios vienen dados por:

In [3]:
def arterial_pressure_risk(x) -> bool:
    if x < 100 or x > 120:
        return True
    else :
        return False
    
def colestherol_risk(x) -> bool:
    if x >= 180 :
        return True
    else: 
        return False
    
def fat_index_risk(x) -> bool:
    if x > 0.25 :
        return True
    else :
        return False

In [None]:
(miniP, maxiP, avgP) = (70, 180, 110)
(miniC, maxiC, avgC) = (120, 250, 180)
(miniF, maxiF, avgF) = (0.10, 0.5, 0.2)

## Regresión Logística

In [None]:
modelo = LogisticRegression()

In [None]:
xP, xC, xF, y = genDataset(miniP, maxiP, avgP, arterial_pressure_risk, miniC, maxiC, avgC, colestherol_risk, miniF, maxiF, avgF, fat_index_risk)