#  PREDICCION DE DIABETES MEDIANTE UNA RED NEURONAL

## Introduccion

En la siguiente libreta hablaremos sobre la gravedad de la enfermedad de la diabetes, dando una breve explicacion sobre lo que es, sus sintomas y sus consecuencias. Despues, seguimos con una explicacion acerca de nuestra tarea de ciencia de datos, la prediccion, establecemos como es que funciona y la tecnica con la que la llevamos a cabo, una red nueronal.

## Diabetes

### Definicion: 
La diabetes es una enfermedad crónica e irreversible del metabolismo en la que se produce un exceso de glucosa o azúcar en la sangre y en la orina; es debida a una disminución de la secreción de la hormona insulina o a una deficiencia de su acción. 

### Causas:
Las causas de la diabetes son importantes ya que son estas las que definen nuestra probabilidad de padecerla. Uno puede desarrollar diabetes por las siguientes causas:

1.-Sobrepeso, obesidad e inactividad física.
2.-Resistencia a la insulina.
3.-Genes y antecedentes familiares.
4.-Mutaciones genéticas.
5.-Enfermedades hormonales.
6.-Lesiones o extracción del páncreas.
7.-Medicinas.

Estos son las causas más importantes que se tienen en cuanto a el desarrollo de la diabetes.

### Sintomas:
Los síntomas de la diabetes incluyen:

-aumento de la sed y de las ganas de orinar
-aumento del apetito
-fatiga
-visión borrosa
-entumecimiento u hormigueo en las manos o los pies
-úlceras que no cicatrizan
-pérdida de peso sin razón aparente

### Consecuencias:
Algunas de las consecuencias de la diabetes son:

-Ceguera (retinopatía diabética).
-Amputación de extremidades inferiores.
-Insuficiencia renal.
-Mayor riesgo de infarto al miocardio.
-Mayor riesgo de accidentes cerebrovasculares.
-Alta carga emocional al ser enfermedad crónica y dependiente.


## Prediccion de datos

### Definicion:
El análisis predictivo es el proceso de utilizar el análisis de datos para realizar predicciones basadas en los datos. En este proceso se hace uso de los datos junto con técnicas analíticas, estadísticas y de aprendizaje automático a fin de crear un modelo predictivo para predecir eventos futuros.

### Modelo Predictivo:
Los datos agregados cuentan una historia compleja. Para extraer el conocimiento que albergan, se necesita un modelo predictivo preciso.

El modelado predictivo utiliza métodos matemáticos y de cálculo para predecir un evento o un resultado. Estos modelos pronostican un resultado en algún estado o tiempo futuros en función de los cambios en las entradas del modelo. Mediante un proceso iterativo, se desarrolla el modelo mediante un conjunto de datos de entrenamiento y después se prueba y se valida para determinar su precisión con el fin de realizar predicciones.

![Imagen](https://www.bing.com/images/blob?bcid=TgmnrM4FfBUC5Q)

1.-Importar datos de varias fuentes, tales como archivos web, bases de datos y hojas de cálculo.

2.-Limpiar los datos mediante la eliminación de los valores atípicos y la combinación de las fuentes de datos.

3.-Es necesario identificar los picos de datos, los datos ausentes o los puntos anómalos que se deben eliminar de los datos.

4.-Desarrollar un modelo predictivo preciso basado en los datos agregados mediante estadísticas, herramientas de ajuste de curvas o aprendizaje automático.

5.-Realice varias iteraciones con el conjunto de datos de entrenamiento para probar diversos enfoques. Una vez finalizado el entrenamiento, puede probar el modelo con datos nuevos para ver cómo se comporta.

6.-Integrar el modelo en un sistema de predicción de la carga en un entorno de producción, en este caso, la produccion es el desarrollo de personas con diabetes.


## Red Neuronal

### Definicion: 
Las redes neuronales artificiales son un modelo inspirado en el funcionamiento del cerebro humano. Esta formado por un conjunto de nodos conocidos como neuronas artificiales que están conectadas y transmiten señales entre sí. Estas señales se transmiten desde la entrada hasta generar una salida.

### Funcionamiento:
Las redes reciben una serie de valores de entrada y cada una de estas entradas llega a un nodo llamado neurona. Las neuronas de la red están a su vez agrupadas en capas que forman la red neuronal. Cada una de las neuronas de la red posee a su vez un peso, un valor numérico, con el que modifica la entrada recibida. Los nuevos valores obtenidos salen de las neuronas y continúan su camino por la red.

![Imagen](https://www.bing.com/images/blob?bcid=TowwjLtT2BUChQ)



## Prediccion de diabetes

Luego de haber establecido todo lo anterior, pasamos a explicar como es que todo esto se relaciona.
Para la prediccion de la diabetes usamos la tecnica de la red neuronal que sería crepetir un circuito, la red neuronal, varias veces para ver como es que los datos resultan en una respuesta. La respuesta que se obtenga más veces de las iteraciones es la que tiene más probabilidad que pase y en base a ello podemos predecir.

Los datos entran por algúnas neuronas, estos son pasados a un numero reducido de neuronas y asi sucesivamente hasta llegar a la neuronal final, quien es la que da el resultado de salida. Se itera este proceso cierto número de veces hasta que termina de ejecutarse el código.

Obviamente los datos son tomados en cuenta como aumento a las probabilidades de que algo pase, y así con estas probabilidades se decide los probables destinos y se realiza la prediccion en base a la aleatoriedad.

A continuacion presentamos el código de la red neuronal para la prediccion de diabetes.

## Código:
El código esta realizado en lenguaje Python y cuenta con comentarios para su mejor comprension.

In [1]:
from keras.models import Sequential
from keras.layers import Dense, Dropout
from sklearn.model_selection import train_test_split
import tkinter as tk
import numpy as np


def train_the_model():
    # seed aleatoria para reproducibilidad
    np.random.seed(7)
    
    # carga dataset de casos de diabetes en la india, últimos 5 años de historia clínica
    dataset = np.loadtxt("prima-indians-diabetes.csv", delimiter=",")
    
    # split into input (X) and output (Y) variables, splitting csv data
    X = dataset[:,0:8]
    Y = dataset[:,8]
    # Se dividen los datos de entrenamiento(80%) y campos de test(20%)
    x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=42)
    
    # Se crea modelo,  se agregan layers densos para cada funcion de activacion
    model = Sequential()
    model.add(Dense(15, input_dim=8, activation='relu')) # input layer requiere input_dim param
    model.add(Dense(10, activation='relu'))
    model.add(Dense(8, activation='relu'))
    model.add(Dropout(.2))
    model.add(Dense(1, activation='sigmoid')) # sigmoid en lugar de relu para la probabilidad final entre 0 y 1
    
    # Compila el modelo, se usa el optimizer adam
    model.compile(loss="binary_crossentropy", optimizer="adam", metrics=['accuracy'])

    # Se llama la funcion fit, para testear el modelo
    model.fit(x_train, y_train, epochs = 1000, batch_size=20, validation_data=(x_test, y_test))
    
    print('\n# Evaluate on test data')
    results = model.evaluate(x_test, y_test, batch_size=128)
    print('test loss, test acc:', results)    
    return model

def test_with_numpy(model, test):
    predictions = model.predict(test)
    print('predictions shape:', predictions)    
    return

def button_click(inputs, model, root):
    predictions = model.predict(inputs)
    print('predictions shape:', predictions)
    #print('exactitud = ', model.accuracy())
    value = predictions[0][0]
    percentaje = value * 100
    texto = 'Tu probabilidad es de: ' + str(round(percentaje, 2)) + '%'
    print(texto)
    label_result = tk.Label(root, text=texto, font = ('bold', 20),anchor='w')
    label_result.place(x=20, y=440)
    return

def create_form(model):
    root = tk.Tk()
    root.geometry('600x500')
    root.title('Formulario para predcir la diabetes')
    
    label_title = tk.Label(root, text="Ingresa los siguientes datos: ", font = ('bold', 20),anchor='w')
    label_title.place(x=20, y=10)
    
    #num Embarazos
    label_0 = tk.Label(root, text="Numero de embarazos: ", anchor='w')
    label_0.place(x=20, y=80)
    entry_0 = tk.Entry(root)
    entry_0.place(x=250, y=80)
    #Concentracion de glucosa 0 - 200
    label_1 = tk.Label(root, text="Concentración de glucosa: ", anchor='w')
    label_1.place(x=20, y=120)
    entry_1 = tk.Entry(root)
    entry_1.place(x=250, y=120)
    #Presion sanguinea 0 - 100
    label_2 = tk.Label(root, text="Presión sanguínea diastólica: ", anchor='w')
    label_2.place(x=20, y=160)
    entry_2 = tk.Entry(root)
    entry_2.place(x=250, y=160)
    #Grosura de la piel 0 - 50
    label_3 = tk.Label(root, text="Grosura del pliegue cutáneo en triceps: ", anchor='w')
    label_3.place(x=20, y=200)
    entry_3 = tk.Entry(root)
    entry_3.place(x=250, y=200)
    #Insulina en la sangre 20 - 120
    label_4 = tk.Label(root, text="Suero de insulina en la sangre: ", anchor='w')
    label_4.place(x=20, y=240)
    entry_4 = tk.Entry(root)
    entry_4.place(x=250, y=240)
    #IMC 0.0 - 50.0
    label_5 = tk.Label(root, text="-Indice de masa corporal (IMC): ", anchor='w')
    label_5.place(x=20, y=280)
    entry_5 = tk.Entry(root)
    entry_5.place(x=250, y=280)
    #Funcion de pedrigree 0- 60
    label_6 = tk.Label(root, text="-Función de pedigree de diabetes: ", anchor='w')
    label_6.place(x=20, y=320)
    entry_6 = tk.Entry(root)
    entry_6.place(x=250, y=320)
    #Edad
    label_7 = tk.Label(root, text="Edad: ", anchor='w')
    label_7.place(x=20, y=360)
    entry_7 = tk.Entry(root)
    entry_7.place(x=250, y=360)
    #Button
    button = tk.Button(root, text='Calcular', bg='brown', fg='white', command= lambda: button_click( 
        np.array([[
            float(entry_0.get()),
            float(entry_1.get()),
            float(entry_2.get()),
            float(entry_3.get()),
            float(entry_4.get()),
            float(entry_5.get()),
            float(entry_6.get()),
            float(entry_7.get())
        ]]),
        model,
        root
    ))
    button.place(x=250, y=400)
    root.mainloop()
    
    return root

#prueba = np.array([[0,137,84,27,0,27.3,0.231,59]])
model = train_the_model()
form = create_form(model)


#test_with_numpy(model, prueba)


ModuleNotFoundError: No module named 'keras'