# TB2 - Predicción de cáncer de mama con perceptrón multi-capa

###### Kcomt Martinez, Juan Felipe
###### López López, Iván Luigui
###### Sánchez Maita, Agustín Alejandro


## Dataset: Breast Cancer Prediction Dataset

https://www.kaggle.com/merishnasuwal/breast-cancer-prediction-dataset

El dataset utilizado contiene muestras de medidas bultos tomadas con el fin de saber si son cancerígenas. Además, tiene el resultado final (diagnóstico), el cual tiene el valor de 0 si el bulto es benigno y 1 si el bulto es maligno.

### Columnas:

1. Radio
2. Textura 
3. Perímetro 
4. Área
5. Suavidad
6. Diagnóstico

### Importación de dataset

In [None]:
import pandas as pd
import numpy as np
import pathlib

muestras_bultos = pd.read_csv(pathlib.Path().resolve() / 'data' / 'data_cancer_mama.csv')
print(muestras_bultos.head())
print(muestras_bultos['diagnostico'].unique())

In [None]:
muestras_bultos.shape

In [None]:
muestras_bultos.describe(include = 'all')

In [None]:
inputs = muestras_bultos.drop('diagnostico', axis=1)
print(inputs.head(2))

In [None]:
output = muestras_bultos['diagnostico']
print(output.head(2))

## División de dataset

Dividimos el dataset entre la sección que nos servirá para entrenar a la red neuronal y el que nos servirá para probar la red.


In [None]:
from sklearn.model_selection import train_test_split
inputs_train, inputs_test, output_train, output_test = train_test_split(inputs, output,test_size=0.3)
print(inputs_train.shape)
print(output_test.shape)

## Perceptrón Multi-capa

Generamos el perceptrón multi-capa utilizando la función core para MLP. La función de activación es relu, las iteraciones 500 y la cantidad de neuronas en la única capa oculta es 100.
<img src="https://i.imgur.com/z1Ik34F.png">

In [None]:
from sklearn.neural_network import MLPClassifier

In [None]:
mlp = MLPClassifier(max_iter=500, activation='relu', hidden_layer_sizes = (100,))
mlp

### Entrenamiento

In [None]:
mlp.fit(inputs_train,output_train)

### Prueba

Se realiza la predicción de cada una de las muestras de la sección de dataset que separamos para ello.

#### 0: No es cáncer
#### 1: Es cáncer

In [None]:
output_prediccion = mlp.predict(inputs_test)
output_prediccion

## Informe sobre los resultados

Para tener una medición más certera sobre nuestro modelo, se presenta un informe con la cantidad de resultados positivos y negativos y su precisión respecto a los valores hallados inicialmente.

In [None]:
from sklearn.metrics import classification_report,confusion_matrix

confusion_matrix(output_test,output_prediccion)

In [None]:
print(classification_report(output_test,output_prediccion))

## User Interface

In [None]:
radio = input("Ingrese el radio del tumor (Se recomienda un valor entre 10 y 20)")
#textura = input("Ingrese el radio del tumor (Se recomienda un valor entre 10 y 20)")
#perimetro = input("Ingrese el radio del tumor (Se recomienda un valor entre 10 y 20)")
#area = input("Ingrese el radio del tumor (Se recomienda un valor entre 10 y 20)")
#suavidad = input("Ingrese el radio del tumor (Se recomienda un valor entre 10 y 20)")