# TB2 - Detector de cáncer de mama

## Perceptrón multi-capa

<img src="https://i.imgur.com/2bhP1YP.png">

###### Kcomt Martinez, Juan Felipe
###### López López, Iván Luigui
###### Sánchez Maita, Agustín Alejandro




## Dataset: Breast Cancer Prediction Dataset

https://www.kaggle.com/merishnasuwal/breast-cancer-prediction-dataset

El dataset utilizado contiene muestras de medidas bultos tomadas con el fin de saber si son cancerígenas. Además, tiene el resultado final (diagnóstico), el cual tiene el valor de 0 si el bulto es benigno y 1 si el bulto es maligno.

### Columnas:

1. Radio
2. Textura 
3. Perímetro 
4. Área
5. Suavidad
6. Diagnóstico

### Importación de dataset

In [127]:
import pandas as pd
import numpy as np
import pathlib

muestras_bultos = pd.read_csv(pathlib.Path().resolve() / 'data' / 'data_cancer_mama.csv')
print(muestras_bultos.head())
print(muestras_bultos['diagnostico'].unique())

   radio  textura  perimetro    area  suavidad  diagnostico
0  17.99    10.38     122.80  1001.0   0.11840            0
1  20.57    17.77     132.90  1326.0   0.08474            0
2  19.69    21.25     130.00  1203.0   0.10960            0
3  11.42    20.38      77.58   386.1   0.14250            0
4  20.29    14.34     135.10  1297.0   0.10030            0
[0 1]


In [128]:
muestras_bultos.shape

(569, 6)

In [129]:
muestras_bultos.describe(include = 'all')

Unnamed: 0,radio,textura,perimetro,area,suavidad,diagnostico
count,569.0,569.0,569.0,569.0,569.0,569.0
mean,14.127292,19.289649,91.969033,654.889104,0.09636,0.627417
std,3.524049,4.301036,24.298981,351.914129,0.014064,0.483918
min,6.981,9.71,43.79,143.5,0.05263,0.0
25%,11.7,16.17,75.17,420.3,0.08637,0.0
50%,13.37,18.84,86.24,551.1,0.09587,1.0
75%,15.78,21.8,104.1,782.7,0.1053,1.0
max,28.11,39.28,188.5,2501.0,0.1634,1.0


In [130]:
inputs = muestras_bultos.drop('diagnostico', axis=1)
print(inputs.head(2))

   radio  textura  perimetro    area  suavidad
0  17.99    10.38      122.8  1001.0   0.11840
1  20.57    17.77      132.9  1326.0   0.08474


In [131]:
output = muestras_bultos['diagnostico']
print(output.head(2))

0    0
1    0
Name: diagnostico, dtype: int64


## División de dataset

Dividimos el dataset entre la sección que nos servirá para entrenar a la red neuronal y el que nos servirá para probar la red.


In [132]:
from sklearn.model_selection import train_test_split
inputs_train, inputs_test, output_train, output_test = train_test_split(inputs, output,test_size=0.3)
print(inputs_train.shape)
print(output_test.shape)

(398, 5)
(171,)


## Perceptrón Multi-capa

Generamos el perceptrón multi-capa utilizando la función core para MLP. La función de activación es relu, las iteraciones 500 y la cantidad de neuronas en la única capa oculta es 100.
<img src="https://i.imgur.com/z1Ik34F.png">

In [133]:
from sklearn.neural_network import MLPClassifier

In [134]:
mlp = MLPClassifier(max_iter=500, activation='relu', hidden_layer_sizes = (100,))
mlp

MLPClassifier(max_iter=500)

### Función de predicción

In [135]:
def prediccion():
    radio = input("Ingrese el radio del bulto:  ")
    textura = input("Ingrese la textura del bulto:  ")
    perimetro = input("Ingrese el perímetro del bulto:  ")
    area = input("Ingrese el área del bulto:  ")
    suavidad = input("Ingrese la suavidad del bulto:  ")    
    print(" ")
    cols = ["radio", "textura", "perimetro", "area", "suavidad"]
    df = pd.DataFrame(columns = cols)
    df.loc[1] = [radio, textura, perimetro, area, suavidad]
    prediccion = mlp.predict(df)
    if(prediccion == 0):
        print("El bulto no es cancerígeno")
    else:
        print("El bulto es cancerígeno")

### Entrenamiento

In [136]:
mlp.fit(inputs_train,output_train)

MLPClassifier(max_iter=500)

### Prueba

Se realiza la predicción de cada una de las muestras de la sección de dataset que separamos para ello.

#### 0: No es cáncer
#### 1: Es cáncer

In [137]:
output_prediccion = mlp.predict(inputs_test)
output_prediccion

array([0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 0,
       1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1,
       0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1,
       1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0,
       1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1,
       1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1,
       1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0,
       0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1], dtype=int64)

## Informe sobre los resultados

Para tener una medición más certera sobre nuestro modelo, se presenta un informe con la cantidad de resultados positivos y negativos y su precisión respecto a los valores hallados inicialmente.

In [138]:
from sklearn.metrics import classification_report,confusion_matrix

confusion_matrix(output_test,output_prediccion)

array([[53, 13],
       [ 9, 96]], dtype=int64)

In [139]:
print(classification_report(output_test,output_prediccion))

              precision    recall  f1-score   support

           0       0.85      0.80      0.83        66
           1       0.88      0.91      0.90       105

    accuracy                           0.87       171
   macro avg       0.87      0.86      0.86       171
weighted avg       0.87      0.87      0.87       171



## User Interface

<img src="https://cdn2.salud180.com/sites/default/files/styles/medium/public/field/image/2020/09/que-es-el-cancer-de-mama.jpg">

### Por favor, ingrese las medidas del bulto para poder predecir si es maligno o benigno:

In [140]:
prediccion()

Ingrese el radio del bulto:  15
Ingrese la textura del bulto:  20
Ingrese el perímetro del bulto:  30
Ingrese el área del bulto:  100
Ingrese la suavidad del bulto:  0.1
 
El bulto es cancerígeno


<img src="https://i.imgur.com/gc575F5.png">