### **PREDICCIÓN CÁNCER DE MAMA**

### **Preparación de Datos**

In [None]:
from sklearn.datasets import load_breast_cancer

data = load_breast_cancer()

# Separa los datos en features (X) y target/objetivo (y)
# X contiene las características de los tumores
# y contiene las clasificaciones (0 para maligno, 1 para benigno)
X = data.data
y = data.target

### **Entrenamiento con SVM**

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

In [None]:
from sklearn import svm
from sklearn.metrics import accuracy_score

# Define diferentes tipos de kernel (formas de clasificar los datos)
kernels = ["linear","rbf","sigmoid"]
# Define diferentes valores de gamma (qué tan flexible es el modelo)
gammas = [0.1,0.01,0.001,0.0001]

# Prueba cada combinación para ver cuál funciona mejor
for k in kernels:
    for g in gammas:
        modelo = svm.SVC(kernel=k,gamma=g)
        modelo.fit(X_train, y_train) # Entrenamiento
        pred = modelo.predict(X_test) # Predicciones
        pred = accuracy_score(y_test, pred) # Score de los resultados
        print(f"Kernel: {k}, Gamma: {g}, Accuracy: {pred}")

Kernel: linear, Gamma: 0.1, Accuracy: 0.9473684210526315
Kernel: linear, Gamma: 0.01, Accuracy: 0.9473684210526315
Kernel: linear, Gamma: 0.001, Accuracy: 0.9473684210526315
Kernel: linear, Gamma: 0.0001, Accuracy: 0.9473684210526315
Kernel: rbf, Gamma: 0.1, Accuracy: 0.5789473684210527
Kernel: rbf, Gamma: 0.01, Accuracy: 0.5789473684210527
Kernel: rbf, Gamma: 0.001, Accuracy: 0.9298245614035088
Kernel: rbf, Gamma: 0.0001, Accuracy: 0.9298245614035088
Kernel: sigmoid, Gamma: 0.1, Accuracy: 0.5789473684210527
Kernel: sigmoid, Gamma: 0.01, Accuracy: 0.5789473684210527
Kernel: sigmoid, Gamma: 0.001, Accuracy: 0.5789473684210527
Kernel: sigmoid, Gamma: 0.0001, Accuracy: 0.5789473684210527


In [None]:
# Modelo final de acuerdo a los score
modelo = svm.SVC(kernel='linear')
modelo.fit(X_train, y_train)
pred = modelo.predict(X_test)
predicciones = accuracy_score(y_test, pred)

predicciones

0.9473684210526315

In [None]:
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test, pred)

array([[42,  6],
       [ 0, 66]])

Esta matriz 2x2 se interpreta así:

[42, 6]: Primera fila

42: Verdaderos Negativos (predijo correctamente 42 casos malignos)
6: Falsos Positivos (predijo benigno cuando eran malignos en 6 casos)


[0, 66]: Segunda fila

0: Falsos Negativos (no hubo casos donde predijo maligno cuando era benigno)
66: Verdaderos Positivos (predijo correctamente 66 casos benignos)



En resumen:

El modelo acertó en 108 casos (42 + 66)
Se equivocó en 6 casos
Lo más importante: cuando el modelo predice que un tumor es benigno, tiene muy alta confiabilidad (0 falsos negativos), lo cual es crucial en diagnósticos médicos.

In [None]:
from sklearn.metrics import precision_score
precision_score(y_test, pred)

0.9166666666666666