Detección de la enfermedad de Parkinson: Proyecto de aprendizaje automático en Python
¿Qué es la enfermedad de Parkinson?
La enfermedad de Parkinson es un trastorno progresivo del sistema nervioso central que afecta el movimiento e induce temblores y rigidez. Tiene cinco etapas y afecta a más de un millón de personas cada año en la India. Es crónica y aún no tiene cura. Es un trastorno neurodegenerativo que afecta a las neuronas productoras de dopamina en el cerebro.

¿Qué es XGBoost?
XGBoost es un nuevo algoritmo de aprendizaje automático diseñado pensando en la velocidad y el rendimiento. XGBoost significa "eXtreme Gradient Boosting" y se basa en árboles de decisión. En este proyecto, importaremos el XGBClassifier de la biblioteca xgboost; esta es una implementación de la API de scikit-learn para la clasificación XGBoost.

Detección de la enfermedad de Parkinson con XGBoost – Objetivo
Construir un modelo para detectar con precisión la presencia de la enfermedad de Parkinson en un individuo.

Detección de la enfermedad de Parkinson con XGBoost: Acerca del proyecto de aprendizaje automático de Python
En este proyecto de aprendizaje automático en Python, utilizando las bibliotecas de Python scikit-learn, numpy, pandas y xgboost, crearemos un modelo con un clasificador XGB. Cargaremos los datos, obtendremos las características y las etiquetas, escalaremos las características, dividiremos el conjunto de datos, crearemos un clasificador XGB y calcularemos la precisión de nuestro modelo.

In [1]:
import numpy as np
import pandas as pd
import os, sys
from sklearn.preprocessing import MinMaxScaler
from xgboost import XGBClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

In [2]:
df = pd.read_csv("parkinsons.csv")
print(df.head())

             name  MDVP:Fo(Hz)  MDVP:Fhi(Hz)  MDVP:Flo(Hz)  MDVP:Jitter(%)  \
0  phon_R01_S01_1      119.992       157.302        74.997         0.00784   
1  phon_R01_S01_2      122.400       148.650       113.819         0.00968   
2  phon_R01_S01_3      116.682       131.111       111.555         0.01050   
3  phon_R01_S01_4      116.676       137.871       111.366         0.00997   
4  phon_R01_S01_5      116.014       141.781       110.655         0.01284   

   MDVP:Jitter(Abs)  MDVP:RAP  MDVP:PPQ  Jitter:DDP  MDVP:Shimmer  ...  \
0           0.00007   0.00370   0.00554     0.01109       0.04374  ...   
1           0.00008   0.00465   0.00696     0.01394       0.06134  ...   
2           0.00009   0.00544   0.00781     0.01633       0.05233  ...   
3           0.00009   0.00502   0.00698     0.01505       0.05492  ...   
4           0.00011   0.00655   0.00908     0.01966       0.06425  ...   

   Shimmer:DDA      NHR     HNR  status      RPDE       DFA   spread1  \
0      0.0654

In [3]:
features=df.loc[:,df.columns!='status'].values[:,1:]
labels=df.loc[:,'status'].values

#df.loc[:, df.columns != 'status'] toma todas las columnas excepto 'status'.

In [4]:
#DataFlair - Get the count of each label (0 and 1) in labels
print(labels[labels==1].shape[0], labels[labels==0].shape[0])

#Imprime cuántos 1 (Parkinson) y cuántos 0 (sanos) hay.

#Importante para entender si hay desbalance de clases.



147 48


In [5]:
#DataFlair - Scale the features to between -1 and 1
scaler=MinMaxScaler((-1,1))
x=scaler.fit_transform(features)
y=labels

In [6]:
#DataFlair - Split the dataset
x_train,x_test,y_train,y_test=train_test_split(x, y, test_size=0.2, random_state=7)

In [7]:
#DataFlair - Train the model
model=XGBClassifier()
model.fit(x_train,y_train)

In [8]:
# DataFlair - Calculate the accuracy
y_pred=model.predict(x_test)
print(accuracy_score(y_test, y_pred)*100)

94.87179487179486


La enfermedad de Parkinson es un trastorno cerebral que afecta el movimiento y el habla. La detección temprana es fundamental para el tratamiento. El aprendizaje automático puede ayudar a los médicos a detectar el Parkinson mediante las características de la voz. Python y el algoritmo XGBoost son excelentes herramientas para esta tarea. XGBoost es un modelo potente, conocido por su velocidad y precisión. Funciona bien con conjuntos de datos pequeños y limpios, como el utilizado para la detección del Parkinson.

En este proyecto de aprendizaje automático en Python, aprendimos a detectar la presencia de la enfermedad de Parkinson en individuos mediante diversos factores. Para ello, utilizamos un clasificador XGB y la biblioteca sklearn para preparar el conjunto de datos. Esto nos proporciona una precisión del 94,87 %, lo cual es excelente considerando la cantidad de líneas de código de este proyecto de Python