# Parkinson’s Disease Detection from Speech Data

### Annika van Rooijen
### s0592559

# 1. Problemstellung

### Was ist Parkinson?
Der Morbus Parkinson ist eine chronisch fortschreitende, neurodegenerative Erkrankung, die unter anderem zu steifen Muskeln, verlangsamten Bewegungen und unkontrollierbarem Zittern führt [1]. 

### Was sind Ursachen für die Erkrankung?
Das primäre Parkinson-Syndrom geht von einer bestimmten Hirnregion aus, der sogenannten schwarzen Substanz (Substantia nigra) im Mittelhirn. Hier befinden sich spezielle Nervenzellen, die den Nervenbotenstoff Dopamin produzieren und mit ihm mit anderen Nervenzellen kommunizieren. Dopamin ist unter anderem wichtig für die Bewegungssteuerung. Durch die Parkinson-Erkrankung sterben immer mehr dieser Nervenzellen ab, es entwickeln sich ein Dopaminmangel und ein Ungleichgewicht der Nervenbotenstoffe im Gehirn [1]. 

Die Ursache für den Zelltod bei der Parkinson-Krankheit ist noch nicht eindeutig nachgewiesen. der primäre Parkinson macht etwa 75 Prozent aller Parkinson-Syndrome aus. Von diesem „klassischen“ Parkinson unterscheidet man die sehr seltenen genetischen Formen von Parkinson, das „Sekundäre Parkinson-Syndrom“, das z.B. durch Medikamente, Vergiftungen oder bestimmte Erkrankungen ausgelöst werden kann, und das „Atypische Parkinson-Syndrom“ als Folge verschiedenartiger anderer neurodegenerativer Erkrankungen [1]. 

### Was sind die Symptome der Parkinson Erkrankung? 
Zu den typischen Symptomen gehören das Zittern, weitere Bewegungsstörungen wie Steifheit der Muskeln, verlangsamte Bewegungen und Gleichgewichtsstörungen. Zusätzliche Symptome können das „Einfrieren“ von Bewegungen, Schwierigkeiten beim Sprechen und Schlucken, Störungen der vegetativen Funktionen (z. B. Blutdruck und Verdauung), Schlafstörungen, Depressionen und geistige Beeinträchtigungen bis hin zur Demenz sein [1].

Sprach- und Stimmveränderungen treten häufig auf und können bereits Jahre vor den klassischen motorischen Symptomen beobachtet werden. Diese frühen Veränderungen bieten ein Potenzial für eine frühere Erkennung und Überwachung der Krankheit, was wichtig wäre, da Diagnosen derzeit meist erst erfolgen, nachdem erheblicher neuronaler Verlust stattgefunden hat. Dies sind für Ärzt:innen schwer nur durchs hören erkennbar [2]. 

Zu den Veränderungen zählen eine verminderte Lautstärke (Hypophonie), eine monotone Sprechweise mit reduzierter Tonhöhen- und Lautstärkenvariation, eine verlangsamte oder unregelmäßige Sprechgeschwindigkeit sowie eine unpräzise Artikulation, bei der insbesondere Konsonanten weniger deutlich gebildet werden. Zusätzlich zeigen sich veränderte Pausenmuster, eine eingeschränkte Prosodie ((Prosodie = Betonung, Rhythmus, Melodie der Sprache)) mit flacher Betonung und reduziertem emotionalem Ausdruck sowie eine verminderte Stimmstabilität mit Schwankungen in Tonhöhe und Stimmqualität. Bei komplexeren Sprachaufgaben können außerdem Wortfindungsprobleme und eine reduzierte sprachliche Vielfalt auftreten. Diese Veränderungen sind oft so subtil, dass sie klinisch allein durch Zuhören schwer erkennbar sind und erst durch objektive, akustische und digitale Analyseverfahren zuverlässig erfasst werden können [2].

### Zielstellung
Die manuelle Analyse von Sprachaufnahmen ist häufig zeitaufwendig und mit einer begrenzten Zuverlässigkeit verbunden. Vor diesem Hintergrund stellt sich die Frage, ob künstliche Intelligenz in der Lage ist, Sprach- und Frequenzdaten automatisiert auszuwerten, um Hinweise auf eine neurodegenerative Erkrankung wie Parkinson zu erkennen. Ziel ist die Entwicklung eines KI-Modells, das anhand von Sprachaufnahmen und akustischen Merkmalen eine Parkinson-Erkrankung frühzeitig identifizieren kann.

## 2. Datenbeschaffung

Es gibt zahlreiche öffentlich verfügbare Datensätze zur Analyse von Parkinson anhand von Sprach- und Stimmmerkmalen. Die folgende Tabelle gibt einen Überblick über relevante Datensätze:

| Datensatzname | Datentyp | Inhalt | Größe / Umfang | Quelle |
|---------------|----------|--------|----------------|--------|
| UCI Parkinsons Dataset | Tabellarische Features | Frequenzmerkmale (Jitter, Shimmer, HNR, F0…) aus Sprachaufnahmen | 31 Personen, 195 Aufnahmen | https://archive.ics.uci.edu/dataset/174/parkinsons |
| UCI Parkinson Speech with Multiple Types of Audio | Tabellarische Features | Sustained Vowel, Wörter, Zahlen, Sätze | 40 Personen, mehrere hundert Audios | https://archive.ics.uci.edu/dataset/301/parkinson+speech+dataset |
| Figshare Parkinson Voice Samples | Audio (.wav) | Sustained Vowel /a/, Parkinson vs. Healthy | 100+ Aufnahmen | https://figshare.com/articles/dataset/23849127 |
| SJTU Parkinson Speech Dataset | Audio (.wav) | Verschiedene Sprachproben (Original-Speech) | > 150 Dateien | https://github.com/SJTU-YONGFU-RESEARCH-GRP/Parkinson-Patient-Speech-Dataset |
| Italian Parkinson’s Voice & Speech | Audio | Italienische Sprecher, Wörter, Vokale, Sätze | > 800 Aufnahmen, 65 Sprecher | https://ieee-dataport.org/open-access/italian-parkinsons-voice-and-speech |
| Mendeley Parkinson Acoustic Features | Tabellarische Features | Akustische Merkmale (MFCC, Jitter, Shimmer…) | ca. 200+ Einträge | https://data.mendeley.com/datasets/fjd6fcfkwn |
| NeuroVoz Parkinsonian Speech Corpus | Audio | Monologe, Vokale, Wörter, Wiederholungen, längere Sprache | 108 Sprecher |https://zenodo.org/records/10777657 (nicht öffentlich zugänglich)|
| PC-GITA Corpus | Audio | Spanische Sprecher, mehrere Sprachaufgaben, Parkinson vs. Healthy | 235 Sprecher | https://perception.csl.illinois.edu/PC-GITA.html (nicht öffentlich verfügbar)|
| MDVR-KCL Parkinson Voice Dataset | Audio | Sustained vowel phonation „a“, klinisch diagnostiziert | 40 Sprecher, 400+ Samples | https://www.kaggle.com/datasets/nutansingh/mdvr-kcl-dataset |
| mPower Parkinson Dataset | Audio + Sensorik | Smartphone-Sprachaufnahmen, longitudinal, Real-World-Daten | Tausende Teilnehmende | https://www.synapse.org/#!Synapse:syn4993293 |
| Parkinson Telemonitoring Dataset | Zeitreihen / Features | Sprachbasierte UPDRS-Messungen | 42 Personen, 5.875 Messungen | https://archive.ics.uci.edu/dataset/189/parkinsons+telemonitoring |
| German Parkinson Speech Corpus (nicht offen) | Audio | Deutsche Sprache, klinische Studien | Variabel | Nur über Forschungskooperation |
| RBD / Prodromal PD Speech Datasets | Audio | Sprachdaten von Hochrisikogruppen (prodromales Parkinson) | Forschungsdaten | Nicht öffentlich |



Für dieses Projekt wurden bewusst zwei unterschiedliche, sich ergänzende Datensätze ausgewählt. Der **UCI Parkinsons Datensatz** [5] dient als Einstieg und Benchmark, da er bereits extrahierte akustische Frequenzmerkmale enthält und eine schnelle, methodisch saubere Evaluation klassischer Machine-Learning-Modelle ermöglicht. Aufbauend auf diesen Ergebnissen wird der **Figshare-Datensatz mit Roh-Audioaufnahmen** [4] verwendet, um realistische Sprachsignale zu analysieren und moderne, audio-basierte Ansätze umzusetzen. Die Analyse der Audiodaten erfolgt mithilfe von **Parselmouth** [3], einer Python-Schnittstelle zu Praat, wodurch eine präzise und reproduzierbare Extraktion phonetischer und akustischer Merkmale aus den Sprachaufnahmen möglich ist. Dieser zweistufige Ansatz erlaubt einen strukturierten Übergang von tabellarischen Features zu echten Sprachsignalen und erhöht die methodische Nachvollziehbarkeit des Projekts.


# 3. EDA

# 4. Featrure Engineering

# 5. Modelltraining

# 6. Modellevaluierung

# 7. Bonus

# 8. Fazit


# 9. Quellen
**[1]** Deutsche Gesellschaft für Parkinson und Bewegungsstörungen e. V. (o. J.). *Die Parkinson-Krankheit*. Abgerufen am *29. Dezember 2025*, von https://parkinson-gesellschaft.de/fuer-betroffene/die-parkinson-krankheit/

**[2]** Cao, F., Vogel, A. P., Gharahkhani, P., & Renteria, M. E. (2025). *Speech and language biomarkers for Parkinson’s disease prediction, early diagnosis and progression.* *npj Parkinson’s Disease, 11*(57). https://doi.org/10.1038/s41531-025-00913-4

**[3]** Jadoul, Y., Thompson, B., & de Boer, B. (2018). *Introducing Parselmouth: A Python interface to Praat*. *Journal of Phonetics, 71*, 1–15. [https://doi.org/10.1016/j.wocn.2018.07.001](https://doi.org/10.1016/j.wocn.2018.07.001) 

**[4]** Sakar, C. O., Serbes, G., & Gunduz, A. (2023). *Voice samples for patients with Parkinson’s disease and healthy controls* [Data set]. Figshare. [https://doi.org/10.6084/m9.figshare.23849127](https://doi.org/10.6084/m9.figshare.23849127)

**[5]** Little, M. A., McSharry, P. E., Roberts, S. J., Costello, D. A. E., & Moroz, I. M. (2007). *Parkinsons* [Data set]. UCI Machine Learning Repository. [https://doi.org/10.24432/C56C7T](https://doi.org/10.24432/C56C7T)

