KNN_Algorithm

Hausarbeit über KNN

Der KNN-Algorithmus zählt zu den einfachsten Machine Learning Algorithmen, da er besonders durch die Bibilothek sklearn einfach zu implementieren ist. Um auf die Klassifizierung eines Datenpunktes zu schließen verwendet der KNN-Algorithmus die Annotation der nächsten Nachbarn. Folgende Parameter müssen beim Training bestimmt werden:

n_neighbors (Anzahl der betrachteten Nachbarn)
metric (Abstandsmaß)

Der Algorithmus zählt zu den Lazy-Learning Algorithmen, das bedeutet er speichert alle gelernte Insatzen und ruft sie bei der Klassifizierung erneut auf. Zu viele Trainingsdaten führen zu einem sehr rechenintensiven Prozess. Des weiter ist eine Vorbearbeitung der Daten nötig. Folgende Sachem müssen gemacht werden um Fehler zu vermeiden:

Categorical Encoding (alle Datentypen in Zahlen umwandeln)
Feature Scaling (gleiche Skalen für alle Daten, um eine stärkere Gewichtung einzelner Merkmale auszuschließen)
Merkmalsauswahl (zu viele Dimensionen können Fehler veursachen)

Im dem vorliegenden Skript werden mithilfe des k-nearest-neighbour Algorithmus Pilze klassifiziert. Es handelt sich um eine binäre Klassifizerung in "Giftig" und "Essbar".

Die für die Entscheidung berücksichtigten Features sind äußerliche Merkmale des Pilzes, wie z.B. Hutform, Hutoberfläche, Hutfarbe, Flecken, Geruch, Pilzlamellen, Stielform, etc...

Alle Daten liegen in Textform vor müssen daher für den Algorithmus in Zahlen formatiert werden. Dies erfolgt mithilfe des LabelEncoders.

Bei Fehlern bitte darauf achten, dass der Dateipfad für die einzulesende CSV-Datei richtig ist.

Datenauswahl:

Folgende beiden Features werden verwendet.

Geruch (odor):

Almond
Anise
Creoste
Fishy
Foul
Musty
None
Pugent
spicy

Kappenform (cap-shape):

bell
conical
convex
flat
knobbed
sunken

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
data		data
doku		doku
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

KNN_Algorithm

Hausarbeit über KNN

Datenauswahl:

Geruch (odor):

Kappenform (cap-shape):

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

BennerLukas/KNN_Algorithm

Folders and files

Latest commit

History

Repository files navigation

KNN_Algorithm

Hausarbeit über KNN

Datenauswahl:

Geruch (odor):

Kappenform (cap-shape):

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages