GitHub - Tomas-Pompa/MastersThesis: Masters Thesis

Klasifikace funkcionálních dat

Tento dokument slouží jako podpůrný materiál pro diplomovou práci:

Metoda podpůrných vektorů pro funkcionální data,

jejíž oficiální zadání zní následovně.

Zadání: V mnoha aplikacích naměřená data reprezentují hodnoty nějaké funkce. Proto je výhodné, pokud to situace dovolí, pracovat s nimi ve funkcionální podobě, tj. jako s prvky nekonečně rozměrného prostoru. Práce bude volně navazovat na předchozí studentovu bakalářskou práci. Cílem práce je zobecnit úvahy metod strojového učení na situaci funkcionálních dat, dále popsat vlastnosti takových přístupů. Získané výsledky budou demonstrovány na simulovaných nebo reálných datech.

Support vector machines pro funkcionální data

Cílem dokumentu bude aplikovat poznatky o metodě podpůrných vektorů (SVM) pro mnohorozměrná data na data funkcionálního typu, tedy nekonečně-rozměrné objekty. K tomu využijeme zejména převod (redukci) objektů z nekonečné dimenze na objekty konečné dimenze a následným využitím známých postupů z konečných rozměrů. Ukážeme několik možných přístupů.

Dalším cílem bude porovnání jednotlivých metod pro klasifikaci funkcionálních dat na reálných a simulovaných datech. Zaměříme se primárně na simulovaná data a kromě porovnání metod mezi sebou na základě simulační studie se také podíváme na závislost úspěšnosti klasifikace uvažovaných metod na parametrech, které využíváme při generování (bude nás zajímat rozptyl kolem generujících křivek a také rozptyl vertikálního posunutí). Dále nás také bude zajímat závislost chabovosti klasifikačních metod na diskretizaci intervalu, což je jedna z možností, jak aplikovat konečně-rozměrné metody na funkcionální data.

Mezi uvažované klasifikační metody patří:

$K$ nejbližších sousedů (KNN),
logistická regrese (jak obyčejná (LR) tak její funkcionální modifikace (LR_fda)),
lineární (LDA) a kvadratická (QDA) diskriminační analýza,
rozhodovací stromy (DT),
náhodné lesy (RF) a
Support Vector Machines: zde budeme uvažovat mnoho variant, všechny z nich jsou přitom postaveny na principu filtrace (redukce dimenze).

Postupně jednotlivé metody projdeme, nejprve na simulovaných datech, a následně budeme konstruovat metodu podpůrných vektorů pro funkcionální data.

Základním balíčkem v R pro práci s funkcionálními objekty je fda. Dalšími užitečnými balíčky budou MASS, e1071, fda.usc, refund a další.

V aplikační části dokumentu se podíváme na tři datové soubory -- growth, phoneme a tecator. Poslední kapitola pak obsahuje zdrojový kód k obrázkům které jsou součástí diplomové práce. Výsledky jsou prezentovány jak graficky, tak číselně, podrobné komentáře lze najít právě v diplomové práci.

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
03-Application_1_files/figure-html		03-Application_1_files/figure-html
03-Simulace_3_files/figure-html		03-Simulace_3_files/figure-html
04-Application_2_files/figure-html		04-Application_2_files/figure-html
04-Simulace_4_files/figure-html		04-Simulace_4_files/figure-html
05-Application_1_files/figure-html		05-Application_1_files/figure-html
06-Application_2_files/figure-html		06-Application_2_files/figure-html
08-Simulace_4_files/figure-html		08-Simulace_4_files/figure-html
09-Application_1_files/figure-html		09-Application_1_files/figure-html
10-Application_2_files/figure-html		10-Application_2_files/figure-html
11-Application_3_files/figure-html		11-Application_3_files/figure-html
12-Application_4_files/figure-html		12-Application_4_files/figure-html
13-Application_5_files/figure-html		13-Application_5_files/figure-html
RData		RData
docs		docs
figures		figures
.gitattributes		.gitattributes
.gitignore		.gitignore
01-Simulace_1.Rmd		01-Simulace_1.Rmd
02-Simulace_2.Rmd		02-Simulace_2.Rmd
03-Simulace_2_sigma.Rmd		03-Simulace_2_sigma.Rmd
04-Simulace_2_shift.Rmd		04-Simulace_2_shift.Rmd
05-Simulace_3.Rmd		05-Simulace_3.Rmd
06-Simulace_3_sigma.Rmd		06-Simulace_3_sigma.Rmd
07-Simulace_3_shift.Rmd		07-Simulace_3_shift.Rmd
08-Simulace_3_discretisation.Rmd		08-Simulace_3_discretisation.Rmd
09-Simulace_4.Rmd		09-Simulace_4.Rmd
10-Application_1.Rmd		10-Application_1.Rmd
11-Application_2.Rmd		11-Application_2.Rmd
12-Application_3.Rmd		12-Application_3.Rmd
13-Application_4.Rmd		13-Application_4.Rmd
14-Application_5-tikzDictionary		14-Application_5-tikzDictionary
14-Application_5.Rmd		14-Application_5.Rmd
LICENSE		LICENSE
README.md		README.md
_bookdown.yml		_bookdown.yml
_output.yml		_output.yml
book.js		book.js
bookdownproj.Rmd		bookdownproj.Rmd
bookdownproj.rds		bookdownproj.rds
header.html		header.html
index.Rmd		index.Rmd
phoneme.txt		phoneme.txt
sci-lg-eng-rgb.png		sci-lg-eng-rgb.png
style.css		style.css

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Klasifikace funkcionálních dat

Support vector machines pro funkcionální data

About

Releases

Packages

Languages

License

Tomas-Pompa/MastersThesis

Folders and files

Latest commit

History

Repository files navigation

Klasifikace funkcionálních dat

Support vector machines pro funkcionální data

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages