Követelmények

Bedás módja

A feladatokat notebook formájában kell beadni, amely nootbook minden blokkjának egymás után szekvenciálisa hiba nélkül kell futnia. A notebook-ok egyes részegységét pontosan definiálnia kell melyik rész mit csinál pontosan és mit akar megmutatni.A feladat megoldásának egy teljes működő pipline-t kell létrehoznia. Az egyes feladatoknál mindig kell lennie egy adatelőkészítési, modellezési és kiértékelési résznek. A feladatokat 1 vagy maximum 3-fő csapatokban lehet elvégezni. Azonban az elért eredményhez képest 2 személyes csapat esetén fél jegy még 3 személyes csapat esetén egy teljes jegy kerül levonásra.

Bekűldés módja

Az elkészült feladatokat az óraadó email címére kell megküldeni a megadott sablon alapján. Az emailben fel kell tüntetni ki vagy kik készítették a feladatokat Név, Neptunkód megadásával. A sablont nem kell csatolni az emailhez, hanem azt fel kell tölteni valamilyen dokumentum megosztó helyre és csak az letöltési linket kell az email-ben megadni.

Bekűldés határideje

2022.12.04. (vasárnap) 23:59:59 (éjfél)

Feladatok értékelési tábla

Feladat	Értékelés	Érdemjegy
Szöveg beágyazás	1. modellel	2
Szöveg beágyazás	3. modellel	3
Szentiment analízis	1. modellel	2
Szentiment analízis	3. modellel	3
Szöveg osztályozás	1. modellel	3
Szöveg osztályozás	3. modellel	4
Szöveg multi-osztályozás	1. modellel	3
Szöveg multi-osztályozás	3. modellel	4
Szöveg generálás	1. modellel	3
Szöveg generálás	3. modellel	4
Téma modellezés	1. modellel	2
Téma modellezés	3. modellel	4
Vegyes	3. modellel	4

Modellek értékesséig sorrendje

Modell	Pont
Transformer	10
CNN	9
Naivebayes	9
Logisztikus regresszio	6
LDA	8
PCA	6
TSNE	7
Neurális hálók	6
RNN	7
LSTM	8
GRU	8
K-Mean	7
Embedding	7
Stopwords	3
Stemming	3
Lemmatization	3
n-gramm	2
BPE	4
Wordlevel	2
Wordpiece	5
Sentencepiece	5
tf	2
tfidf	3
szó vektor	5

Leírás

A tárgy keretein belül a hallgatók megismerkednek a természetes nyelvű szövegfeldolgozás (NLP) alapjaival. Ezen felül gyakorlati tapasztalatra is szert tesznek különböző feladatok megoldása során. Főbb témakörök: logisztikus regresszió, naiv Bayes modell, PCA, n-gram modellek, Word2Vec, klasszikus és rekurrens neurális hálók. Továbbá a tárgy elvégzése során a hallgatók betekintést nyerhetnek az éppen aktuális, korszerű neurális architektúrákba. A félév során a hallgatóknak arra is lehetőségük adódik majd, hogy ezen architektúrákat felhő alapú szolgáltatások felhasználásával (Azure, Google Collab stb.) valós adatokon is kipróbálhassák, betaníthassák.

Kompetenciák

A tárgy sikeres teljesítésével a hallgatók képesek lesznek különböző NLP architektúrák implementálására valós környezetekben. Emellett szert tehetnek a deeplarning.ai Natural Language Processing Specialization első két kurzusának sikeres teljesítéséhez szükséges ismeretekre, valamint közelebb kerülhetnek a Microsoft „Exam AI-900: Microsoft Azure AI Fundamentals” certificate megszerzéséhez.

Ajánlott irodalom

Fogalomtár

Szöveg tisztítás

Stopwords
Stemming
Lemmatization

Tokenizáció

n-gramm
BPE
Wordlevel
Wordpiece
Sentencepiece

Vektorizáció

bag of word
tf
tfidf
szó vektorok
Skip-Gram
CBOW

Tanulási módszertan

Felügyelt
Fél-felügyelt
Nem felügyelt

Modellek

Naivebayes
Logistic regression
LDA
PCA
TSNE
Neurális hálók
RNN
LSTM
GRU
CNN
Transformer
K-Mean

Feladatok

Embedding
Szentiment analízis
Szöveg osztályozás
Szöveg generálás
Téma modellezés

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
.vscode		.vscode
Lectures		Lectures
Presentations		Presentations
sablon		sablon
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Követelmények

Bedás módja

Bekűldés módja

Bekűldés határideje

Feladatok értékelési tábla

Modellek értékesséig sorrendje

Leírás

Kompetenciák

Ajánlott irodalom

Fogalomtár

Szöveg tisztítás

Tokenizáció

Vektorizáció

Tanulási módszertan

Modellek

Feladatok

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Követelmények

Bedás módja

Bekűldés módja

Bekűldés határideje

Feladatok értékelési tábla

Modellek értékesséig sorrendje

Leírás

Kompetenciák

Ajánlott irodalom

Fogalomtár

Szöveg tisztítás

Tokenizáció

Vektorizáció

Tanulási módszertan

Modellek

Feladatok

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages