Switch branches/tags
Nothing to show
Find file History
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
..
Failed to load latest commit information.
README.md
WarsztatTextMining_WhyR2017.pdf
Warsztaty_TextMiningwR_NorbertRyciak.R

README.md

Text mining w R

Norbert Ryciak, Politechnika Warszawska, Wydział MiNI

Opis warsztatu

Celem warsztatu jest zapoznanie uczestników z podstawowymi technikami stosowanymi podczas analizy tekstu. Omówione zostanie m. in. zagadnienie modelowania tematycznego przy użyciu modelu LDA. Duży nacisk będzie położony na poznanie specyfiki pracy z danymi tekstowymi i zrozumienie motywacji prowadzących do określonych metod analizy. Wybrane zagadnienia zostaną zaprezentowane w zastosowaniu do grupowania lub klasyfikacji tekstów.

Plan warsztatu

  1. Wstępne przetwarzanie i redukcja wymiaru danych
  2. Podstawowe metody reprezentacji zbioru danych tekstowych
  3. Modelowanie tematyczne - model LDA (Latent Dirichlet Allocation)

Wymagane pakiety

tm, topicmodels, twitteR, graph, Rgraphviz, ggplot2, LDAvis

Wymagane od uczestników umiejętności i wiedza

  1. Podstawowa umiejętność programowania w R
  2. Wiedza czym jest klasyfikacja statystyczna i analiza skupień

Wymagania wstępne do wykonania przed warsztatem

brak

Język warsztatu

polski