Eesmärgiks on, et kursusel osaleja oskaks hakata kasutada R keele tööriistu, selleks, et muuta oma toorandmed arusaamiseks ja teadmisteks. Kursusel õpetatakse kuidas andmeid importida, kuidas viia andmed sobiva kujuga tabelisse, tabelis olevaid andmeid summeerida, luua uusi muutujaid ja tulemusi visualiseerida kasutades tidyverse
tööriistu.
The aim of the course is to learn how to start using R to turn raw data into insight and knowledge. You will learn how to import raw data to R, how to rearrange your data suitable for analysis, how to summarise and transform, how to visualise data using tidyverse
R packages.
Töö on kavandatud toimuma Rstudio pilves, kuid siiski on vajalik:
-
internetiühendusega sülearvuti olemasolu, kuhu on installeeritud
- R 3.5.2 (viimane versioon) https://cran.r-project.org,
- RStudio 1.1.463 (desktop viimane versioon) https://www.rstudio.com/products/rstudio/download/,
- git https://git-scm.com/book/en/v2/Getting-Started-Installing-Git.
-
Github konto https://github.com (jäta salasõna meelde!).
-
Rstudio cloud konto https://login.rstudio.cloud/, (logi sisse Githubi kontoga!).
-
Work is planned to be carried out in RStudio cloud, but you still need to have following software available in your computer:
- R 3.5.2 (last version) https://cran.r-project.org,
- RStudio 1.1.463 (desktop last version) https://www.rstudio.com/products/rstudio/download/,
- git https://git-scm.com/book/en/v2/Getting-Started-Installing-Git.
-
Github account https://github.com (remember your password!).
-
Rstudio cloud account https://login.rstudio.cloud/, (login with your Github account!).
-
Esmasp./Monday, 04. märts/March, 9-12
-
Sissejuhatus R-i, Rstudio töölaua sisseseadmine/tutvustus.
?help
ehk kust otsida abi. -
Mis on reprodutseeritavus (olen rääkinud sellest tavaliselt lõpus, kuid tegelikult tuleb see kohe üle rääkida) ja andmeanalüüsi töövoog, versioonikontroll (git+github).
-
Andmete visualiseerimine kasutades ggplot2: ggploti komponeerimine, lihtsamad diagrammid, andmete grupeerimine graafikutel kasutades värvi, suurust ja kuju.
-
iseseisev töö 1h
-
Introduction, setting up RStudio workspace. How to search for R
?help
. -
Reproducibility, data analysis workflow, version control (git+Github).
-
Data visualisation using ggplot2: components/layers of ggplot plot, scatterplots, aesthetics: color, size, shape.
-
homework 1h
-
-
Reede/Friday, 08. märts/March, 9-12
-
Andmete visualiseerimine kasutades ggplot2: andmete esitamine pisijooniste abil, graafikutüüpide kombineerimine, statistiliste kokkuvõtete plottimine.
-
iseseisev töö 1h
-
Data visualisation using ggplot2: facetting, combining different types of geoms, plotting statistical summaries.
-
homework 1h
-
-
Esmasp./Monday, 11. märts/March, 9-12
-
Andmete transformeerimine kasutades dplyr-i: "5 verbi".
-
iseseisev töö 1h
-
Data transformation using five verbs from dplyr package. filter + logical operators and missing values, arrange rows, select columns, create new variables with mutate.
-
homework 1h
-
-
Reede/Friday, 15. märts/March, 9-12
-
Andmete transformeerimine kasutades dplyr-i: andmete muteerimine ja selleks kasutatavad funktsioonid.
-
%>%
(pipe) operaatori kasutamine ja andmete transformeerimise "laused". -
iseseisev töö 1h: kuupäevad ja kellaajad kasutades lubridate paketti
-
Data transformation using dplyr package: data mutating and useful mutating functions.
-
How to use
%>%
(pipe) operator to compose data transformation sentences. -
homework 1h: dates and times with lubridate package.
-
-
Esmasp./Monday, 18. märts/March, 9-12
-
Andmete grupeerimine ja summeerimine, andmete importimine tekstifailidest ja exceli failidest
-
iseseisev töö 1h
-
Data grouping and grouped summaries, data import from text and excel files.
-
homework 1h
-
-
Reede/Friday, 22. märts/March, 9-12
-
Korrastatud andmed, andmetabelite formaatimine laiast pikaks ja vastupidi. Tabelite liitmine üle ridade ja tulpade ning muutuja-põhine liitmine kasutades join-e.
-
kodutöö 1h
-
Tidy data, formatting data frames from wide to long format. Binding data frames by rows and columns and data frame merging by join-s.
-
homework 1h
-
-
Esmasp./Monday, 25. märts/March, 9-12
-
Itereerimine kasutades map funktsioone, list tulbad, lineaarne mudel ja mudeli fittimine.
-
Iterating with map function, list columns in data frame, linear model and fitting linear models. Broom package.
-
-
Reede/Friday, 29. märts/March, 9-12
-
Grupitöö: andmeanalüüs kasutades ette antud andmeid.
-
Groupwork: data analysis using provided dataset.
-
Kellaajad on 9-12/classes will take place 9-12 on Monday and on Friday, room SCI-059.
nädal/Week | esmaspäev/Monday | reede/Friday |
---|---|---|
10 | 4. märts/March | 8. märts |
11 | 11. märts | 15. märts |
12 | 18. märts | 22. märts |
13 | 25. märts | 29. märts |
Õppejõud/Teacher: Taavi Päll, PhD, Tartu Ülikooli Bio- ja siirdemeditsiini instituut. Taavi on pikaajalise R kasutamise ja õpetamise (kursused Tartu Ülikoolis ja TTUs) kogemusega. Tema praegune teadusprojekt on seotud inimese soole viroomi analüüsimisega NGS andmete põhjal, arendab Pythonit ja R-i kasutades bioinformaatilisi töövoogusid.
Taavi Päll, PhD, Institute of Biological and Translational Medicine, University of Tartu, Estonia. Taavi is experienced R user and has several years of R stats teaching experience (at University of Tartu and TalTech). His current research project involves quantitative and qualitative analysis of gut virome using NGS data and workflows developed in Python and R.