Skip to content

rstats-tln/2019-taltech

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Sissejuhatus andmeanalüüsi kasutades R keelt/Introduction to data analysis using R language

Eesmärgiks on, et kursusel osaleja oskaks hakata kasutada R keele tööriistu, selleks, et muuta oma toorandmed arusaamiseks ja teadmisteks. Kursusel õpetatakse kuidas andmeid importida, kuidas viia andmed sobiva kujuga tabelisse, tabelis olevaid andmeid summeerida, luua uusi muutujaid ja tulemusi visualiseerida kasutades tidyverse tööriistu.

The aim of the course is to learn how to start using R to turn raw data into insight and knowledge. You will learn how to import raw data to R, how to rearrange your data suitable for analysis, how to summarise and transform, how to visualise data using tidyverse R packages.

Tööriistad/Tools

Töö on kavandatud toimuma Rstudio pilves, kuid siiski on vajalik:

Programm/Syllabus

  1. Esmasp./Monday, 04. märts/March, 9-12

    • Sissejuhatus R-i, Rstudio töölaua sisseseadmine/tutvustus. ?help ehk kust otsida abi.

    • Mis on reprodutseeritavus (olen rääkinud sellest tavaliselt lõpus, kuid tegelikult tuleb see kohe üle rääkida) ja andmeanalüüsi töövoog, versioonikontroll (git+github).

    • Andmete visualiseerimine kasutades ggplot2: ggploti komponeerimine, lihtsamad diagrammid, andmete grupeerimine graafikutel kasutades värvi, suurust ja kuju.

    • iseseisev töö 1h

    • Introduction, setting up RStudio workspace. How to search for R ?help.

    • Reproducibility, data analysis workflow, version control (git+Github).

    • Data visualisation using ggplot2: components/layers of ggplot plot, scatterplots, aesthetics: color, size, shape.

    • homework 1h

  2. Reede/Friday, 08. märts/March, 9-12

    • Andmete visualiseerimine kasutades ggplot2: andmete esitamine pisijooniste abil, graafikutüüpide kombineerimine, statistiliste kokkuvõtete plottimine.

    • iseseisev töö 1h

    • Data visualisation using ggplot2: facetting, combining different types of geoms, plotting statistical summaries.

    • homework 1h

  3. Esmasp./Monday, 11. märts/March, 9-12

    • Andmete transformeerimine kasutades dplyr-i: "5 verbi".

    • iseseisev töö 1h

    • Data transformation using five verbs from dplyr package. filter + logical operators and missing values, arrange rows, select columns, create new variables with mutate.

    • homework 1h

  4. Reede/Friday, 15. märts/March, 9-12

    • Andmete transformeerimine kasutades dplyr-i: andmete muteerimine ja selleks kasutatavad funktsioonid.

    • %>% (pipe) operaatori kasutamine ja andmete transformeerimise "laused".

    • iseseisev töö 1h: kuupäevad ja kellaajad kasutades lubridate paketti

    • Data transformation using dplyr package: data mutating and useful mutating functions.

    • How to use %>% (pipe) operator to compose data transformation sentences.

    • homework 1h: dates and times with lubridate package.

  5. Esmasp./Monday, 18. märts/March, 9-12

    • Andmete grupeerimine ja summeerimine, andmete importimine tekstifailidest ja exceli failidest

    • iseseisev töö 1h

    • Data grouping and grouped summaries, data import from text and excel files.

    • homework 1h

  6. Reede/Friday, 22. märts/March, 9-12

    • Korrastatud andmed, andmetabelite formaatimine laiast pikaks ja vastupidi. Tabelite liitmine üle ridade ja tulpade ning muutuja-põhine liitmine kasutades join-e.

    • kodutöö 1h

    • Tidy data, formatting data frames from wide to long format. Binding data frames by rows and columns and data frame merging by join-s.

    • homework 1h

  7. Esmasp./Monday, 25. märts/March, 9-12

    • Itereerimine kasutades map funktsioone, list tulbad, lineaarne mudel ja mudeli fittimine.

    • Iterating with map function, list columns in data frame, linear model and fitting linear models. Broom package.

  8. Reede/Friday, 29. märts/March, 9-12

    • Grupitöö: andmeanalüüs kasutades ette antud andmeid.

    • Groupwork: data analysis using provided dataset.

Timing and location

Kellaajad on 9-12/classes will take place 9-12 on Monday and on Friday, room SCI-059.

nädal/Week esmaspäev/Monday reede/Friday
10 4. märts/March 8. märts
11 11. märts 15. märts
12 18. märts 22. märts
13 25. märts 29. märts

Õppejõud/Teacher: Taavi Päll, PhD, Tartu Ülikooli Bio- ja siirdemeditsiini instituut. Taavi on pikaajalise R kasutamise ja õpetamise (kursused Tartu Ülikoolis ja TTUs) kogemusega. Tema praegune teadusprojekt on seotud inimese soole viroomi analüüsimisega NGS andmete põhjal, arendab Pythonit ja R-i kasutades bioinformaatilisi töövoogusid.

Taavi Päll, PhD, Institute of Biological and Translational Medicine, University of Tartu, Estonia. Taavi is experienced R user and has several years of R stats teaching experience (at University of Tartu and TalTech). His current research project involves quantitative and qualitative analysis of gut virome using NGS data and workflows developed in Python and R.

Releases

No releases published

Packages

No packages published