 # Table of Contents
<div class="toc" style="margin-top: 1em;"><ul class="toc-item" id="toc-level0"><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#Programování" data-toc-modified-id="Programování-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>Programování</a></span><ul class="toc-item"><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#Faktoriál" data-toc-modified-id="Faktoriál-1.1"><span class="toc-item-num">1.1&nbsp;&nbsp;</span>Faktoriál</a></span></li><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#Faktoriál-vektoru" data-toc-modified-id="Faktoriál-vektoru-1.2"><span class="toc-item-num">1.2&nbsp;&nbsp;</span>Faktoriál vektoru</a></span></li><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#Molekulové-statistiky" data-toc-modified-id="Molekulové-statistiky-1.3"><span class="toc-item-num">1.3&nbsp;&nbsp;</span>Molekulové statistiky</a></span><ul class="toc-item"><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#A" data-toc-modified-id="A-1.3.1"><span class="toc-item-num">1.3.1&nbsp;&nbsp;</span>A</a></span></li><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#B" data-toc-modified-id="B-1.3.2"><span class="toc-item-num">1.3.2&nbsp;&nbsp;</span>B</a></span></li></ul></li></ul></li><li><span><a href="http://localhost:8888/notebooks/ulohy_reseni.ipynb#Statistika" data-toc-modified-id="Statistika-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>Statistika</a></span></li></ul></div>

# Úlohy

Tento notebook obsahuje praktické úlohy na procvičení nejrůznějších znalostí ze statistiky a programování v jazyce R.

## Programování

### Faktoriál

Naprogramujte libovolným způsobem výpočet faktoriálu z přirozeného čísla:

$n! = \begin{cases}1&\text{pokud n = 0}\\n\cdot (n-1)!&\text{jinak}\end{cases}$

In [1]:
# rekurze
faktoriál <- function(n) {
    if (n < 0) {
        warning("n je menší než nula")
        return(NULL)
    }
    if (n == 0) {
        return(1)
    }
    
    n * faktoriál(n - 1)
}

In [2]:
# cyklus while
faktoriál <- function(n) {
    if (n < 0) {
        warning("n je menší než nula")
        return(NULL)
    }
    if (n == 0) {
        return(1)
    }
    
    ret <- n
    while (n != 1) {
        n <- (n - 1)
        ret <- ret * n
    }
    ret
}

In [3]:
# cyklus for
faktoriál <- function(n) {
    if (n < 0) {
        warning("n je menší než nula")
        return(NULL)
    }
    if (n == 0) {
        return(1)
    }
    
    ret <- n
    for (i in (n-1):1) {
        ret <- ret * i
    }
    ret
}

In [4]:
# pomocí Reduce
faktoriál <- function(n) {
    if (n < 0) {
        warning("n je menší než nula")
        return(NULL)
    }
    if (n == 0) {
        return(1)
    }
    
    Reduce(function(i, j) i*j, as.double(n:2))
}

In [5]:
# pomocí sapply (velice obskurní a nevhodný způsob použití této funkce)
faktoriál <- function(n) {
    if (n < 0) {
        warning("n je menší než nula")
        return(NULL)
    }
    if (n == 0) {
        return(1)
    }
    
    ret <- n
    sapply(n:2, function(n) {ret <<- ret * (n-1)})
    ret
}

In [6]:
# testovací kód
faktoriál(-1)
faktoriál(0)
faktoriál(3)
faktoriál(5)
faktoriál(15)
faktoriál(30)

# kontrola pomocí vestavěné funkce
factorial(-1)
factorial(0)
factorial(3)
factorial(5)
factorial(15)
factorial(30)

“n je menší než nula”

NULL

“NaNs produced”

### Faktoriál vektoru

Napiště funkci, která spočítá faktoriál pro každý prvek daného vektoru a výsledek vrátí opět jako vektor:

In [7]:
faktoriál_vectorized <- function(x) {
    unlist(lapply(x, faktoriál))
}

In [8]:
# testovací kód
faktoriál_vectorized(-1:10)

# kontrola pomocí vestavěné funkce
factorial(-1:10)

“n je menší než nula”

“NaNs produced”

### Molekulové statistiky

Vazby v molekule lze jednoduše popsat pomocí tzv. [matice sousednosti](https://cs.wikipedia.org/wiki/Matice_sousednosti)(adjecency matrix):

![mol_repr.jpg](mol_repr.jpg)

V této reprezentaci jsou tedy všechny páry atomů, které jsou spojené vazbou, v matici označeny číslem 1.

Načtěte si ze souboru `adj_mat.csv`, který se nachází v této složce, výše uvedenou matici sousednosti do vhodné datové struktury. Výsledek by měl vypadat nějak takto:

In [9]:
m_adj <- read.table("adj_mat.csv", sep = ',', header = T)
rownames(m_adj) <- m_adj$X
m_adj <- as.matrix(m_adj[,2:ncol(m_adj)])
colnames(m_adj) <- row.names(m_adj)
m_adj

Unnamed: 0,C.1,C.2,C.3,Cl.4,C.5,C.6
C.1,0,1,0,0,0,0
C.2,1,0,1,0,0,0
C.3,0,1,0,1,1,0
Cl.4,0,0,1,0,0,0
C.5,0,0,1,0,0,1
C.6,0,0,0,0,1,0


Vaším úkolem je napsat dvě funkce (viz níže). Mějte na paměti, že musí být dostatečně obecné na to, aby dokázaly zpracovat jakoukoliv molekulu. 

#### A

Napište funkci, která spočítá celkový počet vazeb v molekule (dvojná se počítá za jednu vazbu):

In [10]:
počet_vazeb <- function (m) {
    sum(m) / 2
}

In [11]:
počet_vazeb(m_adj)

#### B

Napište funkci, která spočítá počet výskytů jednotlivých prvků v molekule.

Nápověda:

```R
strsplit(colnames(m), split = "\\.")
```

In [12]:
počet_prvků <- function(m) {
    split_stuff <- unlist(strsplit(colnames(m), split = "\\."))
    elements <- split_stuff[seq(1,length(split_stuff), 2)]
    
    symbols <- unique(elements)
    occurences <- vector(mode(0), length(unique(elements)))    
    for (i in elements) {
        occurences[which(i == symbols)] <- occurences[which(i == symbols)] + 1
    }
    
    df <- as.data.frame(occurences)
    colnames(df) <- c("Počet")
    rownames(df) <- symbols
    df
}

In [13]:
počet_prvků <- function(m) {
    split_stuff <- unlist(strsplit(colnames(m), split = "\\."))
    elements <- split_stuff[seq(1,length(split_stuff), 2)]
    
    counts <- do.call(
        list
        , as.list(
            vector(mode(0), length(unique(elements)))
        )
    )
    names(counts) <- unique(elements)
    for (i in elements) {
        counts[[i]] <- counts[[i]] + 1
    }
    
    df <- t(as.data.frame(counts))
    colnames(df) <- c("Počet")
    df
}

In [14]:
počet_prvků <- function(m) {
    split_stuff <- unlist(strsplit(colnames(m), split = "\\."))
    element_factors <- as.factor(split_stuff[seq(1,length(split_stuff), 2)])
    
    df <- as.data.frame(table(element_factors))
    colnames(df) <- c("Atom", "Počet")
    df
}

In [15]:
počet_prvků <- function(m) {
    split_stuff <- unlist(strsplit(colnames(m), split = "\\."))
    element_factors <- as.factor(split_stuff[seq(1,length(split_stuff), 2)])
    
    df <- aggregate(as.vector(element_factors), list(element_factors), length)
    colnames(df) <- c("Atom", "Počet")
    df
}

In [16]:
počet_prvků(m_adj)

Atom,Počet
C,5
Cl,1


## Statistika

TODO