## Знакомство с работой вычислительного блокнота Jupyter<br>в среде статистического программирования R
"Вычислительный блокнот", далее просто "блокнот", представляет собой файл со специальной структурой, разделенный на  блоки - "ячейки (cells)" и запускаемый под управлением интерактивного сервиса [**Jupyter**](https://jupyter.org/)<br>
Каждая ячейка может содержать фрагмент программого кода (Code) или размеченный текст (Markdown), содержащий пояснения, коментарии и прочую полезную информацию. 
Текстовые ячейки могут быть с разнообразмыми элементами <b>форматирования текста</b>, а также **содержать** [_гиперссылки_](https://jupyter.org/) и изображения, 
добавленные посредством тегов языка разметки HTML. <br>

#### [R - язык статистической обработки данных](https://ru.wikipedia.org/wiki/R_(%D1%8F%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F))
<div align="center" style="margin:25px">
<img src = "https://upload.wikimedia.org/wikipedia/commons/thumb/1/1b/R_logo.svg/1200px-R_logo.svg.png" width = 200>
</div>  

Чтобы увидеть "исходник" данного текста, нужно щелкнуть дважды мышью по этой ячейке, чтобы привести его в первоначальный вид - <br>нажать кнопку **run** в меню окна файла или **Ctrl+Enter** с клавиатуры<br>
Эти же действия с ячейкой кода приведут к его выполнению и вы сразу увидите результат<br>
например:


In [None]:
2+2

В среде R есть учебный набор данных [**"Ирисы Фишера"**](https://ru.wikipedia.org/wiki/%D0%98%D1%80%D0%B8%D1%81%D1%8B_%D0%A4%D0%B8%D1%88%D0%B5%D1%80%D0%B0). <br> В нем содержатся промеры цветков трех видов: 
**Ирис щетинистый** (_Iris setosa_), **Ирис виргинский** (_Iris virginica_) и **Ирис разноцветный** (_Iris versicolor_)
<div align="center">    
<img src = "https://upload.wikimedia.org/wikipedia/commons/thumb/a/a7/Irissetosa1.jpg/220px-Irissetosa1.jpg" width = 250 style="margin:15px">
<img src = "https://upload.wikimedia.org/wikipedia/commons/thumb/9/9f/Iris_virginica.jpg/220px-Iris_virginica.jpg" width = 231 style="margin:15px">
<img src = "https://upload.wikimedia.org/wikipedia/commons/thumb/4/41/Iris_versicolor_3.jpg/220px-Iris_versicolor_3.jpg" width = 250 style="margin:15px">
</div>

Было взято по 50 экземпляров каждого вида, измерялись **длина (length)** и **ширина (width)** длинных лепестков (_**Sepal**_) и коротких (_**Petal**_) - всего 4 параметра:

1. _**Sepal length**_ (длина наружной доли околоцветника)
2. ***Sepal width*** (ширина наружной доли околоцветника)
3. _**Petal length**_ (длина внутренней доли околоцветника)
4. ***Petal width*** (ширина внутренней доли околоцветника)

посмотрим, что собой представляют данные, для этого просто наберем название набора

In [None]:
iris

мы увидели таблицу (dataframe), состоящий из 5 колонок (полей) и 150 строк (записей).<br>
Теперь посмотрим подробности, выполнив следующие команды, которые покажут:<br>
размерность данных,<br>
заголовки полей<br> и 
значения описательной статистики по каждому из полей (мин., макс, значения, средняя, медиана, ...)

In [None]:
dim(iris)
names(iris)
summary(iris)

данные можно сохранить в файл
(сработает только в том случае, если вы рапускаете блокнот в своём рабочем пространстве)

In [None]:
write.csv(iris, "iris_test.csv")

И загрузить данные из файла <br>
если посмотреть заголовки полей, то можно увитеть, что при сохранении в файл было добавлено еще одно поле "X", которое содержит номер строки


In [None]:
iristest <- read.csv("iris_test.csv")
colnames(iristest)

далее возьмем значения одного параметра (ширина длинных лепестков) для одного вида (_Iris setosa_) <br>
возможные значение какого-то поля можно получить при помощи функции ***unique()***

In [None]:
unique(iris$Species)

следующая команда выбирает значения из набора данных по заданном критериям

In [None]:
setosa_sw=iris[iris$Species=='setosa',c('Sepal.Width')]

построим гистограмму по распределению этого значения

In [None]:
hist(setosa_sw, ylab = "частоты", xlab = "Ширина в мм")


Одна из главных возможностей блокнота Jupyter - это то, что можно поменять параметры и запустить фрагмент кода еще раз. <br>
Например, добавим в функцию **hist** свойство ***"breaks = n"*** с числок, групп, на которое мы желаем, чтобы было разбито распределение и запустим эту ячейку еще раз.
Попробуйте запустить несколько за с разными значениями параметра **"breaks"**<br>
можно добавить цвет ***col = "green"***<br>
наименования цветов в R можно увидеть [**здесь**](http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf)

тут же можно вызвать справку по любой функции (команде) R<br>
результат выполнения кода может быть большим и мешать восприятию текста или содержать уже не актуальные сведения, так как вы уже что-то поменяли.<br> Чтобы убрать результат выполнения кода, надо выполнить команду ***Clear Outputs*** из контекстного меню (правая клавиша мыши) или ***Clear All Outputs***, чтобы очистить весь блокнот
<br><br>
далее смотрим подсказку по функции ***hist***, а затем её убираем

In [None]:
? hist

теперь построим сдандартный график "ящик с усами"

In [None]:
boxplot(setosa)

далее посмотрим справку по фунции ***boxplot***, добавим какой-нибудь параметр в неё и запустим заново<br>
например с указанием, не выделять выбросы "*outline = FALSE*"

In [None]:
? boxplot

выполним проверку на нормальность,
для этого используем тест [Шапиро-Уилка](https://en.wikipedia.org/wiki/Shapiro%E2%80%93Wilk_test)

In [None]:
shapiro.test(setosa_sw)

если значение **p** меньше 0.05, значит нулевую гипотезу о нормальности распределения отвергаем, больше - принимаем.<br>
тепеть попробуйте проделать всё тоже самое с другими параметрами и видами
- - - - - - - - - - 

### Встронные наборы данных в среде R
Кроме набора данных "Ирисы Фишера", в среде R еще много других наборов данных, на примере которых можно осваивать разнообразные методы статистического анализа и способы визуализации как самих данных, так и результатов их обработки и анализа.
Для того чтобы вызвать список наборов данных идущих в комплекте с R нужно выполнить следующую команду:


In [None]:
data()

Здесь есть также примеры на объектах живого мира:<br>
динамика температуры тела двух бобров (beaver1 и beaver2),<br>
рост апельсиновых деревьев (Orange),<br>
влияние витамина C на рост зубов морских свинок (ToothGrowth)<br> 
и другие<br><br>
например, построим график динамики температуры тела бобра №1:



In [None]:
plot(beaver1$temp, type = "l",col = "red", xlab = "дни", ylab = expression(paste("температура тела, ",degree,"C")))

- - - 
Попробуйте сделать свой вычистительный блокнот, аналогичный этому, на примере одного из учебных наборов данных или, что будет еще лучше, на примере собственных данных.<br><br>
Создавать и редактировать блокноты Jupyper не намного сложнее, чем работать в обычном текстовом редакторе. <br>
весь набор необходимых инстументов представлен сверху окна блокнота: <br>
слева направо: <br> 
*сохранить файл*;<br> 
*добавить ячейку*; 
<br>*вырезать ячейку*; 
<br>*вставить ...*;
<br>*запусть код* - для той ячейки, в которой курсор; 
<br>*прервать выполнение* - если процес завис, 
<br>*перезапустить ядро* - сбрасывает все переменные, 
<br>*тип ячейки* - по умолчанию новая ячейки добавляется для кода, если нужен блок текста - поменяйте на *Markdown*

ячейку можно перетащить на другое место, взяв её мышью за левое поле

Начать работу с новым блокнотом следует с команды главного меню: **File** -> **New** -> **Notebook**

### Успехов !!!
все вопросы и готовые задания присылайте на адрес конференции ***bdi@pbcras.ru*** с темой письма ***мастер-класс 2***
