![title](images/jupyterhub-80.png)

# новый интерактивый сервис для разработки и обмена исследовательскими данными

![title](images/auctor.jpg)
Докладчик: Самохин Н.Ю., инженер отдела ОВС ОФВЭ

## What is Jupyter?

_Jupyter_ — это проект с открытым исходным кодом, платформа, которая помогает максимально просто получить собственную web-среду разработки, не задумываясь о локальных пакетах и развертывании. С помощью Jupyter можно не только осуществлять обработку данных, но и делиться результатами с другими

* Различные языки программирования (kernels)
* Интерактивный код
* Визуализация результатов

* редактировать код в браузере, с подсветкой синтаксиса, автоотступами и автодополнением
* запускать код в браузере
* отображать результаты вычислений с медиа представлением (схемы, графики)
* работать с языком разметки Markdown и LaTeX

* Все в одном в файле *.ipynb [iPython Notebook]
* Метаданные в формате JSON
* Возможность экспорта в HTML, PDF

# Поддерживаемые ядра
![title](images/kernels.png)

![title](images/sh1.png)

_UC Berkeley - самый большой курс по data science в мире, 1200+ студентов_

+ cern, yandex, google, netflix?

![title](images/berkley.jpeg)

![title](images/scheme1.jpeg)


* Персональный ноутбук-сервер для пользователя
* Инициализация ядра (kernel) при подключении к ноутбуку
* Общение между ядром и сервером посредством ZMQ
* Сервер использует браузер в качестве интерфейса (JavaScript)

![title](images/scheme2.png)

# JupyterHub - персональный инстанс ноутбука для нескольких пользователей
![title](images/scheme3.png)

## Пример  1

In [None]:
import numpy as np
import matplotlib.pyplot as plt
plt.ion()

"Hello world"

In [None]:
def polynom(x):
    return 2 * x**3 - 20 * x + 2

X = np.linspace(-10, 10)
Y = polynom(X)
plt.plot(X, Y)

In [None]:
from ipywidgets import interact, FloatSlider

def parabolic(offset):
    X = np.linspace(-10, 10)
    Y = polynom(X-offset)
    # use same y scale for all offsets
    plt.gca().set_ylim([-100, 500])
    plt.plot(X, Y);
    
interact(parabolic, offset=FloatSlider(min=-10., max=10., step=0.25))

## Пример  2

In [None]:
import ROOT
from sys import exit
 
try:
    import numpy as np
except:
    print("Failed to import numpy.")
    exit()
 
 
# Helper function to create an example tree
def make_example():
    root_file = ROOT.TFile("pyroot002_example.root", "RECREATE")
    tree = ROOT.TTree("tree", "tutorial")
    x = np.empty((1), dtype="float32")
    y = np.empty((1), dtype="float32")
    tree.Branch("x", x, "x/F")
    tree.Branch("y", y, "y/F")
 
    for i in range(4):
        x[0] = i
        y[0] = -i
        tree.Fill()
    root_file.Write()
 
    return (root_file, x, y), tree
 
 
# The conversion of the TTree to a numpy array is implemented with multi-
# thread support.
ROOT.ROOT.EnableImplicitMT()
 
# Create a ROOT file with a tree and the branches "x" and "y"
_, tree = make_example()
 
# Print content of the tree by looping explicitly
print("Tree content:\n{}\n".format(
    np.asarray([[tree.x, tree.y] for event in tree])))
 
# Read-out full tree as numpy array
array = tree.AsMatrix()
print("Tree converted to a numpy array:\n{}\n".format(array))
 
# Get numpy array and according labels of the columns
array, labels = tree.AsMatrix(return_labels=True)
print("Return numpy array and labels:\n{}\n{}\n".format(labels, array))
 
# Apply numpy methods on the data
print("Mean of the columns retrieved with a numpy method: {}\n".format(
    np.mean(array, axis=0)))
 
# Read only specific branches
array = tree.AsMatrix(columns=["x"])
print("Only the content of the branch 'x':\n{}\n".format(np.squeeze(array)))
 
array = tree.AsMatrix(exclude=["x"])
print("Read all branches except 'x':\n{}\n".format(np.squeeze(array)))
 
# Get an array with a specific data-type
array = tree.AsMatrix(dtype="int")
print("Return numpy array with data-type 'int':\n{}\n".format(array))
 
## Convert the tree to a pandas.DataFrame
try:
    import pandas
except:
    print("Failed to import pandas.")
    exit()
 
data, columns = tree.AsMatrix(return_labels=True)
df = pandas.DataFrame(data=data, columns=columns)
print("Tree converted to a pandas.DataFrame:\n{}".format(df))

## IDE: JupyterLab

* Интерфейс для ноутбуков нового поколения
* Среда разработки внутри браузера
* Упрощенное отображение и кастомизация интерфейса
* Дополнительные инструменты - расширения, плагины, просмотр CSV, терминал
* Drag/Drop для всех панелей (включая код)

[notebook](https://hepd-lmsys001.pnpi.spb.ru:8019/user/llidd/tree) --> [jupyterlab](https://hepd-lmsys001.pnpi.spb.ru:8019/user/llidd/lab)

![title](images/jlab1.png)

![title](images/jlab2.png)

![title](images/jlab3.png)

# Useful links

* [Презентация участника проекта EuXFEL об экосистеме Jupyter](http://www.southampton.ac.uk/~fangohr/geheim/jupyter-workshop-icalepcs2019-fangohr-introduction.pdf)
* [Яндекс и их опыт использования технологии Jupyter](https://habr.com/ru/company/yandex/blog/353546/)
* [О том, как Netflix начал использовать ноутбуки](https://netflixtechblog.com/notebook-innovation-591ee3221233)

# QUESTIONS

# E-mail: samon@itmo.ru
# Tel: +7-921-869-46-48