## Обзор jupyter, numpy, pandas, matplotlib

`pandas` - он используется для исследования данных, их преобразования, проверки гипотез, загрузки/выгрузки и много другого

`numpy` - многие библиотеки для ML "под капотом" используют `numpy` для быстрых вычислений

`matplotlib` - Для построения графиков, основная библиотека `seaborn`

### Jupyter: продвинутые команды

#### Ячейки

`Jupyter notebook` состоит из ячеек

1. code - содержат Python-код, который Jupyter выполнит. (m)
2. text - содержат текст в разметке Markdown. (y)
3. raw - содержат любые символы, которые Jupyter не будет пытаться как-либо выполнить (на практике используется редко).


#### Горячие клавиши
- `esc` - выйти из режима редактирования ячейки
- `b` (как _below_) - создать ячейку внизу с типом `code`
- `a` (как _above_) - создать ячейку сверху с типом `code`
- `y` - сделать выбранной ячейке (это ячейка, вокруг которой зеленая рамка) тип `code`
- `m` (как _markdown_) - сделать выбранной ячейке тип `text`
- `dd` (как _delete_, только дважды) - удалить выбранную ячейку
- `x` - удалить ячейку и сохранить во временную память (не `Ctrl + C` - у jupyter на ячейки отдельный буфер обмена)
- `c` - скопировать ячейку и сохранить во временную память
- `v` - вставить ячейку из временной памяти _под_ текущей
- `V` (`shift + v`) - вставить ячейку из временной памяти _над_ текущей
- стрелка вниз - выбрать ячейку ниже
- стрелка вверх - выбрать ячейку выше
- `Ctrl + Enter` - исполнить текущую ячейку
- `Shift + Enter` - исполнить текущую ячейку и выбрать ячейку ниже
- `Ctrl + /` - быстро закомментировать код.

### Магические команды
дополнительная функциональность Jupyter

Существует два типа магических команд:

    Строчные, обозначенные одним символом %. (Команда работает на одной строке кода)
    Ячеечные, обозначенные двойным символом % %. (Команда работает над всей ячейкой)

In [2]:
%time 1e6 ** 2 # %... строчные магические команды, здесь замеряем время выполнения команды в строке.

CPU times: user 3 µs, sys: 1 µs, total: 4 µs
Wall time: 6.91 µs


1000000000000.0

In [4]:
%%time
# подсчитывает время выполнения команды под %%time
import numpy as np

for i in range(int(1e7)):
    i ** 2

CPU times: user 1.96 s, sys: 0 ns, total: 1.96 s
Wall time: 1.97 s


In [5]:
# выполнение консольных команд в pandas
!pip install pandas

Defaulting to user installation because normal site-packages is not writeable


In [7]:
%timeit np.array([i **2 for i in range(int(1e6))]) # строчный подсчет времени выполнения ячейки

251 ms ± 10.5 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [8]:
# Посмотреть доступные магические команды можно с помощью %lsmagic. 
%lsmagic

Available line magics:
%alias  %alias_magic  %autoawait  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %colors  %conda  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %pip  %popd  %pprint  %precision  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%

In [10]:
# autoreload делает так, чтобы все модули пере-импортировались перед тем,
# как запускать код.
# По умолчанию Python так не делает: если модуль уже импортирован,
# он просто игнорирует импорт.
# Если вы меняете исходный код модуля,
# изменения не подтянутся - autoreload как раз решает эту проблему.

%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


На практике чаще всего используют `%%time` для замера скорости ячейки, `%time` для замера скорости операции и `%autoreload` при разработке Python-пакета.

magic:
https://ipython.readthedocs.io/en/stable/interactive/magics.html \
autoreload:
https://ipython.org/ipython-doc/3/config/extensions/autoreload.html \
статья про magic:
https://towardsdatascience.com/top-8-magic-commands-in-jupyter-notebook-c1582e813560