# Вычисления в Jupyter Notebook: переменные, функции, модули и пакеты

[К оглавлению](00_contents.ipynb)

## Выполнение кода

### Общие принципы
* Содержание блокнота - это компьютерная программа, то есть инструкция для компьютера, которая позволяет ему прийти к нужному вам результату
* Вы можете создавать и выполнять эту программу последовательно, по частям. В любой момент можно остановиться и изучить полученные результаты.
* Блокнот позволяет только редактировать код и отображать выполнения. Все вычисления производятся ядром (kernel) - интерпретатором Python, запущенным на вашем компьютере
* При первом открытии блокнота, или после перезапуска ядра все нужно вычислять заново
* Блокнот сохраняет содержимое ячеек вывода, поэтому если нужно только посмотреть на результаты, то повторные вычисления не требуются


### Выражения

Выражения - это формулы, составленные из констант, имен переменных и функций. Выражение может быть вычислено. Результатом вычисления является некоторое значение, которое может быть в дальнейшем использовано. 

Несколько простых выражений

In [1]:
# Математические вычисления
2 + 2 * 2

6

In [2]:
# Использование встроенной функции
15 + max(100, 500)

515

In [3]:
# Операции со строками
'учиться, ' * 2 + 'и еще раз учиться'

'учиться, учиться, и еще раз учиться'

In [4]:
# Несколько выражений в одной ячейке
2 * 2
3 * 3

9

### Автовывод результатов

- Если результат вычисления выражения не присваивается никакой переменной, то он выводится на экран (автовывод - autoprint).
- Выводится только последний результат в ячейке
- При необходимости, можно отключить автовывод, добавив в конце выражения символ ;

In [5]:
# Отключить автовывод
2**10;

### Печать результатов

Если вам, наоборот, необходимо вывести в одной ячейке несколько результатов - используйте функцию `print()`

In [6]:
print("Привет, мир!")
print(2 * 2, 3 * 3)

Привет, мир!
4 9


## Переменные

**Переменные** позволяют сохранять результаты вычислений и использовать их в дальнейшем. Чтобы обратиться к результату, можно использовать *имя переменной*, которой этот результат был *присвоен* с помощью *оператора* `=`.

In [7]:
x = 2**10

In [8]:
x

1024

In [9]:
2 * x

2048

В Python не нужно объявлять тип переменной. Тип определяется тем результатом (объектом), на который переменная ссылается (динамическая типизация)

In [10]:
x = 'Хорошо! '

In [11]:
2 * x

'Хорошо! Хорошо! '

### Порядок вычислений в блокноте

Код в блокноте записан последовательно. Однако вы можете изменить порядок выполнения, запуская отдельные ячейки в произвольном порядке.
При этом значения переменных и другие результаты вычислений будут определяться порядком **выполнения** ячеек с кодом, а не порядком их **записи** в блокноте!

При перезапуске ядра все результаты в памяти стираются. Их нужно будет получать заново, запуская соответствующие ячейки.

## Функции

Функции позволяют разделить код на отдельные блоки, которые можно затем многократно использовать, не заботясь о деталях реализации. Если вы видите, что некоторый код может использоваться более одного раза - возможно, с небольшими вариациями, то имеет смысл оформить его в виде функции. Функции могут сделать код более понятным, потому что позволяют задать имя для сложного действия, включающего несколько взаимосвязанных операторов.

- В отличие от имен переменных, после имени функции обязательно должны следовать скобки ()

- Функция может иметь набор *аргументов*, которые нужно задавать при вызове функции.

- Функция может возвращать *значение*. В этом случае функцию можно использовать как часть выражения, т.е. использовать возвращаемый результат в формуле.

In [12]:
# Пример использования функции
round(3.1415, 2)

3.14

![](pics/function.png)

Функция может также не возвращать значения (точнее, возвращать значение `None`). Такие функции используются, когда интересен не результат, а действия, которое выполняет эта функция. Например, с помощью функции `print()` можно вывести результат вычисления:

In [13]:
result = print("Привет, мир!")
print(result)

Привет, мир!
None


### Встроенные функции

В Python доступно множество встроенных функций. Увидеть список встроенных функций можно с помощью функции `dir()`:

In [14]:
# Список встроенных функций (и не только функций)
print(dir(__builtin__))



Еще больше функций содержится в библиотеках, которые вы можете подключить и использовать для решения своих задач.

### Справка по функциям
Справку по фукнкции можно получить так:
- `help(функция)` - краткая справка (docstring), вывод в ячейку результата
- `функция?` - краткая справка (в docstring), вывод в отдельную панель
- `функция??` - расширенная справка, выводится код функции (если он доступен), вывод в отдельную панель

Закрыть панель со справкой можно по клавише `q` или щелчком на разделителе.

In [15]:
# Справка по функции print
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [16]:
# Справка по функции print в отдельной панели
print?

### Автодополнение
При вводе имен переменных и функций в блокноте работает автодополнение (`Tab`).

Подсказку по аргументам функции можно получить по клавише `Shift-Tab` (сначала набрать имя функции и открывающую скобку)

In [17]:
#Какие аргументы есть у встроенной функции print?
#print(

### Вызов функций

In [18]:
help(round)

Help on built-in function round in module builtins:

round(number, ndigits=None)
    Round a number to a given precision in decimal digits.
    
    The return value is an integer if ndigits is omitted or None.  Otherwise
    the return value has the same type as the number.  ndigits may be negative.



Передавать аргументы в функцию можно по порядку, либо по имени. Обычно перечисление по порядку используется для 1-2 первых аргументов функции, для большего количества сложно запомнить правильный порядок. 

In [19]:
round(3.1415, 2)

3.14

Если аргументов много, то их лучше указывать по имени, в любом порядке:

In [20]:
round(number=3.1415, ndigits=2)

3.14

In [21]:
round(ndigits=2, number=3.1415)

3.14

Можно совмещать эти два способа.

In [22]:
round(3.1415, ndigits=2) # вначале должны следовать позиционные аргументы, затем - именованные

3.14

У многих функций есть значения аргументов по умолчанию. Это отражено в справке по функции и видно при использовании автодополнения. Например, по умолчанию аргумент `ndigits` равен `None`, поэтому округление производится до целого числа.  Аналогичным образом, по умолчанию при печати с помощью `print()` значения выводятся через пробел, но это можно изменить:

In [23]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [24]:
print("Первый", "второй")
print("Первый", "второй", sep='\n') #\n - символ новой строки

Первый второй
Первый
второй


Функция может иметь произвольное число аргументов

In [25]:
help(min)

Help on built-in function min in module builtins:

min(...)
    min(iterable, *[, default=obj, key=func]) -> value
    min(arg1, arg2, *args, *[, key=func]) -> value
    
    With a single iterable argument, return its smallest item. The
    default keyword-only argument specifies an object to return if
    the provided iterable is empty.
    With two or more arguments, return the smallest argument.



In [26]:
min(1, 2)

1

In [27]:
min(1, 2, 3, 4, 5)

1

### Пользовательские функции

Свою функцию можно определить, используя оператор `def`

In [28]:
# Функция, которая возвращает квадрат значения
def square(x):
    return x * x

NB: По отступам Python определяет вложенность блоков кода (клавиша `Tab`)

Чтобы изменить уровень вложенности, надо выделить нужные строки и воспользоваться клавишами `Tab` или `Shift-Tab`

In [29]:
# Вызов пользовательской функции
square(5)

25

In [30]:
# Подсказка по аргументам пользовательской фуникци
#square(

### Документирование функций - docstring
Для того, чтобы подсказка выводилась и по собственным функциям, необходимо поместить после заголовка функции специальный комментарий - docstring

In [31]:
def distance(x0, y0, x1, y1):
    '''
    Вычисление расстояния между двумя точками на плоскости
    Аргументы:
    x0, y0 - координаты первой точки
    x1, y1 - координаты второй точки
    '''
    return ((x0 - x1)**2 + (y0 - y1)**2)**.5    

In [32]:
#проверка:
#distance(

#вычислите координаты между точками (5, 5) и (5, 6)

### Лямбда-выражения

Простые однострочные функции - например, математические - удобно определять так:

In [33]:
f = lambda x,y : x**2 + y**2

f(1, 2)

5

Такой способ определения функций называется **лямбда-выражение**. Интерсно, что лямбда-выражения можно использовать даже не присваивая полученной функции никакого имени. Можно написать лямбда-выражение прямо в том месте, где ожидается имя функции (мы это будем использовать позднее, при работе с табличными данными)

Ограничением лямбда-выражений является то, что в них нельзя использовать никаких операторов.

### Область видимости

Определяемые пользователем переменные и функции имеют свою _область видимости_ (_scope_). Видимость имени определяется тем, в каком месте кода оно определено.

Просмотреть список имен пользовательских переменных и функций в текущей области видимости можно с помощью волшебных команд: `%who` и `%whos`. Также можно использовать функцию `dir()`

In [34]:
%who

distance	 f	 result	 square	 x	 


In [35]:
%whos

Variable   Type        Data/Info
--------------------------------
distance   function    <function distance at 0x00000192EADF1820>
f          function    <function <lambda> at 0x00000192EADF11F0>
result     NoneType    None
square     function    <function square at 0x00000192EADFEC10>
x          str         Хорошо! 


### Локальные и глобальные переменные

_Глобальные переменные_ определяются в модуле (верхний уровень программы). Они доступны из любого места модуля (у нас - блокнота).

_Локальные переменные_ определяются в теле функции. Они доступны только внутри функции.


In [36]:
x = 5 #глобальная переменная
y = 10 #глобальная переменная

def proba(x):     
    z = 30 #локальная переменная
    print('функция proba', x, y, z) # внутри функции имя x будет связано со значением первого аргумента функции    
    print('функция proba', dir())
    
proba(20)

print('модуль', x, y)

#print(x, y, z) #ошибка! Переменная z доступна только внутри функции

%who


функция proba 20 10 30
функция proba ['x', 'z']
модуль 5 10
distance	 f	 proba	 result	 square	 x	 y	 


![Область для функции proba](pics/scope.svg 'Область для функции proba')

In [37]:
x = 5 #глобальная переменная
y = 10 #глобальная переменная

def proba2(x):
    x = 50 #внутри функции имя x будет связано со значением первого аргумента функции    
    z = 30 #локальная переменная
    y = 100 #локальная переменная, перекрывающая глобальную
    print('функция proba2', x, y, z)
    print('функция proba2', dir())    
    
proba2(20)

print('модуль', x, y) # значения не изменились

%who

функция proba2 50 100 30
функция proba2 ['x', 'y', 'z']
модуль 5 10
distance	 f	 proba	 proba2	 result	 square	 x	 y	 


![Область для функции proba2](pics/scope2.svg 'Область для функции proba2')

## Модули и импорт

- Большие программы обычно разбиваются на отдельные файлы - модули. 
- _Модуль_ в Python - это файл, содержащий определения переменных, функций и классов. 
- Модули разрабатывают как логически завершенные наборы объектов, позволяющие решить некоторую задачу или логически связанные задачи. Например, в модуле `sys` содержатся объекты для работы с системными ресурсами, в модуле `math` - математические функции и константы.
- Внутри модуля доступны все объекты, определенные в нем. Также можно пользоваться объектами, определенными в других модулях. Для этого их нужно _импортировать_ с помощью операторов `import` или `from`.

In [38]:
import sys #импорт всех объектов из модуля sys, они будут доступны через sys.имя
from math import pi #импорт одной переменной из модуля math, она будет доступна как pi

### Пространства имен

Чтобы избежать конфликта имен, при импорте модуля оператором `import` имена объектов, определенных в модуле, добавляются в отдельное **пространство имен**. К ним нужно обращаться так:

`модуль.имя объекта`.  

Список всех объектов в модуле после импорта можно просмотреть функцией `dir(модуль)`

In [39]:
print('Объекты из модуля sys:\n', dir(sys),'\n') #список имен, определенных в модуле

Объекты из модуля sys:
 ['__breakpointhook__', '__displayhook__', '__doc__', '__excepthook__', '__interactivehook__', '__loader__', '__name__', '__package__', '__spec__', '__stderr__', '__stdin__', '__stdout__', '__unraisablehook__', '_base_executable', '_clear_type_cache', '_current_frames', '_debugmallocstats', '_enablelegacywindowsfsencoding', '_framework', '_getframe', '_git', '_home', '_xoptions', 'addaudithook', 'api_version', 'argv', 'audit', 'base_exec_prefix', 'base_prefix', 'breakpointhook', 'builtin_module_names', 'byteorder', 'call_tracing', 'callstats', 'copyright', 'displayhook', 'dllhandle', 'dont_write_bytecode', 'exc_info', 'excepthook', 'exec_prefix', 'executable', 'exit', 'flags', 'float_info', 'float_repr_style', 'get_asyncgen_hooks', 'get_coroutine_origin_tracking_depth', 'getallocatedblocks', 'getcheckinterval', 'getdefaultencoding', 'getfilesystemencodeerrors', 'getfilesystemencoding', 'getprofile', 'getrecursionlimit', 'getrefcount', 'getsizeof', 'getswitchinter

In [40]:
print(sys.version) #доступ к объекту из пространства имен модуля

3.8.3 (default, Jul  2 2020, 17:30:36) [MSC v.1916 64 bit (AMD64)]


Также можно исследовать содержание пространства имен модуля с помощью автодополнения:  
`sys.<нажмите Tab>`

![Автодополнение](pics/autocomplete.png)

Если функция или константа были импортированы из модуля оператором `from ... import ...`, то они будут доступны просто по имени:

In [41]:
print("Число Пи =", pi) #доступ к объекту, импортированному в пространство имен текущего модуля

Число Пи = 3.141592653589793


При импорте с помощью `from` объекты добавляются в пространство имен текущего модуля и могут переопределить уже существующие в нем имена.

### Переименование модулей

При частом доступе к объектам в пространстве имен модуля удобно, когда префикс, состоящий из имени модуля, имеет небольшую длину. Поэтому часто используемые модули при импорте переименовывают с помощью оператора `as`

In [42]:
import numpy as np

np.arange(5) #функция arange из модуля numpy (переименован в np)

array([0, 1, 2, 3, 4])

### Пакеты

- _Пакеты_ (packages) - это способ организации модулей в библиотеки.
- Пакеты соответствуют каталогам в файловой системе, в которых размещены файлы родственных модулей.
- Пакеты могут включать подпакеты (subpackages), которые позволяют организовать иерархию в пространстве имен пакета.

Например, разработчик пакета для работы со звуковыми файлами, может создать такую структуру:

![Пакеты](pics/packages.png 'Структура каталогов пакета')

Пользователи пакета смогут импортировать модуль для создания эффекта эхо, указав составное имя: `пакет.подпакет.модуль`
```python
import sound.effects.echo```

Для Python разработано множество пакетов, решающих различные задачи. Глобальный каталог пакетов  - [Python Package Index](https://pypi.python.org/pypi)

Наиболее часто используемые в научных вычислениях пакеты перечислены в таблице

Модуль | Назначение
:-|:-
`numpy` | Работа с массивами данных
`sympy` | Символьная математика (аналитическое вычисление/преобразование выражений)
`pandas`| Обработка данных в табличной форме
`matplotlib` | Библиотека для построения графиков
`matplotlib.pyplot`| Набор функций для построения графиков в стиле Matlab
`seaborn`| Надстройка над matplotlib, облегчающая визуализацию данных
`scipy.optimize` | Методы оптимизации
`scipy.integrate` | Численное интегрирование
`scipy.stats` | Статистические функции
`statsmodels` | Статистические модели
`scikit-learn` | Модели машинного обучения

Документация по двум ключевым пакетам научных вычислений - numpy и scipy доступна на сайте: http://scipy.org  
Документация по pandas: https://pandas.pydata.org/  
Документация по matplotlib: https://matplotlib.org/  
Документация по seaborn: https://seaborn.pydata.org/  

### Установка пакетов

Если вы установили Anaconda Python, то, скорее всего у вас уже есть все необходимые для курса пакеты.
Если все же какого-то пакета нет, его можно установить, используя менеджер пакетов `conda` из командной строки (Anaconda Prompt) или из блокнота:

In [43]:
!conda install graphviz

Collecting package metadata (current_repodata.json): ...working... done
Solving environment: ...working... done

# All requested packages already installed.



Так можно посмотреть список всех установленных пакетов:

In [44]:
!conda list

# packages in environment at C:\Anaconda3:
#
# Name                    Version                   Build  Channel
_anaconda_depends         2020.07                  py38_0  
_ipyw_jlab_nb_ext_conf    0.1.0                    py38_0  
alabaster                 0.7.12                     py_0  
anaconda                  custom                   py38_1  
anaconda-client           1.7.2                    py38_0  
anaconda-navigator        1.9.12                   py38_0  
anaconda-project          0.8.4                      py_0  
argh                      0.26.2                   py38_0  
argon2-cffi               20.1.0           py38he774522_1  
asn1crypto                1.4.0                      py_0  
astroid                   2.4.2                    py38_0  
astropy                   4.0.1.post1      py38he774522_1  
atomicwrites              1.4.0                      py_0  
attrs                     20.1.0                     py_0  
autopep8                  1.5.4                 

[Здесь](https://alstutor.work/pdfs/conda-cheatsheet.pdf) можно почитать, что еще умеет `conda`

Если `conda` не находит нужный пакет, или если вы используете другой дистрибутив Python, то можно использовать менеджер пакетов `pip`. 

In [45]:
!pip list

powershell_shortcut       0.0.1                         3  
prometheus_client         0.8.0                      py_0  
prompt-toolkit            3.0.7                      py_0  
prompt_toolkit            3.0.7                         0  
psutil                    5.7.2            py38he774522_0  
py                        1.9.0                      py_0  
py-lief                   0.10.1           py38ha925a31_0  
pycodestyle               2.6.0                      py_0  
pycosat                   0.6.3            py38he774522_0  
pycparser                 2.20                       py_2  
pycurl                    7.43.0.5         py38h7a1dbc1_0  
pydocstyle                5.1.1                      py_0  
pyflakes                  2.2.0                      py_0  
pygments                  2.6.1                      py_0  
pylint                    2.6.0                    py38_0  
pynacl                    1.4.0            py38h62dcd97_1  
pyodbc                    4.0.30        

defusedxml                         0.6.0
diff-match-patch                   20200713
distributed                        2.25.0
docutils                           0.16
entrypoints                        0.3
et-xmlfile                         1.0.1
fastcache                          1.1.0
filelock                           3.0.12
flake8                             3.8.3
Flask                              1.1.2
fsspec                             0.8.0
future                             0.18.2
gevent                             20.6.2
glob2                              0.7
gmpy2                              2.0.8
greenlet                           0.4.16
h5py                               2.10.0
HeapDict                           1.0.1
html5lib                           1.1
idna                               2.10
imageio                            2.9.0
imagesize                          1.2.0
importlib-metadata                 1.7.0
iniconfig                          0.0.0
intervaltree   

Примеры использования `pip` [здесь](https://pythonworld.ru/osnovy/pip.html).