# Введение в Python

`Python` - скриптовый, мультипарадигменный (ООП, с элементами ФП и пр.) язык программирования общего назначения.

Python. Общая тенденция возрастающее доминирование для Data
Science (65% по данным KDNaggets). В области Deep Learning полное
доминирование.

* простой синтаксис
* язык общего назначения
* разрабатывается сообществом, свободное программное обеспечение (спецификация и `CPython`)
* библиотеки для анализа данных и глубокого обучения
* основные области применения: 
    - web-разработка
    - скрипты автоматизации
    - анализа данных и машинное обучение

## Реализации Python

**CPython**
* эталонная реализация
* исторические проблемы, например `Global Interpreter Lock` (`GIL`)
* нативные расширения 

**PyPy**
* `Just-in-time compilation` (`JIT`)
* в общем случае быстрее
* нет совместимости со многими библиотеками для `CPython`

**Jython**
* `JVM`

**GraalPython**
* `GraalVM`


## Особенности (`СPython`)

* **строгая** **динамическая** типизация
* автоматическое управление памятью

Явные преимущества:
* интерпретируемость, нет необходимости компилировать код (+/-)
* развитая стандартная библиотека
* большое количество сторонних библиотек
* простота, отлично подходит для быстрого прототипирования

Недостатки:
* проблемы с производительности в определенных сценариях 
* проблемы с статическим анализом кода (как следствие - верификация, инструменты рефакторинга)
* исторические проблемы, связанные с дизайном языка (переход от **Python2** к **Python3**)

### Инфраструктура 

- **[Python Software Foundation](https://www.python.org/psf-landing/)**
- **Python 2** устарел и не поддерживается
- **[PyPi](https://pypi.org)** - репозиторий пакетов
    *  NB: безопасность
- **[PEP](https://peps.python.org/)** - **Python Enhancement Proposal**
- Система версионирования
    - текущая (на `09.2022`) версия `3.10.7`
    - расписание выхода версий регламентируется соответствующими `PEP` (например `PEP-619`)
    - поддержка (исправления и исправления уязвимостей) 2-5 лет

## Статическая и динамическая типизация

```cpp
// Статическая типизация
int a = 5;
a = "hello"; // oops
```

```python
# Динамическая типизация
a = 5
a = "hello" # Ok
```

Проблема:

```python
def add(a, b):
    return a + b

add(5, 10)
add("5", "10")
```

## Строгая и слабая типизация

```python
# Строгая типизация
a = "10"
b = a + 5 #ошибка
```
```python
# Слабая типизация
a = "10"
a = a + 5 # ???? 15? "105"?
```

## Python для научных вычислений и машинного обучения 

Язык общего назначения, но с помощью сторонних библиотек можно использовать качестве альтернативы для `MATLAB`, `Mathematica`, `R`

Преимущества:
* свободное программное обеспечение
* большой выбор нативных библиотек, где `Python` выступает в качестве (`Domain-specific language`) `DSL`
* можно создавать системы, пригодные для промышленного использования
* многие библиотеки написаны на `C` 
* есть инфраструктура для быстрого создания обертки над низкоуровневыми библиотеками
* распределенные вычисления (`Dask`, `Ray`, `PySpark`, ...)

Недостатки:
* по удобству может уступать специализированным языкам программирования (например, **R**)
* ограничения интерпретатора `CPython` (отсутствие JIT, GIL и т.д.)

### Некоторые библиотеки 

* **[numpy](https://pypi.python.org/pypi/numpy)** - линейная алгебра, случайные числа, базовые операции
* **[scipy](https://pypi.python.org/pypi/scipy)** - статистика, численные методы и многое другое
* **[tensorflow](https://tensorflow.org)** - машинное обучение, автоматическое дифференцирование, нейронные сети
* **[pytorch](https://pytorch.org)** - машинное обучение, автоматическое дифференцирование, нейронные сети
* **[matplotlib](https://pypi.python.org/pypi/matplotlib)** - рисование графиков, визуализация
* **[plotly](https://github.com/plotly/plotly.py)** - рисование графиков, визуализация
* **[pandas](https://pypi.python.org/pypi/pandas)** - работа с данными в стиле датафреймов `R`
* **[simpy](http://www.sympy.org/en/index.html)** - символьные вычисления
* **[scikit-learn](http://scikit-learn.org)** - базовые алгоритмы машинного обучения
* **[catboost](https://catboost.ai), [xgboost](https://xgboost.ai), [lightgbm](https://github.com/microsoft/LightGBM)** - градиентный бустинг
* **[statsmodels](http://statsmodels.sourceforge.net)** - статистика, машинное обучение
* **[pymc](http://pymc-devs.github.io/pymc)** - байесовское статистическое моделирование
* **[networkx](https://pypi.python.org/pypi/networkx)** - работа с графами, визуализация, раскладка

## Установка Python

**Linux:** 
- можно использовать системный пакетный менеджер (apt, yum, pacman)
    
**Windows, Linux, Mac OS:**
- [Anaconda Scientific Python Distribution](https://conda.io/projects/conda/en/latest/) 

**Windows:**
- `WSL2`

**Docker:**
- https://hub.docker.com/_/python/

Проверка версий: 
   
    $ python3 --version

## REPL

**REPL** (read-eval-print loop) - "чтение-выполнение-вывод". Простая интерактивная консольная среда выполнения.

<img src="img/repl.jpg" style="width:50%"></img>

* **read** читает одно выражение из командной строки
* **eval** вычисляет значение выражения
* **print** печатает результат выражения пользователю

Парадигма разработки:
* алгоритм разрабатывается небольшими порциями
* сразу тестируется
* отпадает необходимость интерактивной отладки

## Jupyter Notebooks

* Физически это файл с расширением `ipynb`
* Ячейки
    - в каждой ячейке может быть текст, код или что-нибудь ещё в зависимости от рисширений
    - ячейку можно запустить и сразу получить результат
* графический или интерактивный вывод    
* не обязательно Python (можно `R`, `Julia`, `Kotlin`). Расширяемая поддержка c помощью т.н. **ядер**
* **JupyterLab**
    - установка:  $ pip install jupyterlab
    - запуск: $ jupyter lab
* **Jupyter Notebook**
    - установка: $ pip install notebook
    - запуск: $ jupyter notebook


### Рабочая среда Jupyter

* WEB-браузер (**Jupyter Notebook** или **Jupyter lab**)
    - ограничения при анализе кода
* **VSCode**
    - субъективно самая удобная среда по состоянию на `2022`
    - могут быть проблемы с расширениями
* PyCharm
    - поддержка Jupyter есть только в Professional версии


### Почему Jupyter Notebook?

- среда для интерактивного анализа данных и научных вычислений
- набор дополнений, возможность документирования
- богатые возможности визуализации
- интеграция с `pandas`, `matplotlib` и другими библиотеками 

### Эффективная работа с Jupyter Notebook

- горячие клавиши (вставка/удаление/запуск ячеек)
- правила форматирования кода
- одна ячейка - одно логическое действие, один шаг по обработке данных
- правила гигиены:
    * контроль версий
    * постоянное документирование

### Горячие клавиши
- `Ctrl+Enter` запустить ячейку
- `Ctrl+Shift` запустить ячейку и переместиться вниз
- `Esc+m` текстовая ячейка
- `Esc+y` ячейка с кодом
- `Ctrl+m+b` вставить новую ячейку за текущей ячейкой
- `Ctrl+m+a` вставить новую ячейку перед текущей ячейкой
- `Ctrl+m+x` удалить текущую ячейку

### "Облачные" ноутбуки
- **Google Colaboratory** https://colab.research.google.com/
    * Доступ GPU и TPU
    * Интеграция с google drive
- **Kaggle Notebooks** https://www.kaggle.com/code
- **Azure Machine Learning** https://ml.azure.com
- **Github Codespaces** https://docs.github.com/en/codespaces

# Синтаксис и семантика Python

**Python Zen**:

```python
import this
```

    Beautiful is better than ugly.
    Explicit is better than implicit.
    Simple is better than complex.
    Complex is better than complicated.
    Flat is better than nested.
    Sparse is better than dense.
    Readability counts.
    Special cases aren't special enough to break the rules.
    Although practicality beats purity.
    Errors should never pass silently.
    Unless explicitly silenced.
    In the face of ambiguity, refuse the temptation to guess.
    There should be one-- and preferably only one --obvious way to do it.
    Although that way may not be obvious at first unless you're Dutch.
    Now is better than never.
    Although never is often better than *right* now.
    If the implementation is hard to explain, it's a bad idea.
    If the implementation is easy to explain, it may be a good idea.
    Namespaces are one honking great idea -- let's do more of those!

## Отступы

В **Python** для задания блоков потока управления используются отступы, что отличает его от языков, где используются ключевые слова или специальные символы.

```python
if a == 5:
    b = 2
else:
    b = 7
    foo()
```

Нельзя смешивать табуляцию и пробелы. Рекомендуется использовать 4 пробела.

## Переменные 

Имена переменных в Python могут содержать буквы, цифры и `_`, начинаться должны с буквы (`_` в начале может имеет семантическую нагрузку). По соглашению, имена переменных начинаются с маленькой буквы, имена классов - с большой.

Ключевые слова:

    and, as, assert, break, class, continue, def, del, elif, else, except, 
    exec, finally, for, from, global, if, import, in, is, lambda, not, or,
    pass, print, raise, return, try, while, with, yield

## Встроенные типы

### bool
- два значения `True` и `False`
- базовые логические операции `or`, `and`, `not`

```python

a = True
b = False

c = a or b

print(c)

```

### int

- immutable
- поддерживается длинная арифметика (в **Python2** было два разных типа)

```python
a = 2 ** 200  # 1606938044258990275541962092341162602522202993782792835301376
```

- операция целочисленного деления - "`//`"
- "`/`" конвертирует значения в числа с плавающей точкой

```python

2 // 5 # 0
2 / 5 # 0.4

```