<a href="https://colab.research.google.com/github/ddenisenko/test/blob/master/seminar1_python3_tutorial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Краткий туториал по Python 3

Данное руководство ни в коем случае не предентует на полноту изложения

На курсе мы используем `python 3.6+`

Полезные ссылки:

- Официальная документация Python 3.6: https://docs.python.org/3.6/
- Официальное руководство с примерами: https://docs.python.org/3.6/tutorial/index.html

- Официальная документация Python 3.7: https://docs.python.org/3.7/
- Официальное руководство с примерами: https://docs.python.org/3.7/tutorial/index.html

- Различия между Python2 и Python3 https://wiki.python.org/moin/Python2orPython3

### Установка пакетов

**pip** - стандартный способ установки python пакетов

```
pip install numpy
pip install numpy==1.16.1
pip install git+https://github.com/username/repo.git
pip install --user numpy
pip install --upgrade numpy

pip install -r requirements.txt
pip freeze > requirements.txt

pip uninstall numpy
```

**Пакет** - архив с необходимыми для локального использования файлами

- актуальные форматы пакетов:
    - wheel (уже собранные, требуется только положить в правильную папку)
    - sdist (требует компиляции)
- неактуальный:
    - egg (бинарный)

### Виртуальное окружение

- Что, если нужно использовать две разные версии одной и той же библиотеки?
- Страшно что-то сломать при обновлении пакетов?
- Недостаточно прав для установки пакетов?

**Решение**: использовать виртуальное окружение

**Виртуальное окружение** - изолированная среда для библиотек и приложений.

Создается директория с интерпретатором *Python*, библиотеками и скриптами, изолированными от других виртуальных окружений и операционной системы

Широко используются две реализации: `virtualenv` и `venv`, одинаковые по функциональности.

`venv` поставляется с дистрибутивом Python 3.3+, `virtualenv` поддерживает Python 2.6+

[обзор альтернативных решений](https://stackoverflow.com/questions/41573587/what-is-the-difference-between-venv-pyvenv-pyenv-virtualenv-virtualenvwrappe/41573588#41573588)

**Типовое использование**

```
# virtualenv
virtualenv <DIR>
source <DIR>/bin/activate
```

```
# venv
python3 -m venv <DIR>
source <DIR>/bin/activate  # or . <DIR>/bin/activate
```

В текущей сессии команда python будет запускать интерпретатор из окружения и новые пакеты будут тоже устанавливаться в него

Чтобы деактивировать:

```
deactivate
```

Ну и, конечно, всегда можно использовать [Anaconda](https://www.anaconda.com/) (но лучше привыкать к `venv`)

### Python

### Базовые типы данных и операции

**Арифметические**

- int
- float

В Python, кроме обычных для других языков арифметических операций, есть и необычные, например, возведение в степень

In [0]:
1 + 2 * (3 ** 2) / 7

3.5714285714285716

In [0]:
(1 << 2) | (4 >> 2)

5

В Python встроена длинная арифметика

In [0]:
print(2 ** 300, type(2 ** 300))

2037035976334486086268445688409378161051468393665936250636140449354381299763336706183397376 <class 'int'>


**Логический**

- bool

In [0]:
print(True or False)

print(not False or some_var) # lazy evaluation

print(7 or True)

True
True
7


**None**

In [0]:
a = None
print(a, type(a))

print(None == None)

print(bool(None))

None <class 'NoneType'>
True
False


**Строки**

В Python 3 все строки - unicode, в отличие от Python 2, где unicode был отдельным типом

In [0]:
s = 'Hello'
print (s[len(s) - 4])

e


Строки **неизменяемые**

In [0]:
s[0] = 'P'

TypeError: 'str' object does not support item assignment

Символ в строке можно изменить, например, так:

In [0]:
s = 'tha text'
s = s[:2] + 'e' + s[3:]
print(s)

the text


Строки очень просто "размножать"

In [0]:
print('kva ' * 10)

kva kva kva kva kva kva kva kva kva kva 


У строк есть много встроенных полезных функций, например, `strip`, `split`, `upper`, `lower` и т.д.

In [0]:
hi = 'Hello world!'
hi.upper(), hi.lower()

('HELLO WORLD!', 'hello world!')

In [0]:
s = """      Hello world!       

"""
print(s.strip())

Hello world!


In [0]:
s = 'very long text'
splitted = s.split(' ') 
print(splitted)
print('_'.join(splitted))

['very', 'long', 'text']
very_long_text


Помимо обычного присваивания значения переменной, есть еще множественное присваивание, когда переменные записываются через запятую

In [0]:
a = 10
print(a)

b, c = 3.14, 15
print(b, c)
print(type(a), type(b), type(c))

b, c = c, b
print(b, c)
print(type(a), type(b), type(c))

10
3.14 15
<class 'int'> <class 'float'> <class 'int'>
15 3.14
<class 'int'> <class 'int'> <class 'float'>


**Неизменяемые (immutable) типы**

`int, float, complex, bool, str, tuple, frozenset`

При попытке совершить изменяющую операцию с неизменяемым объектом может произойти следующее:

- Будет создана копия объекта с внесенными изменениями (например, оператор +=)
- Вылетит ошибка (например, оператор [])

**Изменяемые (mutable) типы**

Пример: `list, dict, set`


**Создание и удаление**

При создании двух mutable-объектов отдельно - они будут гарантированно разными. Для immutable объектов это верно не всегда.

Об удалении объектов заботиться не нужно, за вас всё сделает garbage collector, но, при желании, можно использовать `del` и модуль `gc`

### Управляющие конструкции

Условный оператор if-elif-else. Все логические блоки выделяются отступами, по PEP 8 - 4 пробела

In [0]:
a = 2

if a > 5:
    print('> 5')
elif a == 5:
    print('5')
elif a < 5:
    print('< 5')
else:
    print('WTF?!')

< 5


while с постусловием

In [0]:
data = [19, 2, 4, 6, 7, 3]
element_to_find = 10

i = 0
while i < len(data):
    if data[i] == element_to_find:
        print('Found!')
        break
    i += 1
else:
    print('Not found!')

Not found!


Аналогично для for

In [0]:
data = [19, 2, 4, 6, 7, 3]
element_to_find = 10
for i in range(len(data)):
    if data[i] == element_to_find:
        print('Found!')
        break
else:
    print('Not found!')

Not found!


Вместо итерирования по индексу можно итерироваться сразу по списку

In [0]:
data = [19, 2, 4, 6, 7, 3]
element_to_find = 10
for element in data:
    if element == element_to_find:
        print('Found!')
        break
else:
    print('Not found!')

Not found!


Хотя лучше использовать `in`

In [0]:
data = [19, 2, 4, 6, 7, 3]
element_to_find = 10
if element_to_find in data:
    print('Found!')
else:
    print('Not found!')

Not found!


### Тернарный оператор

In [0]:
b = 10
a = b / 2 if b % 2 else b - 1

print(a)

9


### Списки (list)

`list` - аналог массивов в других языках

Не стоит путать его со структурой данных (где обращение по индексу происходит за O(N)).

Списки в Python могут содержать объекты разных типов

In [0]:
print([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
print(list(range(10)))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [0]:
a = []
a.append(1)
a += [5, 6]
a.remove(5)
print(a)

[1, 6]


In [0]:
a = [1, 'str', 3, [1, 2, 3], []]

a[0] = 4
del a[1]
a.insert(1, 'test')

print(a)

[4, 'test', 3, [1, 2, 3], []]


Для индексации можно использовать срезы и отрицательные индексы:

In [0]:
a = list(range(10))
print(a)
print(a[2:5])   # from 2 to 4
print(a[:5])    # begin to 4
print(a[:])     # from begin to end
print(a[2:8:3]) # every third element from 2 to 7
print(a[-1])    # first from the end (last)
print(a[-5])    # fifth from the end (last)
print(a[::-1])  # reverse list

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[2, 5]
9
5
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


Сортировка

In [0]:
a = list(range(10, 0, -1))
print(a)

b = sorted(a)
print(a, b)

b.sort(reverse=True)
print(a, b)

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1] [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1] [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]


### Кортежи (tuple)

`tuple` - immutable

In [0]:
a = (1, 2, 3)
a[1] = 20

TypeError: 'tuple' object does not support item assignment

Извлечение элементов из кортежей (на самом деле, то же самое работает и на списках)

In [0]:
first = ('first', 42)
second = ('second', 7)
third = ('third', 1337)
data = [first, second, third]
print(data)

for name, value in data:
    print(name + ' is ' + str(value))

[('first', 42), ('second', 7), ('third', 1337)]
first is 42
second is 7
third is 1337


### Множества (set)

`set` может содержать в себе только неизменяемые объекты

In [0]:
print({1, 2, 2, 1, 3})

{1, 2, 3}


In [0]:
print({1, 2, 3, [4, 5]})

TypeError: unhashable type: 'list'

Операции над множествами

In [0]:
a = {1, 2, 3}
b = set([2, 3, 4])

a.add(5)
b.update({5, 6})
a, b

({1, 2, 3, 5}, {2, 3, 4, 5, 6})

In [0]:
print (a - b)
print (b - a)
print (a | b)
print (a & b)
print (a < b)

{1}
{4, 6}
{1, 2, 3, 4, 5, 6}
{2, 3, 5}
False


In [0]:
2 in a  # O(1)

True

### Словари (dict)

Аналог unordered_map в C++

Ключи должны быть immutable, а вот значения нет

In [0]:
a = {None: 10, 'Key': [1, 2, 3], (-1, 1): 0}
a['Key'][1] = 10
print(a)

{None: 10, 'Key': [1, 10, 3], (-1, 1): 0}


**!!! WARNING** Пустые фигурные скобки - пустой `dict`, а не `set`

In [0]:
print({} == set())
print({} == dict())

False
True


Распаковка словарей

In [0]:
settings = {'user' : 'Admin', 'password' : 'qwerty'}

'User {user} has password {password}'.format(**settings)

'User Admin has password qwerty'

`defaultdict`

In [0]:
from collections import defaultdict
dct = defaultdict(float)

dct[2]

0.0

`OrderedDict`

In [0]:
from collections import OrderedDict

data = {str(i): i for i in range(5)}

print(dict(data))
print(OrderedDict(data))

{'0': 0, '1': 1, '2': 2, '3': 3, '4': 4}
OrderedDict([('0', 0), ('1', 1), ('2', 2), ('3', 3), ('4', 4)])


### Генераторы

Выше был использован генератор для создания списка

Также можно использовать их для создания `dict` и `set`

In [0]:
d = {i : i ** 2 for i in range(8)}
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49}

In [0]:
s = {i for i in range(10) if not i % 3}
s

{0, 3, 6, 9}

### Хэширование

От каждого immutable объекта можно взять встроенную хэш-функцию

In [0]:
print(hash(1234))
print(hash(-12.34))
print(hash('smth'))
print(hash(('smth', 42)))

1234
-783986623132655628
-7276383897986808262
-3819781957298470857


`list` - mutable, поэтому для него нельзя посчитать хэш

In [0]:
hash(['smth', 42])

TypeError: unhashable type: 'list'

### Ввод и вывод

In [0]:
a = input()
b = input()
print(int(a) * int(b))

Работа с stdin, stderr, stdout

In [0]:
import sys

total = 0.0
for line in sys.stdin:
    if line.isdigit():
        total += int(line)
        sys.stdout.write('Total so far {}'.format(total))
    else:
        sys.stderr.write('{} is not a digit'.format(line))

Считывание данных из файла с данными

In [0]:
f = open('file.txt', 'r', encoding='utf8')
lines = f.readlines()
f.close()

При работе с файлами и другими ресурсами лучше всего использовать context manager

In [0]:
with open('file.txt') as f:
    print(f.read())

### Функции и память

В Python имя каждого объекта - ссылка на соответствующую область памяти. При присваивании сложных объектов (например, списков) происходит копирование ссылки, а не содержимого объекта.

In [0]:
a = [1, 2, 3]
b = a
b[1] = 100
print(a, b)

b = [1, 2, 3]
print(a, b)

[1, 100, 3] [1, 100, 3]
[1, 100, 3] [1, 2, 3]


Функции и лямбды

In [0]:
def get_degrees(n):
    return n ** 2, n ** 3

print(get_degrees(12))
print((lambda n: (n ** 2, n ** 3))(12))

(144, 1728)
(144, 1728)


Также можно, не помня порядок параметров у функции, использовать при вызове их названия

In [0]:
def my_func(param1, param2='ML', param3=10):
    print(param1, param2, param3)

my_func(param2='Data Mining', param1=[0, 0])

[0, 0] Data Mining 10


In [0]:
def my_func_2(param1, *, param2='ML', param3=10):
    print(param1, param2, param3)

my_func_2([0, 0], 'Data Mining')

TypeError: my_func_2() takes 1 positional argument but 2 were given

### Классы

In [0]:
class MyClass:
    def __init__(self, param):
        self.field = param

    def get_squared_param(self):
        return self.field ** 2

a = MyClass(10)
print(a)
print(a.field)
print(a.get_squared_param())

<__main__.MyClass object at 0x0000020715C455F8>
10
100


- Служебные методы принято называть с двумя подчеркиваниями в начале и конце. Так, например, `__init__` — конструктор (на самом деле, не совсем привычный по C++ конструктор)
- Первый параметр каждого метода — сам объект, для которого вызывает метод. Принято называть этот параметр `self`

**_ и __ в именах**

- \_single_leading_underscore

weak "internal use" indicator. E.g. `from M import *` does not import objects whose name starts with an underscore.

- single_trailing_underscore_

used by convention to avoid conflicts with Python keyword, e.g. `Tkinter.Toplevel(master, class_='ClassName')`

- \_\_double_leading_underscore

when naming a class attribute, invokes name mangling: inside class FooBar, `__boo` becomes `_FooBar__boo`

- \_\_double_leading_and_trailing_underscore\_\_

"magic" objects or attributes that live in user-controlled namespaces. E.g. `__init__`,  `__import__` or `__file__`. Never invent such names; only use them as documented.

In [0]:
class MyClass:
    def __init__(self):
        self._internal_param = 6
        self.__mangled_param = 2

obj = MyClass()

print(obj._internal_param)
print(obj.__mangled_param)

6


AttributeError: 'MyClass' object has no attribute '__mangled_param'

### Внутренние переменные

In [0]:
class MyClass:
    pass

print(MyClass.__name__)
print(MyClass.__doc__)
print(MyClass.__module__)

MyClass
None
__main__


In [0]:
MyClass.__dict__

mappingproxy({'__module__': '__main__',
              '__dict__': <attribute '__dict__' of 'MyClass' objects>,
              '__weakref__': <attribute '__weakref__' of 'MyClass' objects>,
              '__doc__': None})

Работа с полями объекта - работа с его `__dict__`

In [0]:
class TestDict:
    classvar = 24
    def __init__(self):
        self.objectvar = 42

t = TestDict()
print('class dict:', TestDict.__dict__)
print('classvar:', TestDict.__dict__['classvar'])
print('obj dict:', t.__dict__)

class dict: {'__module__': '__main__', 'classvar': 24, '__init__': <function TestDict.__init__ at 0x0000020715C2A7B8>, '__dict__': <attribute '__dict__' of 'TestDict' objects>, '__weakref__': <attribute '__weakref__' of 'TestDict' objects>, '__doc__': None}
classvar: 24
obj dict: {'objectvar': 42}


In [0]:
MyClass.__class__

type

`__slots__` фиксируют возможные поля в классе (используется редко)

In [0]:
class TestSlots:
    __slots__ = ['a', 'b']
    def __init__(self):
        self.a = 1
        self.c = 42

t = TestSlots()

AttributeError: 'TestSlots' object has no attribute 'c'

### Наследование

- У класса может быть один или несколько предков (по умолчанию все классы унаследованы от `object`)
- При обращении к полям и методам обьекта Python пытается найти в самом объекте (в его `__dict__`), потом в его классе, потом в его предках в порядке называемом MRO (Method resolution order) (описание алгоритма https://en.wikipedia.org/wiki/C3_linearization)
- Посмотреть MRO обьекта можно позвав метод `.mro()`

In [0]:
class A:
    pass

A.mro()

[__main__.A, object]

In [0]:
class Animal:
    def __init__(self):
        print('Animal::Init')
        self.legs = 0

        
class Mammal(Animal):
    def __init__(self):
        print('Mammal::Init')
        super().__init__()
        self.legs = 4

        
class Swimming(Animal):
    def __init__(self):
        print('Swimming::Init')
        super().__init__()
        self.can_swim = True

        
class Platypus(Mammal, Swimming):
    def __init__(self):
        print('Platypus::Init')
        super().__init__()
        
        
Joe = Platypus()

Platypus::Init
Mammal::Init
Swimming::Init
Animal::Init
