# 0. Установка среды для написания кода на Python

Есть несколько широко распространенных IDE для написания кода на Python. Использование той или иной IDE зависит от целей, которые преследует тот, кто пишет код.

В РЭШ вам часто будет полезен Python для того, чтобы работать с данными: исследовать их и визуализировать; проводить расчеты; строить и применять эконометрические модели, а также модели машинного обучения или глубинного обучения.

На начальном этапе я бы посоветовал присмотреться к двум (по факту практически одинаковым) вариантам:

1. Anaconda3 - https://www.anaconda.com/download
В данном случае необходимо установить Анаконду, в которой в последствии использовать Jupyter Notebook

2. Google Colaboratory - https://www.google.com/intl/ru/drive/
Тут ничего скачивать не надо. Вы просто заходите в свой Гугл-Диск, там же создаете через ПКМ файл ```Google Colaboratory``` и наслаждаетесь кодингом :)

# 1. Основные правила написания кода на Python

Для того, чтобы код был читабельным, необходимо соблюдать ряд рекомендаций, прописанных в **PEP-8** - руководстве по написанию кода на Python. Ссылка: https://pythonworld.ru/osnovy/pep-8-rukovodstvo-po-napisaniyu-koda-na-python.html

## 1.1. Пробелы и отступы

Всегда окружайте эти бинарные операторы одним пробелом с каждой стороны: 
* присваивания (=, +=, -= и другие)
* сравнения (==, <, >, !=, <>, <=, >=, in, not in, is, is not)
* логические (and, or, not)

In [1]:
a = 4
b = 6 - 3
b -= 1 # Вычитание из b единицы

a, b

(4, 2)

Также удобно разграничивать пробелами элементы внутри списков, кортежей и т. д.

In [2]:
mylist = [1, 2, 3]
mytuple = (1, 2, 3)
mydict = {'one': 1, 'two': 2, 'three': 3}
myset = {1, 2, 3}

Однако использовать пробелы везде и всюду тоже не следует :)

In [3]:
mylist = [ 1, 2, 3 ]                          # Так не надо
mytuple = (1 , 2 , 3)                         # Так не надо
mydict = {'one' : 1, 'two' : 2, 'three' : 3}  # Так не надо
myset = { 1 , 2 , 3 }                         # Так не надо

Также есть важное уточнение: при вышеперечисленных операциях присваивания, сравнения и логических, которые находятся внури любого рода скобок, пробел делать не стоит:

In [4]:
a = 4
b = 2

mylist = [a-1, b+7, a-b] # Так правильно
mylist = [a - 1, b + 7, a - b] # Так не надо! Это загрязняет код!

Также при выполнении операций умножения ($*$), деления ($/$) и возведения в степень ($**$) иногда пробелы ставить не надо:

In [5]:
a = 4
b = 2

c = a * b
d = a / b
e = a ** b

f = a*b + a/b + a**b

Во многих языках программирования для разграничения блоков кода используются фигурные скобки. В Python для этого используются отступы

In [6]:
# пример отступов во вложенных циклах for
for i in [1, 2, 3] :
    print(i) # первая строка в блоке for i

1
2
3


In [7]:
# пример отступов во вложенных циклах for
for i in [1, 2, 3] :
    print (i) # первая строка в блоке for i
    for j in [1, 2] :
        print(i+j) # последняя строка в блоке for j
print("Циклы закончились")

1
2
3
2
3
4
3
4
5
Циклы закончились


## 1.2. Перенос кода

In [8]:
pervaya_peremennaya_1 = 1
pervaya_peremennaya_2 = 2
pervaya_peremennaya_3 = 3
pervaya_peremennaya_4 = 4

long_computation = pervaya_peremennaya_2 + pervaya_peremennaya_2 \
                   + pervaya_peremennaya_3 + pervaya_peremennaya_4

print(long_computation)

long_computation = (pervaya_peremennaya_2 + pervaya_peremennaya_2 +
                    pervaya_peremennaya_3 + pervaya_peremennaya_4) 

print(long_computation)

11
11


In [9]:
# список списков
list_of_lists = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

# такой список списков легче читается
easy_to_read_list_of_lists = [[1, 2, 3],
                              [4, 5, 6],
                              [7, 8, 9]] 

list_of_lists, easy_to_read_list_of_lists

([[1, 2, 3], [4, 5, 6], [7, 8, 9]], [[1, 2, 3], [4, 5, 6], [7, 8, 9]])

## F-string

In [10]:
mylist = [f'car_{i}' for i in range(5)]

mylist

['car_0', 'car_1', 'car_2', 'car_3', 'car_4']

In [11]:
print(f'Hello, your number is {a}, and babjhdj {a**2}')

Hello, your number is 4, and babjhdj 16


## F-string

In [12]:
mylist
mylist = [f'car_{i}' for i in range(5)]


In [13]:
a = 6
print(f'Hello, your number is {a}, and babjhdj {a**2}')

Hello, your number is 6, and babjhdj 36


# 2. Типы переменных

Можно выделить следующие типы, которые потребуются в работе - целые числа (integer или ```int``` в Python), числа с плавающие точкой (```float```), строки (string или ```str```), а также булевы переменные. 

Присваивание в Python происходит через знак ```=```. Тип данных можно посмотреть через команду ```type(..)```

Python имеет динамическую типизацию. Таким образом, Вам не надо указывать тип переменной при присвоени как в C++, Java или других языках со статической типизацией. 

In [14]:
a = 4
b = 1.5
c = True
d = 'Hello'

print(a, type(a))
print(b, type(b))
print(c, type(c))
print(d, type(d))

4 <class 'int'>
1.5 <class 'float'>
True <class 'bool'>
Hello <class 'str'>


In [15]:
a, b, c, d = 4, 1.5, True, 'Hello'

print(a, type(a))
print(b, type(b))
print(c, type(c))
print(d, type(d))

4 <class 'int'>
1.5 <class 'float'>
True <class 'bool'>
Hello <class 'str'>


Данные можно также вводить с клавиатуры посредством команды ```input()```. Все введенные таким образом переменные имеют строковый тип. Для того, чтобы перевести значение в нужный тип, в данном случае необходимо использовать функции ```int()```, ```float()```, ```bool()```.

In [16]:
# a = input()
# print(f'Вы ввели следующее значение: {a}', type(a))

In [17]:
# a = int(input())
# b = float(input())
# c = bool(input())

# print(f'Вы ввели следующее значение: {a}', type(a))
# print(f'Вы ввели следующее значение: {b}', type(b))
# print(f'Вы ввели следующее значение: {c}', type(c))

# 3. Операции с переменными

## 3.1. Числовые переменные

In [18]:
a, b = 4, 2

ab_sum = a + b
ab_product = a * b
ab_division = a / b
ab_power = a ** b
ab_floor_division = a // b
ab_remainder_division = a % b
ab_rounded = round(a * b / 7, 2)
ab_comparison_equality = (a == b)
ab_comparison_geq = (a >= b)
ab_comparison_greater = (a > b)

print(f'Sum of {a} and {b} is {ab_sum}')
print(f'Product of {a} and {b} is {ab_product}')
print(f'Division of {a} on {b} is {ab_division}')
print(f'{a} to the power of {b} is {ab_power}')
print(f'Integer (floor) division of {a} on {b} is {ab_floor_division}')
print(f'Remainder of division of {a} on {b} is {ab_remainder_division}')
print(f'Rounded manipulation of {a} and {b} is {ab_rounded}')
print(f'{a} = {b} is {ab_comparison_equality}')
print(f'{a} > {b} is {ab_comparison_greater}')
print(f'{a} >= {b} is {ab_comparison_geq}')

Sum of 4 and 2 is 6
Product of 4 and 2 is 8
Division of 4 on 2 is 2.0
4 to the power of 2 is 16
Integer (floor) division of 4 on 2 is 2
Remainder of division of 4 on 2 is 0
Rounded manipulation of 4 and 2 is 1.14
4 = 2 is False
4 > 2 is True
4 >= 2 is True


## 3.2. Логические переменные

In [19]:
a, b = True, False

ab_sum = a + b
ab_product = a * b
ab_comparison = a is b
ab_condition = a and b

a_integer = int(a)

print(f'Sum of {a} and {b} is {ab_sum}')
print(f'Product of {a} and {b} is {ab_product}')
print(f'The statement that {a} is {b} is {ab_comparison}')
print(f'And condition on {a} and {b} is {ab_condition}')
print(f'{a} in integer form is {a_integer}')

Sum of True and False is 1
Product of True and False is 0
The statement that True is False is False
And condition on True and False is False
True in integer form is 1


## 3.3. Строковые переменные

In [20]:
a = 'New Economic School'
b = 'Studies'

sum_strings = a + b
multiply_by_factor = a * 3
together = a * 3 + ' ' + b * 2

print('slicing the first 3 characters of variable a:', a[:3]) 
print('all characters till 3 last characters of variable a:', a[:-3]) 
print('the second and the third characters of variable a:', a[1:3]) 
print('all the charactes from the third one without 2 last characters:', a[2:-2]) 

print('\n')

print(f'Sum of "{a}" and "{b}" is: "{sum_strings}"')
print(f'Multiplication of "{a}" by "{3}" is: "{multiply_by_factor}"')
print(f'Takeing multiplication and sum of "{a}" and "{b}" is: "{together}"')

slicing the first 3 characters of variable a: New
all characters till 3 last characters of variable a: New Economic Sch
the second and the third characters of variable a: ew
all the charactes from the third one without 2 last characters: w Economic Scho


Sum of "New Economic School" and "Studies" is: "New Economic SchoolStudies"
Multiplication of "New Economic School" by "3" is: "New Economic SchoolNew Economic SchoolNew Economic School"
Takeing multiplication and sum of "New Economic School" and "Studies" is: "New Economic SchoolNew Economic SchoolNew Economic School StudiesStudies"


Есть другие - более специфичные - типа слайсинга списков

In [21]:
print(f'Slicing every second element from {a} is {a[::2]}')
print(f'Reversion of {a} is {a[::-1]}')

# Замещение элементов
a_new = a.replace('o', '3')
print(a, a_new)
a_new = a.replace('c', '3', 2)
print(a, a_new)

# Каждое слово с большой буквы
a_new = a.capitalize()
print(a, a_new)

# Все слова большими буквами
a_new = a.upper()
print(a, a_new)

# Все слова маленькими буквами
a_new = a.lower()
print(a, a_new)

Slicing every second element from New Economic School is NwEooi col
Reversion of New Economic School is loohcS cimonocE weN
New Economic School New Ec3n3mic Sch33l
New Economic School New E3onomi3 School
New Economic School New economic school
New Economic School NEW ECONOMIC SCHOOL
New Economic School new economic school


In [22]:
a = 'New Economic School'
print(a)

# Сплитование строк
b = a.split(sep=' ')
print(b)

# Джойн списка в строку
c = ' '.join(b)
print(c)

# убрать лишние пробелы в конце
a = 'New Economic School      '
print(a.rstrip())

New Economic School
['New', 'Economic', 'School']
New Economic School
New Economic School


# 4. Контейнеры и операции над ними

## 4.1. Списки

Очень важной структурой данных в Python является список. Это просто упорядоченная совокупность (или коллекция), похожая на массив в других языках программирования, но с дополнительными функциональными возможностями.

In [23]:
integer_list = [1, 2, 3] # список целых чисел
heterogeneous_list = ["строка", 0.1 , True, 32923932] # разнородный список
list_of_lists = [integer_list, heterogeneous_list, [] ] # список списков

integer_list, heterogeneous_list, list_of_lists

([1, 2, 3],
 ['строка', 0.1, True, 32923932],
 [[1, 2, 3], ['строка', 0.1, True, 32923932], []])

In [24]:
list_length = len(list_of_lists)
list_sum = sum(integer_list)
list_length, list_sum

(3, 6)

Устанавливать значение и получать доступ к n-му элементу списка можно при помощи квадратных скобок:


In [25]:
mylist = list(range(10))
print(mylist)

print(mylist[0])
print(mylist[-1])
print(mylist[3:6])

mylist[5] = 15
print(mylist)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
0
9
[3, 4, 5]
[0, 1, 2, 3, 4, 15, 6, 7, 8, 9]


Над списками можно проводить ряд операций - смотреть, есть ли элемент в списке (```in```), присоединять элементы к списку (```append```) (элементами могут служить и другие списки, кортежи и т.д.), а также расширять список значениями другого списка (```extend```). Более того, если лист содержит строковые значения, их можно соединить.

In [26]:
mylist = list(range(10))
print(mylist)

print(3 in mylist, 
      3 not in mylist)

# в методе .append() не требуется делать присовение - применив данный метод, число добавляется в список
mylist.append(999)
print(mylist)

mylist2 = [11, 15, False, '7']
mylist.extend(mylist2)
print(mylist)

mylist3 = ['abc', 12]
mytuple = ('aaa', 81)
mylist.append(mylist3)
mylist.append(mytuple)
print(mylist)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
True False
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 999]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 999, 11, 15, False, '7']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 999, 11, 15, False, '7', ['abc', 12], ('aaa', 81)]


Также со списками работают операции сложения и умножения. Сложение аналогично операции ```.append()```. Операция умножения служит для размножения элементов внутри списка.

In [27]:
mylist = [1, 2, 3]
print(mylist)

mylist = mylist + [4, 5, 6]
print(mylist)

print(len(mylist)) # Возвращает длину списка
print(sum(mylist)) # Возвращает сумму элементов списка
print(mylist * 3)

[1, 2, 3]
[1, 2, 3, 4, 5, 6]
6
21
[1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6]


## 4.2. Кортежи

От списков кортежи отличаются тем, что это "неизменяемый" типа данных: мы не сможем заменить один элемент кортежа на другой, обратившись к нему по индексу.

In [28]:
mytuple = (1, 2, 3, 4, 5)

In [29]:
mytuple[2]

3

In [30]:
#mytuple[2] = 7

In [31]:
list_from_tp = list(mytuple)
list_from_tp[2] = 7
tp_from_list = tuple(list_from_tp)

tp_from_list, list_from_tp

((1, 2, 7, 4, 5), [1, 2, 7, 4, 5])

## 4.3. Словари

1. Сам словарь изменяем — можно добавлять/удалять новые пары ключ: значение; значения элементов словаря — изменяемые и не уникальные;
2. А вот ключи — не изменяемые и уникальные, поэтому, например, мы не можем сделать ключом словаря список, но можем кортеж
3. Из уникальности ключей, так же следует уникальность элементов словаря — пар ключ: значение.

In [32]:
mydict = {'name': 'pizza', 'price': 100, 'onions': True}

mydict['name'], mydict['price'], mydict['onions']

('pizza', 100, True)

In [33]:
print(mydict.keys())
print(mydict.values())
print(mydict.items())

dict_keys(['name', 'price', 'onions'])
dict_values(['pizza', 100, True])
dict_items([('name', 'pizza'), ('price', 100), ('onions', True)])


In [34]:
# mydict.items()[0]

Чтобы обратиться, например, к айтемам словаря, необходимо перевести тип в списковый

In [35]:
list(mydict.items())[0]

('name', 'pizza')

Добавление элементов в словарь

In [36]:
mydict['diameter'] = 42

Если, например, нужно увеличить какой-то численный элемент словаря, но нам неизвестно, есть уже такой элемент или его нужно добавить, то можно воспользоваться следующим подходом с использованем метода ```.get()```:

In [37]:
mydict['price'] += 20

mydict['new_price'] = mydict.get('new_price', 100) + 20

mydict

{'name': 'pizza',
 'price': 120,
 'onions': True,
 'diameter': 42,
 'new_price': 120}

Удобство метода ```.get()``` заключается в том, что мы сами можем установить, какое значение будет возвращено, в случае, если пары с выбранным ключом нет в словаре. Так, вместо ```None``` мы можем вернуть строку ```Not found```, и ломаться ничего не будет:

In [38]:
print(mydict.get('souce'))
print(mydict.get('souce', 'Not Found'))

None
Not Found


В качестве значений в словаре также могут выступать, например, списки:

In [39]:
mydict['souces'] = ['bbq', 'ketchup']

print(mydict)

{'name': 'pizza', 'price': 120, 'onions': True, 'diameter': 42, 'new_price': 120, 'souces': ['bbq', 'ketchup']}


Нередко случается так, что нужно отсортировать словарь по его ключам или элементам. Проще всего это сделать следующим способом (лямбда-функции будут попозже):

In [40]:
mydict2 = {'one': 1, 
           'two': 2, 
           'three': 3, 
           'four': 4, 
           'five': 5}

print(sorted(mydict2.items(), key=lambda x: x[0]))
print(sorted(mydict2.items(), key=lambda x: x[1]))

[('five', 5), ('four', 4), ('one', 1), ('three', 3), ('two', 2)]
[('one', 1), ('two', 2), ('three', 3), ('four', 4), ('five', 5)]


## 4.4. Сеты

Чаще всего сеты используются для хранения уникальных элементов. Плюс, обращение к элементам сетов происходит за константное время ```O(1)```,  в то время как обращение к элементам списков происходит за личнейное время ```O(n)```. Иными словами, время, например, получения информации о присутствии того или иного элемента в сете не зависит от его величины. В случае со списком время обращения зависит от его длины.

На самом деле, обращение к элементам словаря тоже происходят за константное время :)

Такие вещи принято относить к типу хэш-таблиц (просто чтобы вы знали)

In [41]:
myset = set([1, 2, 3])
print(myset)

myset.add(4)
print(myset)

myset.add(2)
print(myset)

print(2 in myset)
print(7 in myset)

{1, 2, 3}
{1, 2, 3, 4}
{1, 2, 3, 4}
True
False


# 5. Условные операторы (if, else, elif)

В условных операторах можно выделить следующие ```if```, ```else``` и ```elif``` (else if). Данными операторами вы проверяете выполнение того или иного условия. После данных выражений (как и для циклов, функций и классов) ставится двоеточие и делается отступ на следующей строке 

In [42]:
a = 4
b = 2

if a > b:
    print('a is greater than b')

a is greater than b


In [43]:
a = 2
b = 4

if a > b:
    print('a is greater than b')
else:
    print('a is not greater than b')

a is not greater than b


In [44]:
a = 2
b = 2

if a > b:
    print('a is greater than b')
elif a < b:
    print('a is less than b')
else:
    print('a is equal to b')

a is equal to b


In [45]:
a = 3
mylist = [1, 2, 3, 4]

if a in mylist:
    print(f'index of a is {mylist.index(a)}')

index of a is 2


Посмотрим на логические переменные

In [46]:
flag = True

if flag == True:
    print(flag)
    
if flag:
    print(flag)
    
# Одно и то же

True
True


In [47]:
flag = False

if not flag:
    print(flag)
    
# Отрицание 

False


# 6. Циклы

## 6.1. For

Выведем элементы из списка

In [48]:
mylist = [0, 1, 2, 3, 4]

for i in mylist:
    print(i)

0
1
2
3
4


Выведем элементы из списка в обратном порядке

In [49]:
mylist = [0, 1, 2, 3, 4]

for i in mylist[::-1]:
    print(i)

4
3
2
1
0


Можем сделать то же самое при использовании функции ```range()```

In [50]:
for i in range(5):
    print(i)

0
1
2
3
4


Внутри циклов можно задавать условия. Так, например, мы можем вывести из списка только четные числа

In [51]:
mylist = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

for i in mylist:
    if i % 2 == 0:
        print(i)

2
4
6
8
10


Иногда случается так, что нужно работать в зависимости от длины списка и с индексами списка

In [52]:
for i in range(len(mylist)):
    print(mylist[i])

1
2
3
4
5
6
7
8
9
10


Чтобы не писать ```range(len(mylist))``` и потом не нагромождать код обращением к списку по индексу, можно использовать функцию ```enumerate()```

In [53]:
mylist = [5, 3, 1, 6, 10]

for i, number in enumerate(mylist):
    print(i, number)

0 5
1 3
2 1
3 6
4 10


Иногда возникает ситуация, когда нам нужно итерироваться параллельно по двум спискам. Тогда мы можем воспользоваться функцией ```zip()```

In [54]:
mylist = [5, 3, 2, 5]
mylist2 = ['Tom', 'Tim', 'Jack', 'Robert']

for i, j in zip(mylist, mylist2):
    print(i, j)

5 Tom
3 Tim
2 Jack
5 Robert


Если один из списков короче других, то итерация будет происходить только раз6 какова длина наименьшего списка

In [55]:
mylist = [5, 3, 2]
mylist2 = ['Tom', 'Tim', 'Jack', 'Robert']

for i, j in zip(mylist, mylist2):
    print(i, j)

5 Tom
3 Tim
2 Jack


При помощи ```for```-циклов можно писать так называемые каунтеры 

In [56]:
counter = 0

# посчитаем сколько элементов в списке от 0 до 19 деляется на 3 без остатка
for i in range(20):
    if i % 3 == 0:
        counter += 1
        
print(counter)

7


**List comprehension** также является достаточно полезной и часто используемой вещью

In [57]:
mylist = list(range(5))

mylist_squared = [i**2 for i in mylist]

for i, j in zip(mylist, mylist_squared):
    print(f'{i}^2 = {j}')

0^2 = 0
1^2 = 1
2^2 = 4
3^2 = 9
4^2 = 16


## 6.2. While

Такой тип цикла полезен тогда, когда мы хотим выйти из цикла при достижении какого-то условия

In [58]:
counter = 0

while counter < 5:
    print(counter)
    counter += 1    # Не забывайте проверять, что элемент, на котором построен цикл while, изменяется
                    # Иначе цикл может оказаться бесконечным

0
1
2
3
4


In [59]:
flag = True
counter = 0

while flag:
    if counter >= 4:
        flag = False    # Изменяем flag на False, чтобы выйти не заходить в цикл на следующей итерации
        print(counter)
    elif counter < 4:
        print(counter)
        counter += 1

0
1
2
3
4


# 7. Модули (импортирование библиотек)

Некоторые библиотеки среды программирования на основе Python не загружаются по умолчанию. Для того чтобы эти инструменты можно было использовать, необходимо импортировать модули, которые их содержат.

Один из подходов заключается в том, чтобы просто импортировать сам модуль:

In [60]:
import re

re.split('[a-z]+', '0a3B79', flags=re.IGNORECASE)

['0', '3', '79']

Здесь re — это название модуля, содержащего функции и константы для работы с регулярными выражениями. Импортировав таким способом весь модуль, можно обращаться к функциям, предваряя их префиксом re.

Если в коде переменная с именем re уже есть, то можно воспользоваться псевдонимом модуля:

In [61]:
import re as regex

regex.split('[a-z]+', '0a3B79', flags=regex.IGNORECASE)

['0', '3', '79']

Если из модуля нужно получить несколько конкретных объектов, то их можно импортировать в явном виде и использовать без ограничений:

In [62]:
from collections import defaultdict, Counter

lookup = defaultdict(int)
lookup['one'] = 1
lookup['two'] = 2
lookup['three'] = 3

mycounter = Counter([1, 2, 3, 1, 3, 5, 6, 6])

print(f'defaultdict: {lookup}')
print(f'counter: {mycounter}')

defaultdict: defaultdict(<class 'int'>, {'one': 1, 'two': 2, 'three': 3})
counter: Counter({1: 2, 3: 2, 6: 2, 2: 1, 5: 1})
