<p style="align: center;">
    <img align=center src="../img/dls_logo.jpg" width=500 height=500>
</p>

<h1 style="text-align: center;">
    <b>Физтех-Школа Прикладной математики и информатики (ФПМИ) МФТИ</b>
</h1>

---

<h2 style="text-align: center;">
    <b>Python. Занятие 1: Основы</b>
</h2>

<img align=center src="../img/python_logo.png" width=350>
<img align=center src="../img/jupyter_logo_wide.png" width=350>

---


Перед тем как начать складывать уровни нейросеточек как блинчики или предсказывать кредитоспособность клиентов, нужно быть хорошо знакомым с нужными библиотеками и языком, на котором они написаны. 
В нашем курсе мы будем использовать язык **Python**, так как он является оптимальным сочетанием простоты, силы и количества полезных библиотек, написанных для него. 

На этом занятии мы научимся писать программы на Python, изучив его основы.  

## Основы Python

 В нашем курсе мы будем писать на **Python 3**. Точная версия не принципиальна, но она должна быть >= 3.6  

Если вы пользуетесь каким-либо из дистрибутивов Linux, то Python скорее всего уже установлен.
Попробуйте в терминале следующие команды для запуска интерактивного режима работы:

```bash
python
```
или

```bash
python3
```

Выход из интерпретатора: `Ctrl+D` или `exit()`.

Режим работы, в котором выполнится код из файла `main.py`:

```bash
python main.py
```

Помощь: **`help(X)`**, где `X` — то, по чему нужна помощь.  
Выход из помощи: `q`.

<img align=center src="../img/python_ez.jpeg" width=400>

## Общая информация о языке

**Название** - **«Питон» или «Пайтон»** (в честь комедийных серий BBC «Летающий цирк Монти-Пайтона»)  
**Создатель** - **голландец Гвидо ван Россум (Guido van Rossum)** (в 1991 году)  

**Особенности**:  
- интерпретируемый
- объектно-ориентированный
- высокоуровневый язык
- встроенные высокоуровневые структуры данных
- динамическая типизация
- синтаксис прост в изучении
- поддержка модулей и пакетов (большинство библиотек
бесплатны)
- универсальный
- интеграция с другими языками (C (Cython), C++, Java (JPython))  

**Стиль оформления кода** - **PEP8** (если вы хороший человек).  

*Самое главное из PEP8:*  
- отступ – 4 пробела
- длина строки < 80 символов
- переменные: var_recommended
- константы: CONST_RECOMMENDED

In [None]:
import this

## Типы

**Все типы данных** в Python относятся к одной из **2-х категорий**: **изменяемые (mutable)** и **неизменяемые (immutable)**.   

*Неизменяемые объекты*:  
* числовые данные (int, float), 
* bool,
* NoneType,
* символьные строки (str), 
* кортежи (tuple),
* frozenset

*Изменяемые объекты*:  
* списки (list), 
* множества (set), 
* словари (dict).  

Вновь определяемые пользователем типы (классы) могут быть определены как неизменяемые или изменяемые. Изменяемость объектов определённого типа является принципиально важной характеристикой, определяющей, может ли объект такого типа **выступать в качестве ключа для словарей (dict)** или нет.

### int

**Целочисленный тип переменной в питоне**

Чтобы задать переменную, не нужно указывать ее тип - достаточно присвоить ей значение. При этом тип определится автоматически.

Давайте попробуем завести переменную, присвоить ей значение - целое число, и вывести на экран ее значение и тип (type):

In [None]:
x = 5

print(x, '|', type(x))

Как видно, тип получившейся переменной - int.

C int'овыми переменными можно производить стандартные матеатические операции - сложение, вычитание, умножение, деление, возведение в степень, взятие остатка при делении на число.

Деление переменных типа int бывает двух типов - целочисленное (с помощью символа //) и нецелочисленное (символ /). Результатом первого типа деления будет целое число, второго - дробное. 

In [None]:
a = 4 + 5
b = 4 * 5
c = 5 // 4
d = 5 / 4
e = 5 ** 4
f = 5 % 4

print(a, b, c, d, e, f)

In [None]:
print(-(5 // 4))

In [None]:
print(-5 // 4)

Также язык питон удобен в работе с большими числами:

Давайте попробуем положить в переменную число 5000000000000000000000000001:

In [None]:
x = 5 * 1000000000 * 1000000000 * 10**9 + 1
print(x, '|', type(x))

Как видите, все получилось: полученная переменная типа int и с ней можно работать как с обычными числами. Во многих других языках (например, С++) положить такое большое число в переменную бы не вышло - возникло бы переполнение.

### float

**Тип переменной для хранения дробных чисел в питоне**

In [None]:
y = 12.345

print(y, '|', type(y))

С этим типом также можно выполнять арифметические операции (даже целочисленное деление):

In [None]:
a = 4.2 + 5.1
b = 4.2 * 5.1
c = 5.0 / 4.0
d = 5.25 // 4.25
e = 5.25 ** 4.0

print(a, b, c, d, e)

### bool

**Логический тип переменной**

Переменная типа bool может принимать два значения: `True` и `False`.

In [None]:
a = True
b = False

print(a, '|', type(a))
print(b, '|', type(b))

У типа bool существует связь с типом int - переменная со значением True соответствует int'овой переменной со значением 1, а переменная со значением False - int'овой переменной со значением 0.

In [None]:
# класс bool наследуется от класса int
print(bool.mro())

Давайте в этом убедимся, попробовав сложить значения переменных a и b:

In [None]:
print(a + b)
print(a + a)
print(b + b)

Ну и просто приведем a и b к типу int:

In [None]:
print(int(a), int(b))

Логические "и", "или", "не" в питоне обозначаюся ключевыми словами `and`, `or`, `not` соответственно:

In [None]:
print(True and False)
print(True or True)
print(not False)

In [None]:
# в переменную a будет записан результат сравнения 2 и 3. т.е. False, потому что (2 == 3) неверно
a = (2 == 3)
b = (4 < 5)

print(a, '|', type(a))
print(b, '|', type(b))
print(a or (a and not b))

### None

Специальный тип в питоне, который обозначает *ничего*.

Его нельзя привести ни к одному другому типу языка. Проверить, является ли переменная param типом None, можно так:

```
if param is None
```

С первого взгляда может быть непонятно, зачем он нужен, но на самом деле это очень удобный тип. Например, если вы где-то в коде создаёте объект (базу данных, например), обращаясь к внешнему коду и хотите проверить, создалась ли ваша база данных, вы можете осуществить эту проверку, сравнив переменную базы данных с None. Примерно так:

```
database = MyDatabase(db_host, db_user, db_password, db_database)

if database is None:
```

In [None]:
z = None
print(z, '|', type(z))

Проверка переменной на None:

In [None]:
if z is None:
    z = 'I am None!'

### str

Тип переменной "строка". Нужен для хранения и выполнения операций с строками - наборами символов. В питоне строку можно задавать как с помощью одинарных кавычек, так и с помощью двойных, разницы нет (главное, чтобы в начале и конце одной строки стояли одинаковые кавычки):

In [None]:
x = "abc"
y = 'xyz'
z = '''qwe'''
w = """rty"""
print(x, '|', type(x))
print(y, '|', type(y))
print(z, '|', type(z))
print(w, '|', type(w))

Со строками тоже можно выполнять некоторые операции. Например, можно сложить две строки - тогда вторая припишется в конец первой:

In [None]:
a = 'Андрей'
b = "Михайлович"
s = a + " " + b
print(s)

Также у строк есть некоторое количество *методов*.

Метод - это название для функций, которые вызываются от объекта. Например, у нас есть объект `a` - строка, и у нее можно вызвать метод `.upper()`:

```
a.upper()
```

Методы делятся на те, которые изменяют сам объект, который их вызывает, и на те, которые возвращают результат, но не изменяют сам объект. 

Вот пример методов `.upper()` и `.lower()`, которые возвращают копию строки (не изменяя саму строку), от которой был вызван метод, приведенную к верхнему и нижнему регистру соответственно:

In [None]:
print(a.upper())
print(a.lower())

Можно получить длину строки с помощью функции `len`:

In [None]:
len(a)

Непустые строки являются "истинными", пустые - "ложными":

In [None]:
print(bool(a))
print(bool("" + ''))

Можно обращаться к отдельным элементам строки через индексы (индексация в питоне с 0):

In [None]:
print(a)
print(a[0])
print(a[1])
print(a[0:3])

А также можно получить **слайс** строки - часть строки с i-ого символа по j-ый с шагом k. Делается это следующим образом:

In [None]:
i, j, k = 0, 4, 2

print(a[i:j:k])

Можно проверять наличие подстроки в строке:

In [None]:
s = 'Я строка'
if 'Я' in s:
    print('Я строка, новая строка')

А вот изменять уже существующие строки нельзя:

In [None]:
s = 'Я строка'
s[0] = 'l'

Кодировки и тип `bytes`:

In [None]:
x = 'Роберт Дауни Младший'
print(x, type(x))
y = x.encode('utf-8')
print(y, type(y))
z = y.decode('utf-8')
print(z, type(z))
q = y.decode('cp1251')
print(q, type(q))

У строк наряду с методами `.upper()`, `.lower()` и остальными есть метод `.split()`, который часто бывает очень полезен. Этот метод делит строку на несколько по символу, который ему указываешь, и возвращает набор полученных строк (точнее, массив полученных строк - о том, что такое массив, ниже).

Если символ не указывать, строка делится по пробелам:

In [None]:
splitted_line = "Райгородский Андрей Михайлович".split()
print(splitted_line)
splitted_line = "Райгородский Андрей Михайлович".split(' ', maxsplit=1)
print(splitted_line)
splitted_line = "Райгородский Андрей Михайлович".split('й')
print(splitted_line)

`sep.join(iterable)` - возвращает строку, которая является конкатенацией строк из `iterable`. Разделитель между строками - строка `sep`:

In [None]:
str_array = ['a', 'b', 'c', 'd', 'e']

In [None]:
' '.join(str_array)

In [None]:
'!_and_!'.join(str_array)

### Поменять переменные местами

In [None]:
a = -5
b = 100

print(f'{a = }, {b = }')

# поменяли переменные местами в одну строчку
a, b = b, a

print(f'{a = }, {b = }')

### Немного про встроенные функции

В Python есть так называемые **магические** (или **специальные**) методы - они начинаются и заканчиваются на двойное нижнее подчёркивание: `__len__`, `__add__` и пр.

In [None]:
__builtin__

Также в Python есть **встроенные** функции и методы, которые являются в некотором смысле универсальными.  
Функция `dir()` выводит список всех атрибутов (имён - методы, функции, классы..), которые есть у модуля/класса/объекта:

Давайте посмотрим на встроенные и служебные имена Python (не все):

In [None]:
dir(__builtin__)

---

### Задание 1

Выведите список атрибутов класса Exception.

In [None]:
dir(Exception)

---

### Полезно

- При вызове метода какого-то класса (или функции какого-то модуля) можно написать его имя и через точку нажать **tab**:  

```
<имя_объекта_класса(модуля)>.[tab]  
```

Тогда всплывёт меню, в котором можно выбрать из всех существующих в этом классе методов (функций модуля).

In [None]:
__builtin__.

- Получение быстрой справки (аналогично `help()`) для любого объекта Python:

In [None]:
?__builtin__

### Структуры данных и встроенные функции

### list

Вот мы и добрались до типов языка python, которые представляют собой *контейнеры*, то есть, это типы данных, которые являют собой хранилища для других типов данных.

Один из таких типов - `list` (**массив, список, лист**). Это контейнер, куда можно положить сколько угодно других переменных, значений, и эти переменные даже могут быть разных типов и даже также могут быть контейнерами!

Чтобы задать list, надо в квадратные скобки `[]` положить нужные элементы. Пустые скобки задают пустой list. Пустой лист также можно задать, написав `list()`:

In [None]:
a = list()
b = []

print(a, '|', type(a))
print(b, '|', type(b))
print(a == b)

In [None]:
my_list = ['string', 100, 5.678, None, ['a', 1, 100.500]]
my_list

По индексам можно получить доступ к элементам массива (индексация, как обычно, с 0):

In [None]:
my_list[1]

In [None]:
my_list[-1]

* `slice` - это объект языка Python, позволяющий получить какую-то часть итерируемого объекта.  
Пример:

In [None]:
foo = list(range(10))
foo

In [None]:
foo[:5]

In [None]:
foo[5:]

In [None]:
foo[2:5]

In [None]:
slice_2_5 = slice(2, 5)
print(slice_2_5, '|', type(slice_2_5))

In [None]:
foo[slice_2_5]

Можно еще сложнее: получить каждый k-й элемент массива c, начиная с элемента с индексом i (включительно) и заканчивая элементом с индексом j (не включительно):

In [None]:
bar = foo[1:7:2]
print(bar)

Можем перевернуть список:

In [None]:
foo[::-1]

Элементы массива также можно изменять, обращаясь к ним по индексу или слайсу:

In [None]:
print(foo)
foo[0] = 100500
print(foo)

In [None]:
# вместо 2, 3 и 4 элементов массива запишем  число 80
foo[2:5] = [80]
print(foo)
# вместо 2, 3 и 4 элементов массива запишем  числа 80, 90
foo[2:5] = [80, 90]
print(foo)

Можно проверять принадлежность элемента массиву:

In [None]:
5 in foo

In [None]:
if 3 in foo:
    print("element 3 is in foo")

Также массивы можно складывать. Результатом сложения двух массивов будет новый массив, в котором сначала будут записаны элементы первого массива, затем - второго:

In [None]:
bar = [9, 0]
foo + bar

А вот вычитать нельзя:

In [None]:
foo - bar

### Методы класса list

In [None]:
dir(list)

`L.append(element)` - добавляет элемент `element` в список `L`:

In [None]:
l = [4, 5, 1, 3, 2]

l.append('BANG!')
l

`sorted(iterable, key)` - возвращает объект, являющийся отсортированной по ключу `key` версией объекта `iterable`. **НЕ изменяет начальный объект!**

In [None]:
print(sorted(l), '|', l)

Удалить элемент с конца массива:

In [None]:
l.pop()

In [None]:
print(sorted(l), '|', l)

In [None]:
def cmp(string):
    return len(string)

In [None]:
names = ['Александр', 'Василий', 'Анастасия', 'Соня', 'Френк', 'Оля']
sorted(names, key=cmp)

In [None]:
# то же самое с помощью лямбды
sorted(names, key=lambda x: len(x))

In [None]:
names

`L.sort(key)` - сортирует лист L в соответствии с компаратором (по ключу) key. **Изменяет начальный объект!**

In [None]:
l = [1, 2, 3, 4, 5]

l.append('BANG!')
l

l.sort()

In [None]:
l.pop()

In [None]:
l

In [None]:
l.sort(reverse=True)
l

`L.count(element)` - возвращает количество вхождений элемента `element` в список `L`

In [None]:
l.count(1)

In [None]:
l.count('padabum')

С помощью `len()` можно получить размер листа (и вообще любого `iterable` объекта):

In [None]:
len(l)

`L.index(element)` - возвращает индекс элемента `element` в списке `L`, если он там присутствует, иначе выбрасывает исключение `ValueError`

In [None]:
l.index(3)

In [None]:
l.index('qwe')

---

### Задание 2

Напишите код, который проверяет, является ли переменная x строкой, и если да, то если в строке больше одного слова (слово - последовательность подряд идущих символов без пробелов), то выводит на экран количество слов в этой строке и сами слова в алфавитном порядке

In [None]:
x = input()

if type(x) is str:
    words = x.split(' ')
    if (words_cnt := len(words)) > 1:
        print(words_cnt)
        print(sorted(words))

---

### Задание 3

Напишите код, который все элементы массива x с **нечетными** индексами переставит в обратном порядке.

Т.е. если x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9], то код должен получать [0, 9, 2, 7, 4, 5, 6, 3, 8, 1]

In [None]:
x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

x[1::2] = reversed(x[1::2])
print(x)

---

### Задание 4

1. Даны два списка одинаковых размеров из одинаковых элементов:  
```
items = [1 5 6 9 8 7 2 3 4]
shuffled_items = [2 3 4 1 6 5 7 9 8]
``` 

2. Расставьте элементы (с помощью функции `sort()`) в списке `items` так, чтобы получился список `shuffled_items`  

In [None]:
items = [1, 5, 6, 9, 8, 7, 2, 3, 4]
shuffled_items = [2, 3, 4, 1, 6, 5, 7, 9, 8]

print(items, '|', sorted(items, key=lambda x: shuffled_items.index(x)))

---

### tuple

**Кортеж**

Этот тип данных очень похож на list, имеет ту же структуру, но отличается тем, что он неизменяемый.

Это нужно, например, чтобы `tuple` мог выступать в качестве ключей словаря (о них ниже). list в качестве ключей словаря выступать не может.

Задать tuple можно круглыми скобками:

In [None]:
t = ('a', 5, 12.345)
print(t, '|', type(t))

tuple нельзя изменять, давайте в этом убедимся:

In [None]:
t.append(5)

In [None]:
t[0] = 9

Но получать элементы по индексу и слайсам, конечно, можно (tuple же iterable):

In [None]:
print(t[2])
print(t.index(5))
print(t[:2])

Как и list, кортежи можно складывать и работает сложение так же, как в list (вообще, с кортежами можно делать все, что можно делать с list, если это не изменяет кортеж).

In [None]:
m = (1, 2, 3)
# складывать
print(t + m)
# узнать размер 
print(len(t))
# проверить наличие элемента
print(5 in t)

### Циклы - for и while

iterable стректуры данных так называются, потому что по ним можно *итерироваться* - последовательно получать значения последовательных элементов этой структуры данных. Итерироваться можно с помощью циклов `for` или `while`.

Синтаксис следующий:

```
for element in iterable:
    <code>
```

Здесь каждую новую итерацию цикла в element будет записываться очередное значение из контейнера iterable и с ним можно будет работать внутри тела цикла (`code`). Когда код внутри тела цикла отработает, начнется новая итерация цикла - в переменную element запишется следующее значение из iterable и опять будет выполняться code.

Посмотрим на примере:

In [None]:
# создадим list элементов
models = ['decision tree', 'linear model', 'svm', 'ensemble']

# итерируемся по названиям модели: каждую итерацию цикла в переменную model будет
# записываться новое значение из models и оно будет использоваться для print(model)
for model in models:
    # тело цикла, здесь с отступом в 4 пробела нужно описать код, который будет выполняться на каждой итерации цикла
    print(model)
    
# этот код уже будет выполняться ПОСЛЕ цикла, потому что он записан без отступа в 4 пробела после for
print("Done")

Заметим, что каждую итерацию цикла в переменную model **копируется** очередное значение из models. Это значит, что если вы внутри цикла измените переменную model, соответствующее значение в массиве models изменено **не будет**.

Синтаксис `while`:

```
while <условие (булевское выражение)>:
    <code>
```

Здесь код, написанный вместо `code` будет выполняться каждую итерацию цикла, пока условие после `while` будет выполняться.

Посмотрим на примере: напишем цикл, в котором будем выводить переменную x и увеличивать x на 1, пока x не станет больше 10:

In [None]:
x = 1

while x <= 10:
    print(x)
    # более удобный способ записи x = x + 1
    x += 1

Иногда бывает нужно прервать выполнение цикла при выполнении какого-то условия

Например, мы хотим итерироваться по массиву строк, на каждой итерации выводить строку на экран и прервать цико (перестать выводить строки), если мы встретили строку stop.

Это делается с помощью ключевого слова `break`:

In [None]:
mas = ['stroka1', 'stroka2', 'stroka3', 'stop', 'stroka4']

for s in mas:
    if s == 'stop':
        break
    print(s)

Иногда же хочется не прервать выполнение всего цикла, а прервать выполнение именно одной итерации цикла и продолжить цикл со следующей итерации.

Например, мы так же, как в предыдущем примере, хотим итерироваться по массиву строк и выводить строку на каждой итерации на экран, но не хотим выводить строку на экран, если эта строка равна 'null'.

Это делается с помощью ключевого слова `continue`:

In [None]:
mas = ['stroka1', 'null', 'stroka3', 'stop', 'null']

for s in mas:
    if s == 'null':
        continue
    print(s)

### range

Для работы с циклами в питоне есть очень полезная функция `range()`. Допустим, вы хотите написать цикл, который бы отработал 100 раз. Можно сделать это следующим образом:

```
i = 0
while i < 100:
    i += 1
    <code>
```

но это неудобно: нужно завести вспомогательную переменную i, написать лишние 2 строчки кода (i=0 и i+=1). Так код терядет в понятности и читабельности. Гораздо проще записать этот цикл с помощью range.

`range()` принимает 3 аргумента: начало интервала begin, конец интервала end и шаг step, с которым будет двигаться по игтервалу, и возвращает iterable объект -- по сути, массив чисел начиная с begin включительно, заканчивая end не включительно, числа в массиве идут с шагом step.

Посмотрим на пример:

In [None]:
r = range(1, 100, 10)
print(r)
print(list(r))

Теперь легко записать цикл:

In [None]:
for i in range(1, 20, 3):
    print(i)

Если у range не указывать последний алгумент step, он по умолчанию будет 1:

In [None]:
list(range(4, 8))

А если указать всего один аргумент, то range выдаст iterable с началом в 0 и концом в этом аргументе:

In [None]:
list(range(8))

С помощью range нетрудно переписать цикл, который мы писали выше, где итерировались по названиям моделей, так, чтобы элементы массива models  можно было изменять внутри цикла:

In [None]:
# создадим list элементов
models = ['decision tree', 'linear model', 'svm', 'ensemble']

# итерируемся по индексам массива models
for i in range(len(models)):
    # тут если вы поменяете models[i], то значение в models тоже изменится
    print(models[i])
    
# этот код уже будет выполняться ПОСЛЕ цикла, потому что он записан без отступа в 4 пробела после for:
print("Done")

---

### Задание 5

Напишите цикл, который выводит все числа от 0 до 500, делящиеся на 7, если в них есть цифра 8

*Подсказка*: переменную типа int можно привести к типу str:
```
x = 5
y = str(x)
```

In [None]:
for i in range(500):
    if i % 7 == 0 and '8' in str(i):
        print(i)

---

### enumerate, zip

`zip()` принимает два iterable аргумента и возвращает iterable из пар соответствующих элементов этих двух iterable:

In [None]:
first = 'a b c d e f g'.split(' ')
second = '1 2 3 4 5 6 7'.split(' ')

zip(first, second)

In [None]:
list(zip(first, second))

Что будет, если один из объектов короче, чем другой:

In [None]:
first = 'a b c d e f g'.split(' ')
second = '1 2 3 4 5'.split(' ')

list(zip(first, second))

Это опять же полезно для использования в циклах:

In [None]:
models = ['decision tree', 'linear model', 'svm', 'ensemble']

# zip возвращает пару элементов, которые можно записать в 2 разные переменные в цикле for
# например, здесь мы записываем первый элемент пары в num, второй - в model
for num, model in zip(range(len(models)), models):
    print(str(num + 1) + "'s model is:", model)

Однако в этом коде мы хотели просто пронумеровать элементы списка models, но нам для этого пришлось писать `zip(range(...))`

Именно для такого случая, когда надо пронумервать элементы какого-то iterable, существует функция `enumerate`:

`enumerate(iterable)` возвращает пары номер-элемент iterable:

In [None]:
models = ['decision tree', 'linear model', 'svm', 'ensemble']

# enumerate возвращает пару элементов, которые можно записать в 2 разные переменные в цикле for
# например, здесь мы записываем первый элемент пары в num, второй -- в model
for num, model in enumerate(models):
    print(str(num + 1) + "\'s model is:", model)

In [None]:
methods = dir(__builtin__)

for num, method in enumerate(methods):
    if num % 5 == 0:
        print(num, method)

In [None]:
enum = enumerate(first)
list(enum)

In [None]:
enum = enumerate(first)
zip_style = zip(range(len(first)), first)

print(list(enum) == list(zip_style))

---

### Задание 6

1. Создайте список `a`, состоящий из каких-то элементов.
2. Создайте список `b` такого же размера, как `a`, состоящий из каких-то элементов.
3. Выведите нумерованный список пар из элементов списков `a` и `b`.

In [None]:
import pprint

first = 'a b c d e f g'.split(' ')
second = '1 2 3 4 5 6 7'.split(' ')
pprint.pprint(list(enumerate(zip(first, second))))

---

### list comprehensions

In [None]:
a = [x for x in range(1, 6)]
a

In [None]:
def f(x):
    return x ** 2

In [None]:
b = [f(x) for x in range(1, 10)]
c = [x ** 2 for x in range(1, 10)]

print(b == c)
print(b)

In [None]:
[x if x in 'aeiou' else '*' for x in 'apple']

In [None]:
def foo(i):
    return i, i + 1

l = []
for i in range(3):
    for x in foo(i):
        l.append(str(x))
        
l

In [None]:
l = [str(x) for i in range(3) for x in foo(i)]
l

---

### Задание 7

*Выведите* список из 100 чисел *через запятую*. **Чистыми циклами пользоваться нельзя** (list comprehensions можно).

In [None]:
print(*range(100), sep=', ')

---

### functions, lambdas

In [None]:
def make_coffee(size, sugar_dose=3, **kwargs):
    if sugar_dose > 5:
        return 'Too much sugar! Be careful! :('
    else:
        return f'Done: cup of {size} ml size; amount of sugar = {sugar_dose}'

In [None]:
make_coffee(100)

In [None]:
make_coffee(200, 1)

In [None]:
make_coffee(100, 6)

In [None]:
make_coffee(120, 5, name='Ilya', gender='male')

In [None]:
negation = lambda x: -x
a = 5
print(negation(a))

### map, reduce, filter

`map(func, iterables)` - выполняет преобразование func над элементами iterables и возвращает **новый** `iterable`:

In [None]:
words = dir(list)

In [None]:
letter_counts = list(map(lambda x: len(x), words))

print(letter_counts)
print()
print(words)

In [None]:
l1 = [1, 2, 3, 4]
l2 = [11, 12, 13, 14, 15]
l3 = [101, 102, 103]

triple_sum = list(map(lambda x, y, z: x + y + z, l1, l2, l3))
print(triple_sum)

`reduce(func, iterables)` - производит вычисление с элементами последовательности, результатом которого является **одно значение**:

In [None]:
from functools import reduce

In [None]:
sum_of_counts = reduce(lambda x, y: x + y, letter_counts)
print(sum_of_counts)

`filter(predicate, iterable)` - оставляет только те элементы, для которых **верен** предикат (функция, возвращающая bool):

In [None]:
mixed = ['мак', 'просо', 'мак', 'мак', 'просо', 'мак', 'просо', 'просо', 'просо', 'мак']
only_mac = list(filter(lambda x: x == 'мак', mixed))
print(only_mac)

---

### Задание 8

1. Дан массив строк:

```
['agfkd.,f', 'Qksdf;sb&..', 'asdoo*', 'bgf...d', 're54()kj[]].']
```

2. Создайте список, состоящий из количества точек в каждой строке. Выведите его
3. Создайте новый список, в котором будут **только строки, в которых более 2-х точек**. Выведите его  

Циклами пользоваться нельзя.

In [None]:
a = ['agfkd.,f', 'Qksdf;sb&..', 'asdoo*', 'bgf...d', 're54()kj[]].']
print(*a)
b = list(map(lambda x: x.count('.'), a))
print(*b)
c = list(filter(lambda x: x.count('.') > 2, a))
print(*c)

---

### set

**Множество** - это массив, в котором элементы не могут повторяться (то есть, как и в математическом определении множества).

Внутри языка множество устроено совсем не так, как массив или кортеж, элементы множества хранятся не последовательно, поэтому к элементам множества нельзя обрашаться по индексу.

Пустое множество можно создать с помощью set():

In [None]:
s = set()
print(s, '|', type(s))

А можно создать множество из списка:

In [None]:
s = set([5, 2, 3, 2])
s

Можно добавлять элементы в множество с помощью метода `.add()`:

In [None]:
s.add(1)
s.add('a')
s.add(None)
s.add('bullet')
print(s)

In [None]:
s1 = set(range(0, 10))
s2 = set(range(5, 15))

Метод `.difference()` (или оператор `-`) позволяет получить элементы, которые есть в одном множестве, но нет в другом:

In [None]:
print(s1 - s2, '|', s1.difference(s2))
print(s2 - s1, '|', s2.difference(s1))

In [None]:
# пересечение множеств s1 и s2 можно записать двумя способами
print(s1 & s2, '|', s1.intersection(s2))

In [None]:
# объединение множеств s1 и s2 тоже можно записать двумя способами
print(s1 | s2, '|', s1.union(s2))

Из множества можно удалить элемент по значению:

In [None]:
s1

In [None]:
s1.discard(0)
s1

### dict

**Словарь** (**ассоциативный массив)** - это структура данных, которая представляет отображение из одного типа данных в другой. Представляет собой набор пар ключ-значение, в качестве ключа могут выступать хешируемые типы данных (`int`, `str`, `tuple`, ...).

Массивы, которые мы до этого рассматривали, были отображением непрерывного отрезка [0, n] в другой тип данных. `dict` может быть гораздо удобнее, когда нужно использовать в качестве ключа другой тип данных (например, сопоставить именам людей (`str`) их даты рождения) или когда в качестве ключа хочется использовать int, но не все значения из промежутка [0, n] нужны. Например, если хочется сопоставить года рождения великих писателей их именам. 

Пустой словарь можно создать либо с помощью `{}`, либо с `dict()`:

In [None]:
d = {}
dd = dict()

print(d == dd, '|', type(d))

Добавим значение value по ключу key в словарь:

In [None]:
key = 'a'
value = 100

d[key] = value
d

Непустой словарь можно создать несколькими способами:

In [None]:
d = dict(short='dict', long='dictionary')
d

In [None]:
d = dict(short='dict', long='dictionary')
d

In [None]:
d = dict([(1, 1), (2, 4)])
d

Создать словарь с ключами из списка и значениями None:

In [None]:
d = dict.fromkeys(['a', 'b'])
d

Создать словарь с ключами из списка и значениями по умолчанию 100:

In [None]:
d = dict.fromkeys(['a', 'b'], 100)
d

**dict comprehensions**

Еще один способ объявления словаря: создадим словарь, где каждому целому числу от 0 до 6 поставим в соответствие квадрат этого числа:

In [None]:
d = {a: a ** 2 for a in range(7)}
d

### !

Будьте осторожны, если ключа, по которому поступил запрос, нет в словаре, то выбросит исключение:

In [None]:
d = {1: 100, 2: 200, 3: 300}
d['a']

Поэтому безопаснее использовать ``get(key)``. Тогда, если нужно, можно проверить на ``None``. 

In [None]:
d.get(1)

In [None]:
d.get('a') == None

Самое часто используемое - получение ключей, получение значений и получение всего вместе:

In [None]:
print(d.keys(), '|', type(d.keys()))

print(list(d.keys()))

In [None]:
print(d.values(), '|', type(d.values()))

print(list(d.values()))

In [None]:
print(d.items(), '|', type(d.items()))

print(list(d.items()))

---

### Задание 9
Дан массив строк `mas`. Одной строкой создайте словарь, в котором по ключу строки будет записана пара (кортеж длины 2) (индекс строки в массиве mas, длина строки).

In [None]:
mas = ['a', 'b', '42', 'qwerty', 'None']

d = {s: (i, len(s)) for i, s in enumerate(mas)}
d

---

### modules

**Модули** - это "библиотеки" Python. То есть это самостоятельные, объединённые технически и логически, именованные части Python кода

Можно рассматривать их как код, функции, записанные в других файлах (модулях), и чтобы использовать их в своем коде, нужно подключить эти файлы (модули).

О модулях необходимо знать только одно - как их импортировать:

In [None]:
import collections

Импортировать только какой-то компонент из модуля:

In [None]:
from collections import Counter

Импортировать с другим именем (чаще всего используется для лаконичности кода):

In [None]:
import collections as cool_lib

In [None]:
count = cool_lib.Counter()

Жизненный пример:

In [None]:
import numpy as np

### files

In [None]:
!echo 'first\nsecond\nthird' > text
!cat text

In [None]:
path = './text'

In [None]:
file = open(path, mode='r')
print([line for line in file][0])
file.close()

| Режим | Обозначение |
|-------|-------------|
| **'r'**  | Открытие на **чтение** (является значением по умолчанию) |
| **'rb'** | Открытие на **чтение**, в предположении, что будут считываться **байты** |
| **'w'** | Открытие на **запись**, содержимое файла удаляется. Если файла не существует, создается новый |
| **'wb**' | Открытие на **запись байтов**, содержимое файла удаляется. Если файла не существует, создается новый |
| **'a'** | Открытие на **дозапись**, информация добавляется **в конец файла** |
| **'r+'** | Открыть файл на **чтение И запись**. Если файла нет, **новый НЕ создаётся** |
| **'a+'** | Открыть файл на **чтение И запись в конец файла**. Если файла нет, **новый создаётся** |
| **'t'** | Открытие файла **как текстового** (по умолчанию) |

In [None]:
with open(path, mode='r') as test_file:
    for line in test_file:
        print(line)

In [None]:
!rm text

### classes

In [None]:
class Human:
    def __init__(self, name='', age=None, deep_learning_specialist=False):
        self.name = name
        self.age = age
        self.deep_learning_specialist = deep_learning_specialist
    
    def set_age(self, age):
        self.age = age
    
    def get_age(self):
        return self.age
    
    def __str__(self):
        return f'Name: {self.name}\n' \
               f'Age: {self.age}\n' \
               f'Is deep learning specialist: {self.deep_learning_specialist}'

class DLSchoolStudent(Human):
    def __init__(self, name='', age=None, deep_learning_specialist=False):
        super().__init__(name, age, deep_learning_specialist)
        self.total_grade = None
        self.deep_learning_specialist = True
    
    def __str__(self):
        return super().__str__()

In [None]:
human = Human('Person', 17)
print(human)

In [None]:
student = DLSchoolStudent('Good Person', 18)
print(student)

### exceptions

In [None]:
dir(__builtin__)

In [None]:
raise KeyboardInterrupt()

In [None]:
my_dict = {1: 100, 2: 200}
print(my_dict['NEW'])

In [None]:
try:
    my_dict = {1: 100, 2: 200}
    print(my_dict['NEW'])
except KeyError:
    print('Caught KeyError!')

### Полезные библиотеки Python

### glob

In [None]:
import glob

In [None]:
!ls

In [None]:
glob.glob('./[0-9].*')

In [None]:
glob.glob('*.ipynb')

In [None]:
glob.glob('img/p*')

In [None]:
glob.glob('./**/', recursive=True)

In [None]:
glob.glob('**/*.png', recursive=True)

### tqdm

Устанавливаем виджеты:

```
pip install ipywidgets
```  

или

```
conda install -c conda-forge ipywidgets
```

Разрешаем их использование в Jupyter Notebook:  

```
jupyter nbextension enable --py --sys-prefix widgetsnbextension
```  

Перезагружаем ядро (Restart Kernel)  


Устанавливаем tqdm:  

```
pip install tqdm
```  

или

```
conda install -c conda-forge tqdm
```  

Больше про tqdm: https://pypi.python.org/pypi/tqdm

In [None]:
from tqdm import tqdm, notebook
from time import sleep

In [None]:
cnt = 0
for i in tqdm(range(1000)):
    sleep(0.005)
    cnt += 1

In [None]:
for i in notebook.trange(10, desc='1st loop'):
    for j in notebook.tqdm(range(100), desc='2nd loop', leave=False):
        sleep(0.005)

### collections

`defaultdict()` - класс словаря, у которого есть значение по умолчанию, порой очень пригождается:

In [None]:
from collections import defaultdict

In [None]:
d = defaultdict(int)

print(d['key'])
d['key'] = 5
print(d['key'])

In [None]:
d = defaultdict(lambda: 'empty')

print(d['key'])
d['key'] = 'full'
print(d['key'])

In [None]:
d = defaultdict(list)
print(d)

d['list1'].append(100)
d['list1'].append(200)
print(d)
print(d['list1'])

`Counter()` - класс словаря, предназначенного для счётчиков. По сути, `== defaultdict(int)`:

In [None]:
from collections import Counter

In [None]:
counter = Counter()

for word in dir(__builtin__):
    for letter in word:
        counter[letter] += 1  # или .update(letter)
    
print(counter)

---

### Задание 10

1. Создайте словарь счётчиков
2. Создайте переменную, в которую сохраните все пути к нужным текстовым файлам (расположены по адресу `'./txt/'`)
3. Для каждого текста (текстового файла) посчитайте сколько каждое слово (из этого текста) встретилось в этом тексте (используйте предыдущие пункты)

In [None]:
counter = Counter()
filenames = glob.glob('./txt/*')

for name in filenames:
    with open(name, 'r') as file:
        for line in file:
            counter.update(line.split())

print(counter)

---

То, что Вы реализовали выше, есть ни что иное, как простая реализация **bag-of-words (мешок слов)** для корпуса из 3 документов.

Мы познакомились языком Python. Дальше нас ждёт знакомство с библиотеками **NumPy, SciPy** и **Matplotlib**, часто используемыми в анализе данных.  

## Список материалов для самостоятельного изучения

* *Сайт языка Python* - https://www.python.org/
* *Курс Python с нуля, можно выполнять задания в интерактивном режиме* - http://pythontutor.ru/
* *Новый онлайн-курс по Питону на Coursera от Mail.Ru Group* - https://www.coursera.org/learn/programming-in-python
* *Самоучитель Python* - https://pythonworld.ru/samouchitel-python
* *Статья про коварности Python* - https://habrahabr.ru/company/mailru/blog/337364/
* *Очень полезные трюки в Jupyter Notebook*: https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/

## Домашнее задание (необязательное)

- Всем прорешать этот ноутбук (сделать все  6 заданий)
- Для тех, кто только начал знакомиться с Python: вторая ссылка выше - сделать как можно больше заданий 
- Для тех, кто "я уже всё знаю (наверное)": пятая и шестая ссылки выше (познакомиться с **jupyter notebook**, если не владеете)  
- Для тех, кто "я уже точно всё знаю про Python": пора идти работать Python-разработчиком