---
# Python
---

- [binder](https://mybinder.org/): поделится интерактивным jupyter файлом
- [nbviewer](https://nbviewer.jupyter.org/): поделится статичным jupyter файлом

## 1. Объекты в Python

**Объект** — абстракция для данных (контейнер в памяти, который содержит данные). Напр: числа, строки, списки и т.д. Данные в Python представлены объектами и отношениями между ними. Любой объект в Python имеет:

### 1.1. Идентификатор

**Идентификатор** — адрес объекта в памяти (целое число). Позволяет в любой момент времени отличить один объект от другого (нельзя изменить после создания объекта). Оператор присваивания `x = y` запоминает за переменной слева идентификатор объекта справа (переменная же — это ссылка на идентификатор).

<img src="data/objects.png" width="400" title="vars_id's_obj">

Примеры:
1. `x = 4` создаёт объект для 4, а затем связывает x c идентификатором объекта 4 (x ссылается на объект 4).
2. `x = y` получает идентификатор y и связывает x c идентификатором объекта y.

**Замечание**: простые объекты (маленькие числа, короткие строки, True, False и т.д.) для оптимизации работы представлены в памяти как неизменяемые объекты и, следовательно, имеют постоянный id. При этом большие числа и строки даже при одном и том же значении уже будут иметь разный id.

In [7]:
x = [1, 2 , 3]
print(id(x))
print(id([1, 2, 3]))   # разные объекты, следовательно разные id

2020398677960
2020398070088


In [8]:
x = [1, 2, 3]
y = x
print(y is x)          # разные переменные, но тот же объект
print(y is [1, 2, 3])  # разные объекты
x.append(4)
print(x, y)

True
False
[1, 2, 3, 4] [1, 2, 3, 4]


In [11]:
print(id(1), id(2))
a, b = 1, 2
print(id(a), id(b))    # те же id, что и у 1 и 2
c = a + a
print(id(c))           # тот же id, что и у 2
print(b is c)

140726998770064 140726998770096
140726998770064 140726998770096
140726998770096
True


In [12]:
x = [1, 2, 3]
y = x
y.append(4)            # x и y разные переменные, но они ссылаются на один и тот же объект
s = "123"
t = s
t = t + "4"            # конкатенацией создаётся новый объект для t
print(str(x) + " " + s)

[1, 2, 3, 4] 123


### 1.2. Тип

- определяет, что можно делать с объектом (т.е. его поведение)
- определяет возможные принимаемые значения
- нельзя изменить после создания

In [17]:
print(type([1, 2, 3]), type(1), type(type(1)))

<class 'list'> <class 'int'> <class 'type'>


### 1.3. Значение

- **изменяемые объекты** (mutable objects)
- **неизменяемые объекты** (immutable objects)

| Immutable types       | Mutable types       |
| ----------------------|---------------------|
| int, float, complex   | list                |
| bool                  | dictionary          |
| tuple                 | set                 |
| string                | function            |
| frozen set            |                     |
| NoneType              |                     |
| TypeType              |                     |
| etc.                  | etc.                |

In [22]:
a = 5
b = 6
print(id(a), id(b))
a = a + b
print(id(a))           # a = a + b создаст новый объект для a, потому что int неизменяемый тип

140726998770192 140726998770224
140726998770384


Найти число разных объектов в списке:

In [25]:
#

5


---
## 2. Функции в Python

### 2.1. Плюсы использования функций
- уменьшение кода (за счёт переиспользования)
- структурирование кода (легче читать и сложнее допустить ошибку)
- сокрытие деталей реализации (можно использовать, не зная как работает)

Функции в Python интерпретируются целиком, а не построчно; функции также являются объектами.

In [17]:
def list_sum(lst):
    result = 0
    for element in lst:
        result += element
    return result

print(type(list_sum), id(list_sum))

<class 'function'> 2030953462952


### 2.2. Стек вызовов

**Стек** — абстрактная структура данных. Push — оперция добавленния данных в стек, Pop — взятия данных со стека

**Стек вызовов** (машинный стек или стек исполнения) — стек функций, которые были вызваны. Функция кладётся на стек при её вызове, и снимается с него при завершении её выполнения. 

- стек вызовов отображает все функции, которые исполняются в данный момент и их очередность вызова.
- интерпретатор всегда выполняет самую верхнюю функцию на стеке
- module: функция в самом низу стека (исполняет запросы)
- стек используется из-за простоты реализации в оперативной памяти

| func_n |
|--------|
| ...    |
| func_2 |
| func_1 |
| module |

Визуализировать выполнение кода пошагово:
http://www.pythontutor.com/visualize.html#mode=edit

### 2.3. Параметры функций

- могут быть позиционными или именованными
- могут иметь значения по умолчанию
- могут быть списками, кортежами или словарями

Порядок следования параметров: позиционные, позиционные со значением по умолчанию, список (или кортеж) позиционных, именованные, словарь именованных. `def func(a, b, c=1, *ls, p1=1, p2=2, **dict):` (нужно учитывать его при вызове!)

In [22]:
def print_1(a, b, *args):
    print('a, b: ', a, b)
    print('args: ', *args)
    print()
    
def print_2(a, b, **args):
    print('a, b: ', a, b)
    for key in args: print(key, args[key])
    print()

print_1(1, 2, 10, 20, 30)
print_2(1, 2, x='10', y='20', z='30')
print_2(1, x='10', y='20', z='30', b=2)

a, b:  1 2
args:  10 20 30

a, b:  1 2
x 10
y 20
z 30

a, b:  1 2
x 10
y 20
z 30



In [27]:
#

enter n and k:  10 5


252


### 2.4. Пространства имён и области видимости

**Пространство имён** (namespace) — множество ссылок от всех имён (переменных, функций, классов) до объектов в оперативной памяти.

Создаётся:
- при запуске интерпретатора (**builtins**: все стандартные типы, переменные и функции; **main**: все имена, которые были объявлены на верхнем уровне кода)
- при вызове функций (удаляется после выполнения)

При чтении кода имена ищутся в пространствах имён в той последовательности, в которой соответствующие им функции лежат в стеке (это позволяет использовать одни и те же имена в разных частях программы).

| namespace_n |
|-------------|
|  ...        |
| namespace_2 |
| namespace_1 |
| globals     |
| buitins     |

**Область видимости** (scope) — текстовая область программы, в которой локальное пространство имён доступно напрямую.
- статичны, зависят лишь от написанного кода, не зависят от исполнения программы
- в процессе исполнения программы локальным областям видимости соответствуют локальные пространства имён этих функций 
- весь код можно покрыть областями видимости (одни будут включать в себя другие)

При выполнении функции весь код всегда можно разбить на 4 области видимости:
1. локальная (соответствует локальному пространству имён) 
2. закрывающие (до глобальной области)
3. глобальная
4. соответствующая builtins

При выполнении программы поиск имён осуществляется последовательно по пространствам имён соответствующим **local — enclosing — global — builtins** областям видимости.

In [31]:
def b():                                #
    x = 10                   #          #
    def a():                 # b scope  #
        print(x)  # a scope  #          #
    a()                      #          #
                                        # global scope
                                        #
def c():                                #
    None                     # c scope  #  
                                        #
x = 1                                   #

# т.е. например, при вызове print(x) в a() итерпретатор ищет:
# имя print в пространствах имён a(), b(), global, builtins (в таком порядке)
# затем имя x в пространствах имён a(), b()

**Исключение**: пространства имён не создаются при использовании условных операторов и циклов (работают в текущих пространствах имён).

In [33]:
for i in range(5): None
print(i)

4


Иногда из тела функции необходимо изменить глобальные переменные (или переменные функции закрывающей области видимости), для этого используют конструкции `global` и `nonlocal`.

In [39]:
def check(word):  # проверка наличия гласных в слове
    global ok_status
    for vowel in vowels:
        if vowel in word:
            return True
    ok_status = False
    return False

ok_status = True
vowels = ['a', 'u', 'i', 'e', 'o']
print(check('abracadabra'), ok_status)
print(check('www'), ok_status)

True True
False False


### Эмуляция работы с пространством имён:

Программе на вход подаются следующие запросы:
- `create <namespace> <parent>` –  создать новое пространство имён с именем `<namespace>` внутри пространства `<parent>`
- `add <namespace> <var>` – добавить в пространство `<namespace>` переменную `<var>`
- `get <namespace> <var>` – получить имя пространства, из которого будет взята переменная `<var>` при запросе из пространства `<namespace>`, или None, если такого пространства не существует

Рассмотрим набор запросов:
```
>>> add global a
>>> create foo global
>>> add foo b
>>> create bar foo
>>> add bar a
```

Структура пространств имен описанная выше будет эквивалентна структуре пространств имен, созданной при выполнении данного кода:

```python
a = 0
def foo():
  b = 1
  def bar():
    a = 2
```

Более формально, результатом работы `get <namespace> <var>` является:
- `<namespace>`, если в пространстве `<namespace>` была объявлена переменная `<var>`
- `get <parent> <var>` (результат запроса к пространству, внутри которого было создано пространство `<namespace>`), если переменная не была объявлена
- None, если не существует `<parent>`, т. е. `<namespace>`﻿ – это global

Формат входных данных:
- число n (1 ≤ n ≤ 100) – число запросов
- n строк по одному запросу

In [46]:
#

Enter number of entries:  9
 add global a
 create foo global
 add foo b
 get foo a
 get foo c
 create bar foo
 add bar a
 get bar a
 get bar b


global
None
bar
foo


---
##  3. Классы в Python

У каждого объекта есть тип, однако на практике удобно определять свои типы, для этого и существуют классы. Они позволяют описывать поведение объектов данного класса, а также создавать их (экземпляры данного класса), т.е. **класс** — это механизм и синтаксис для описания собственных типов данных (больше про ООП: https://younglinux.info/oopython/oop.php).
### 3.1. Атрибуты класса и конструктор

**Атрибуты класса** — переменные и функции в теле класса.
- атрибуты-переменные называют **полями (или свойствами)**, атрибуты-функции называют **методами**
- тело класса исполняется в момент определения самого класса
- для тела класса создаётся отдельное пространство имён, в нём будут атрибуты класса

In [1]:
class MyClass:
    a = 10                          #
                                    # тело класса MyClass
    def func(self):                 #
        print('Hello')              #

print(MyClass.a)                    # a и func — атрибуты класса MyClass
print(MyClass.func)                 #

10
<function MyClass.func at 0x000002516E2B6AF8>


**Конструктор** (механизм инстанцирования) — способ создания объектов данного класса (**экземпляров класса** или **инстансов**; создаются вместе со своими пространствами имён). 

- конструкторы также есть у каждого встроенного класса: например `ls = list()` для списков
- для класса можно вызвать конструктор и использовать атрибуты класса, для экземпляра класса — только использовать атрибуты (изменять и создавать)
- поведение конструктора определяется функцией **\_\_init\_\_** из тела данного класса (например, можно задать значения атрибутов по умолчанию при создании экземпляров данного класса)
- по умолчанию при создании экземпляра класса его пространство имён будет пустым (если не заданы атрибуты в **\_\_init\_\_**)

In [7]:
class Counter:
    def __init__(self, start=0):    # self — экземпляр класса
        self.count = start          # для каждого созданного экземпляра count = 0 по умолчанию

x = Counter()                       # создание экземпляра x класса Counter
y = Counter(10)                     # создание экземпляра y класса Counter
print(x.count, y.count)
print(type(x), type(Counter))

0 10
<class '__main__.Counter'> <class 'type'>


### 3.2. Методы

**Методы** — такие атрибуты внутри экземпляра класса, которые являются функциями (описываются внутри тела класса). При вызове метод определяется экземпляром класса и функцией из тела класса.

Например стандартный метод **sort** для списков:
```python
x = [2, 3, 1]  # создание экземпляра класса list
x.sort()       # использование метода sort на экземпляре x
```

In [11]:
class Counter:
    def __init__(self, start=0):  
        self.count = start  

    def inc(self):                  # определение метода inc
        self.count += 1

    def reset(self):                # определение метода reset
        self.count = 0

x = Counter()
x.inc()  # эквивалентно Counter.inc(x)
         # интерпретатор сначала ищет атрибут inc в пр-ве имён самого экземпляра x, а затем в пр-ве имён класса Counter 
         # x.inc — это связанный метод (bound method), специальный объект в Python
print(x.count)
x.reset()
print(x.count)

1
0


**Примеры:**

1. Реализуем класс **MoneyBox**, для работы с виртуальной копилкой. Каждая копилка имеет ограниченную вместимость, которая выражается целым числом – количеством монет, которые можно положить в копилку. Класс должен поддерживать информацию о количестве монет в копилке, предоставлять возможность добавлять монеты в копилку и узнавать, можно ли добавить в копилку ещё какое-то количество монет, не превышая ее вместимость. При создании копилки, число монет в ней равно 0.

In [12]:
#

2. Дается последовательность целых чисел и нужно вывести на экран сумму первой пятерки чисел из этой последовательности, затем сумму второй пятерки, и т. д. Но последовательность не дается целиком, с течением времени поступают её части. Например, сначала первые три элемента, потом следующие шесть, потом следующие два и т. д.  
Реализуем класс **Buffer**, который будет накапливать в себе элементы последовательности и выводить сумму пятерок последовательных элементов по мере их накопления. Во время выполнения метода add выводить сумму пятерок может потребоваться несколько раз до тех пор, пока в буфере не останется менее пяти элементов.

In [14]:
#

buf = Buffer()
buf.add(1, 2, 3)
buf.get_current_part()                   # вернуть [1, 2, 3]
buf.add(4, 5, 6)                         # print(15) – вывод суммы первой пятерки элементов
buf.get_current_part()                   # вернуть [6]
buf.add(7, 8, 9, 10)                     # print(40) – вывод суммы второй пятерки элементов
buf.get_current_part()                   # вернуть []
buf.add(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1) # print(5), print(5) – вывод сумм третьей и четвертой пятерки
buf.get_current_part()                   # вернуть [1]

15
40
5
5


[1]

3. Пример как **не** надо делать:

In [1]:
class Song:
    tags = list()

    def __init__(self, artist, song):
        self.artist = artist
        self.song = song
        # self.tags = list()  # КАК НАДО

    def add_tags(self, *args):
        self.tags.extend(args)

song1 = Song('Artist1', 'Song1')
song1.add_tags('rock', 'pop')
song2 = Song('Artist2', 'Song2')
song2.add_tags('electro', 'dnb')
song2.tags
# т.к. в __init__ self.tags не определяется, то интерпретатор не находит tags в экземплярах и ищет его в классе
# - нужно ассоциировать теги с песней, а не с классом песен
# - метод add_tags меняет класс, а не экземпляр класса (не надо так)

['rock', 'pop', 'electro', 'dnb']

4. Класс пользователей:

In [9]:
class User:
    def setName(self, n):
        self.name = n

    def getName(self):
        try:
                return self.name
        except:
                return None

first = User()
second = User()
first.setName("Bob")
print(first.getName(), second.getName())

Bob None


<img src="data/classes_and_methods.PNG" width="800" title="vars_id's_obj">

### 3.3. Наследование классов

Наследование нужно, когда необходимо, чтобы объект вел себя почти также как и объект другого типа, за небольшим (или большим) исключением. 

```python
class DerivedClassName(Base1, Base2, Base3):  # Bases — классы наследования
    # body
```

Для примера создадим класс, который ведёт себя также как **list**, но добавим к нему один метод:

In [13]:
class MyList(list):
    def even_length(self):
        return len(self) % 2 == 0

l = MyList()
# при создании экземпляра x используется конструктор из класса list, так как в классе MyList он не задан
l.extend([1, 2, 3, 4])  
# имя extend сначала ищется в пр-ве имён экземпляра x, затем в пр-ве имён класса MyList, а затем в пр-ве имён класса list
print(l)
# при вызове имени print для экземпляра x в его пр-ве имён ищется метод __repr__, затем в MyList, затем в list
# __repr__(self) — строковое представление объекта при выводе в консоль
print(l.even_length())

[1, 2, 3, 4]
True


- Python поддерживает множественное наследование
- если явно не наследуется никакой класс, то класс наследует класс **object** (т.е. **object** является предком любого другого класса)
- экземпляр класса также является и экземпляром предков данного класса 

<img src="data/inheritance.PNG" width="200" title="vars_id's_obj">

In [5]:
class D: pass
class E: pass
class B(D, E): pass
class C: pass
class A(B, C): pass

print(issubclass(A, A), issubclass(C, D), issubclass(A, D), issubclass(C, object), issubclass(object, C))
x = A()
print(isinstance(x, A), isinstance(x, B), isinstance(x, object), isinstance(x, str))  # issubclass(type(x), A)

True False True True False
True True True False


В случае множественного наследования важно понимать порядок в котором перебираются классы, когда ищется функция, соответствующая вызванному методу. Для этого существует **порядок разрешения методов** (method resolution order), он определяется в момент создания класса. Родительские классы будут перебираться в порядке, в котором они указаны при определении класса.

При этом метод ищется по классам вверх по иерархии, но только в том случае, если у стоящего выше в иерархии нет наследников, в которых ещё не было произведено поиска, но которые тоже участвуют в наследовании (в этом случае поиск не вверх, а горизонтально по иерархии).

In [19]:
class D: pass
class E: pass
class B(D, E): pass
class C: pass
class A(B, C): pass

print(A.mro())  # порядок, в котором будут перебираться пр-ва имён классов (method resolution order)

class E: pass
class B(E): pass
class C(E): pass
class D: pass
class A(B, C, D): pass

print(A.mro())

[<class '__main__.A'>, <class '__main__.B'>, <class '__main__.D'>, <class '__main__.E'>, <class '__main__.C'>, <class 'object'>]
[<class '__main__.A'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.E'>, <class '__main__.D'>, <class 'object'>]


In [14]:
class EvenLength:
    def even_length(self):
        return len(self) % 2 == 0

class MyList(list, EvenLength): pass

class MyDict(dict, EvenLength): pass

l = MyList()
l.extend([1, 2, 3, 4])
d = MyDict()
d['key'] = 'value'
print(l.even_length(), d.even_length())

True False


Класс может содержать методы с именами совпадающими с именами методов из родительских классов. Хотя иногда возникает необходимость вызова метода так, как будто он не определён в данном классе (т.е. вызвать его из родительского класса). Для этого используется функция **super**:

In [12]:
class EvenLength:
    def even_length(self):
        return len(self) % 2 == 0

class MyList(list, EvenLength):
    def pop(self):
        x = super(MyList, self).pop()  # эквивалентно list.pop(self)
        print('Last value is: ', x)
        return x

l = MyList([1, 2, 3, 4])
x = l.pop()

Last value is:  4


### 3.4. Примеры:

1. В первой строке входных данных: n — число классов. В следующих n строках содержится описание наследования классов в виде `<class1> : <class2> ... <class3>`, где `<class2> ... <class3>` — прямые предки `<class1>`.

    В следующей строке: q — количество запросов. В следующих q строках содержится описание запросов в формате `<class1> <class2>`. Для каждого запроса нужно вывести в отдельной строке "Yes", если класс 1 является предком класса 2, и "No", если не является.

    Класс A является предком класса B, если:
    - либо A = B
    - либо A — прямой предок B
    - либо A — предок B (через один или несколько других классов)

```
Sample Input:
4
A
B : A
C : A
D : B C
4
A B
B D
C D
D A
Sample Output:
Yes
Yes
Yes
No
```

In [None]:
#

2. Реализуем структуру данных, представляющую собой расширенную структуру стек. Необходимо поддерживать добавление элемента на вершину стека, удаление с вершины, а также операции сложения, вычитания, умножения и целочисленного деления. Сложение на стеке определяется так: со стека снимается верхний элемент (top1), затем следующий верхний элемент (top2), затем на вершину стека кладется элемент, равный top1 + top2. Аналогично для вычитания (top1 - top2), умножения (top1 * top2) и целочисленного деления (top1 // top2). Реализуйм эту структуру данных как класс ExtendedStack, унаследовав его от стандартного класса list.

In [32]:
#

3. Одно из применений множественного наследование – расширение функциональности класса каким-то заранее определенным способом. Например, если нам понадобится логировать какую-то информацию при обращении к методам класса.

    Реализуем классы **Loggable** и **LoggableList**:
    - Класс **Loggable** имеет один метод **log**, который выводит в лог (в данном случае в stdout) какое-то сообщение, добавляя при этом текущее время.
    - Класс **LoggableList** — наследник классов **list** и **Loggable**, при этом при добавлении элемента в список посредством метода **append** в лог отправляется сообщение, состоящее из только что добавленного элемента.

In [33]:
#

4. Игра и юниты:

In [42]:
import random
random.seed()

class Unit:
    def attack(self, enemy):  # self attacks enemy
        damage = round(self.dmg * (0.8 + 0.2 * random.randint(1, 100) / 100), 1)
        enemy.hp -= round(damage, 1)
        print(self.name, 'attacks', enemy.name, ': -', damage, 'HP')

    def show_hp(self):
        print('HP of', self.name, ':', self.hp)

    def fight(unit_A, unit_B):
        while (unit_A.hp > 0) and (unit_B.hp > 0):
            if random.randint(1,10) < 5:
                unit_A.attack(unit_B)
            else:
                unit_B.attack(unit_A)
            if unit_A.hp <= 0:
                print(unit_A.name, 'was killed')
                unit_A.hp = 0
            if unit_B.hp <= 0:
                print(unit_B.name, 'was killed')
                unit_B.hp = 0
            unit_A.show_hp()
            unit_B.show_hp()

class Zerg(Unit):
    def __init__(self):
        self.name = 'Zerg'
        self.hp = 50
        self.dmg = 25

class Protos(Unit):
    def __init__(self):
        self.name = 'Protos'
        self.hp = 100
        self.dmg = 12.5

zerling = Zerg()
zealot = Protos()
Unit.fight(zerling, zealot)

Zerg attacks Protos : - 24.9 HP
HP of Zerg : 50
HP of Protos : 75.1
Protos attacks Zerg : - 11.9 HP
HP of Zerg : 38.1
HP of Protos : 75.1
Protos attacks Zerg : - 11.2 HP
HP of Zerg : 26.900000000000002
HP of Protos : 75.1
Protos attacks Zerg : - 11.2 HP
HP of Zerg : 15.700000000000003
HP of Protos : 75.1
Protos attacks Zerg : - 10.9 HP
HP of Zerg : 4.8000000000000025
HP of Protos : 75.1
Protos attacks Zerg : - 11.3 HP
Zerg was killed
HP of Zerg : 0
HP of Protos : 75.1


---
## 4. Ошибки в Python

1. **Синтаксические** (проверяются до исполнения кода)
2. **Исключения** (узнаются в процессе исполнения кода)

Ошибка также является объектом, и у любой ошибки есть:
- тип (напр: NameError, TypeError, IndexError, ZeroDivisionError, etc.)
- дополнительное сообщение (что произошло, описание ошибки)
- состояние стека вызовов на момент совершения ошибки (где произошло, название модуля и номер линии(-ий) в коде)

### 4.1. Описание исключений

Конструкция **try/except** позволяет продолжать исполнение программы даже в случае ошибки.
- если не известен тип ошибки в коде, то его можно не указывать (пустой блок **except**)
- в качестве исключений можно использовать кортеж
- у ошибок в Python есть иерархия наследования (например, ZeroDivisionError — наследник ArithmeticError). При этом не используется множественное наследование, поэтому не имеет смысла проверять наследника в **except** блоке, если его предок уже проверяется в **except** блоке выше ([иерархия ошибок в Python](https://docs.python.org/3/library/exceptions.html#exception-hierarchy))
- необязательный блок **else** выполняется, если описанных исключений не возникло
- необязательный блок **finally** выполняется в любом случае после выполнения (или невыполнения) всех других блоков

Поймать все типы ошибок можно так:
```python
try:
    pass
except Exception as e:  # или except:
    print(e)
```

In [15]:
try:
    x = [11, 10, 'string']
    x.sort()
    print(x)
    # создание объекта исключения
except TypeError:  # isinstance(error, TypeError) == True
    print('This is TypeError')
    
print(TypeError.mro())

This is TypeError
[<class 'TypeError'>, <class 'Exception'>, <class 'BaseException'>, <class 'object'>]


In [25]:
def f(x, y):
    try:
        print(x / y)
    except TypeError:
        print('Type Error')
    except ZeroDivisionError as e:
        print(type(e))
        print(e)
        print(e.args)
    except (NameError, IndexError):
        pass
    else:
        print('No errors,')  # если исключений не возникло
    finally:
        print('finally \n')  # выполняется в любом случае

f(5, 'str')
f(5, 0)
f(5, 1)

Type Error
finally 

<class 'ZeroDivisionError'>
division by zero
('division by zero',)
finally 

5.0
No errors,
finally 



### Пример:

Дано описание наследования классов исключений. В первой строке входных данных: n — число классов исключений. В следующих n строках содержится описание наследования классов в виде `<class1> : <class2> ... <class3>`, где `<class2> ... <class3>` — прямые предки `<class1>`.

В следующей строке: m — количество обрабатываемых исключений в конструкции **try/except**. Следующие m строк содержат имена исключений в том порядке, в каком они были написаны в коде.

Из-за наследования классов некоторые исключения можно не ловить, так как ранее в коде будет пойман их предок. Напишем программу, которая будет определять какие исключения можно удалить из кода.

Например, для кода:

```python
try:
   foo()
except ZeroDivision :
   print("ZeroDivision")
except OSError:
   print("OSError")
except ArithmeticError:
   print("ArithmeticError")
except FileNotFoundError:
   print("FileNotFoundError")
```

```
Sample Input:
4
ArithmeticError
ZeroDivisionError : ArithmeticError
OSError
FileNotFoundError : OSError
4
ZeroDivisionError
OSError
ArithmeticError
FileNotFoundError

Sample Output:
FileNotFoundError
```

In [None]:
#

### 4.2. Создание своих исключений

Кроме ошибок для стандартных операций, можно самому решать, что такое ошибка для данной программы, т.е. "**бросать/ловить**" исключения (**throw/catch** errors). Чтобы **бросить** исключение используется конструкция **raise**:

In [27]:
def greet(name):
    if name[0].isupper():  # начинается ли name с заглавной буквы
        return 'Hello, ' + name
    else:
        raise ValueError(name + ' is inappropriate name')

while True:
    try:
        name = input('Your name:')
        print(greet(name))
    except ValueError:
        print('Try again')
    else:
        break

Your name: bob


Try again


Your name: Bob


Hello, Bob


Все описанные исключения должны быть экземплярами класса **BaseException** (встроенный тип языка Python). Иногда нет такого класса исключений, который бы хорошо описывал именну ту ошибку, которая происходит в коде. Тогда следует описать новый класс исключений, наследуемый от **BaseException**:

In [29]:
class BadName(Exception):
    pass

def greet(name):
    if name[0].isupper():  # начинается ли name с заглавной буквы
        return 'Hello, ' + name
    else:
        raise BadName(name + ' is inappropriate name')

greet('bob')

BadName: bob is inappropriate name

### Пример:

Реализуем класс **PositiveList**, отнаследовав его от класса **list**, для хранения положительных целых чисел. Также реализуем новое исключение **NonPositiveError**. В классе **PositiveList** переопределим метод **append(self, el)** таким образом, чтобы при попытке добавить неположительное целое число бросалось исключение **NonPositiveError** и число не добавлялось, а при попытке добавить положительное целое число, число добавлялось бы как в стандартный **list**.

In [None]:
#

---
## 5. Модули в Python

Часто возникает необходимость использовать функции, классы и переменные из одного файла внутри другого, для это используются модули. После вызова модуля с помощью **import** он исполнится полностью и будут доступны имена из его пространства имён.

### 5.1. Импортирование модулей

- модуль может содержать ресурсоёмкий код для вычисления каких-то значений, которые не нужны при импортировании. Для разрешения этой ситуации используется условная конструкция, в которой определяется, является ли данный файл главным или вызываемым как модуль (https://docs.python.org/3/library/__main__.html)

```python
def main():
    print(__name__)
    print(fib(31))

def fib(k):
    if k == 0 or k == 1:
        return 1
    else:
        return fib(k - 1) + fib(k - 2)

if __name__ == '__main__':
    main()
```

In [40]:
import fib
fib.fib(4)

5

- при импорте модуля создаётся запись в словаре **sys.modules** (ключи — имена модулей, значения — объекты модулей) и при повторном вызове модуля, новый объект уже не создаётся, а используется уже имеющийся (т.е. модуль исполняется только при первом вызове)

- если имя модуля не найдено в **sys.modules**, то затем оно ищется в текущей директории и внешних библиотеках (в порядке указанном в **sys.path**). В библиотеках модули представлены папками (**пакетами**), это удобный способ представления некоторого числа файлов в виде одного модуля. Интерпретатор определяет является ли папка **пакетом** по наличию в ней файла **\_\_init\_\_.py** (исполняется при импорте)

### Пример:
В первой строке даны три числа, соответствующие некоторой дате — год, месяц и день. Во второй строке — число дней. Нужно вычислить и вывести год, месяц и день даты, которая наступит, когда с момента исходной даты date пройдет число дней, равное days.

In [19]:
#

date: 2016 4 20
days: 14


2016 5 4


### 5.2. Частичное импортирование

- можно импортировать модуль не полностью с помощью конструкции `from <mod> import <func>` (`as mod_func`).

- через конструкцию `from <mod> import *` импортируются не все имена модуля, а только те, которые обозначены в списке **\_\_all\_\_** внутри модуля; если же этот список не обозначен, то импортируются все имена, кроме начинающихся с нижнего подчёркивания.

### 5.3. Пример

[Репозиторий пакетов PyPi](https://pypi.python.org/pypi)  
[Репозиторий пакетов Anaconda](https://anaconda.org/)

Установить библиотеку **simple-crypt** и с помощью метода **decrypt** узнать, какой из паролей служит ключом для расшифровки файла **encrypted.bin** с интересной информацией.

---
## 6. Итераторы и генераторы

Для того, чтобы перебирать элементы объекта с помощью цикла **for**, необходимо, чтобы у этого объекта был **итератор** (объект-перечислитель, который отвечает, какой элемент следующий, или бросающий ошибку StopIteration, если элемент последний).

**Итератор** — объект, для которого задан метод **\_\_next\_\_**.

In [46]:
ls = [1, 2, 3]

it = iter(ls)
print(next(it), end=' ')
print(next(it), end=' ')
print(next(it))
# эквивалентно
for el in ls:
    print(el, end=' ')
print()
# эквивалентно
it = iter(ls)
while True:
    try:
        el = next(it)
        print(el, end=' ')
    except StopIteration:
        break

1 2 3
1 2 3 
1 2 3 

### 6.1. Создание итераторов

Можно создавать свои итераторы, рассмотрим, например, итератор, который будет перебирать k случайных чисел из диапазона [0, 1]:

In [15]:
from random import random

class RandomIterator:
    def __init__(self, k):
        self.k = k  # количество перебираемых случайных чисел
        self.i = 0  # количество уже перебранных итератором чисел

    def __next__(self):
        if self.i < self.k:
            self.i += 1
            return random()
        else:
            raise StopIteration

it = RandomIterator(3)
print(next(it))  # next(it) ~ it.__next__()
print(next(it))
print(next(it))
# print(next(it))  # ошибка StopIteration

0.6409533254365358
0.3046946318193344
0.5844423813242209


Чтобы элементы экземпляра какого-либо класса можно было перебирать (итерировать), в этом классе должна быть задана функция **\_\_iter\_\_**, которая возвращает итератор.

**Замечание:** функции **\_\_iter\_\_** и **\_\_next\_\_** могут быть определены в одном и том же классе, тогда экземпляры этого класса одновременно будут являться и итераторами, и итерируемыми объектами (но так делать не стоит во избежание путаницы?).

In [47]:
class double_el_list_iterator:                                  # класс итератора
    def __init__(self, ls):
        if len(ls) % 2 == 0:
            self.ls = ls                                        # что за объект будет итерироваться
            self.i = 0                                          # число уже перебранных элементов
        else:
            raise IndexError('Odd number of elements in list')  # ошибка, если число элементов списка нечётное

    def __next__(self):
        if self.i < len(self.ls):
            self.i += 2
            return self.ls[self.i - 2], self.ls[self.i - 1]
        else:
            raise StopIteration

class MyList(list):                                             # класс итерирумого объекта
    def __iter__(self):
        return double_el_list_iterator(self)                    # создание итератора для экземпляра данного класса


for pair in MyList([1, 2, 3, 4, 5, 6, 7, 8]):
    print(pair, end=' ')

(1, 2) (3, 4) (5, 6) (7, 8) 

### 6.2. Генераторы

Можно создавать итераторы без использования классов, для этого есть генераторы. **Генераторы** — это удобный синтаксис для написания итераторов; они ведут себя как функции, которые могут последовательно возвращать сразу несколько значений (т.о. в Python с помощью генераторов реализуется концепция отложенного исполнения).

Исполнение функции-генератора начнётся, когда у него попросят следующий элемент, тогда функция начнёт исполняться до первого **yield**. После этого генератор вернёт значение из функции, при этом запомнив своё состояние для того, чтобы при следующем вызове продолжить выполнение с места остановки. После следующего вызова выполнение продолжится до следующего **yield** (если это слово есть), если его нет, генератор дойдёт до конца тела функции и завершит исполнение, выдав StopIteration.

In [17]:
def random_generator(k):
    for i in range(k):
        yield random()

gen = random_generator(3)
for i in gen:
    print(i)

0.9379889021282052
0.6123091897955026
0.2516697669526443


In [19]:
def simple_gen():
    print('checkpoint 1')
    yield 1
    print('checkpoint 2')
    yield 2
    print('checkpoint 3')

gen = simple_gen()
print(next(gen))
print(next(gen))
# print(next(gen))  # StopIteration

checkpoint 1
1
checkpoint 2
2


Внутри генератора можно также использовать слово **return**, когда интерпретатор его прочитает, то генератор остановит свое выполнение и вернёт ошибку StopIteration. Если же **return** в теле генератора нет, то он закончит своё выполнение после последней строчки.

In [21]:
def simple_gen():
    print('checkpoint 1')
    yield 1
    print('checkpoint 2')
    return 'No more elements'
    yield 2                # не исполняется
    print('checkpoint 3')  # не исполняется

gen = simple_gen()
print(next(gen))
print(next(gen))

checkpoint 1
1
checkpoint 2


StopIteration: No more elements

### 6.3. Фильтры

Часто используемый в Python класс — **filter**, он принимает в конструкторе два аргумента: a и f — последовательность и функцию, и позволяет проитерироваться только по таким элементам последовательности a, что `f(el) == True` (говорят, что функция f допускает элемент el, а элемент el является допущенным).

```python
def even(x):
    return x % 2 == 0

evens = list(filter(even, [3, 4, 6, 7, 10]))
>>> [4, 6, 10]
```

Реализуем класс **multifilter**, аналогичный классу **filter**, но использующий несколько функций на входе, при этом допуск/недопуск элемента определяется соотношением pos/neg между количествами функций, допустивших и не допустивших этот элемент. Этот механизм реализуется решающей функцией (принимает на вход количества pos и neg; возвращает True, если элемент допущен, и False иначе).

**1. Рализация с помощью генератора:**

In [30]:
#

[0, 2, 3, 4, 5, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30]
[0, 6, 10, 12, 15, 18, 20, 24, 30]
[0, 30]


**2. Реализация с помощью итератора:**

In [32]:
#

Реализуем функцию-генератор **primes**, вывводящую простые числа в порядке возрастания, начиная с числа 2:

In [43]:
#

2 3 5 7 11 13 17 19 23 29 

### 6.4. Генерация списков (list comprehension)

В Python существует синтаксис для упрощённого создания списков, множеств, словарей и генераторов:

In [52]:
ls1 = [-2, -1, 0, 1 , 2]
ls2 = [i**2 for i in ls1]
ls3 = [i**2 for i in ls1 if i >= 0]
ls4 = [(i, j) for i in range(3) for j in range(3) if j >= i]  # список кортежей
gen = ((i, j) for i in range(3) for j in range(3) if j >= i)  # генератор

print(ls1)
print(ls2)
print(ls3)
print(ls4)
for i in gen:
    print(i, end=' ')

[-2, -1, 0, 1, 2]
[4, 1, 0, 1, 4]
[0, 1, 4]
[(0, 0), (0, 1), (0, 2), (1, 1), (1, 2), (2, 2)]
(0, 0) (0, 1) (0, 2) (1, 1) (1, 2) (2, 2) 

In [53]:
s = {i**2 for i in ls1}
d = {i:i**2 for i in ls1}
print(s)
print(d)

{0, 1, 4}
{-2: 4, -1: 1, 0: 0, 1: 1, 2: 4}


---
## 7. Работа с файлами

1. Текстовые
2. Бинарные (двоичные)

### 7.1. Текстовые файлы

Функция **open** возвращает объект типа файл. После завершения работы с файлом, его следует закрывать методом **close** для освобождения ресурсов (или же работать с файлом с помощью конструкции **with**).

In [29]:
f = open("data/000_demodata.txt")  # encoding='utf-8' для кириллицы
print(f.readline())                # чтение строки
print(f.read(3))                   # чтение 3 символов (включая \n, \t, etc.)
print(f.read())                    # чтение всего файла
f.seek(0)                          # указатель на начало файла
print(f.read().splitlines())       # список из строк текстового файла (или f.readlines() — со служебными символами)
f.close()

1 3

2 5

4 7
7 14
8 16
9 23
['1 3', '2 5', '4 7', '7 14', '8 16', '9 23']


In [25]:
lines = ['line1', 'line2', 'line3']
print('\n'.join(lines))

from linecache import getline
getline("data/000_demodata.txt", 4)        # прочитать 4-ую строку из файла

line1
line2
line3


'7 14\n'

Если файл большой, то для экономии памяти его следует считывать построчно. Удобнее всего это делать в цикле for, т.к. экземпляры файлового класса — это итерируемые объекты.

In [17]:
with open("data/005_test_read.txt") as f:
    for line in f:
        line = line.rstrip()               # rstrip(symb) убирает справа symb (по умолчанию — \t, \n, spaces, etc.)
        print(line)                        # lstrip — слева, strip — с обеих сторон

# for (st,i) in enumerate(inf,n):          # итерация по строках с индексами (n - начальный индекс)

this is first line
this is second line
bruh


### 7.2. Работа с директориями

Для работы с директориями используются модули **os** и **shutil**.

In [1]:
import os.path

print(os.getcwd())                         # pwd
print(os.listdir("data"))                  # ls в виде списка
print(os.path.exists("data/objects.PNG"))  # существует ли файл или папка
print(os.path.isfile("data"))              # файл?
print(os.path.isdir("data"))               # папка?
print(os.path.abspath("data/"))            # абсолютный путь по относительному
os.chdir("data/")                          # cd
os.chdir("..")

Чтобы рекурсивно получить список файлов и папок в директории используют функцию **os.walk**. Это генератор, который возвращает кортеж из трёх элементов (рассматриваемая директория, список подпапок директории, список файлов в директории).

In [2]:
for wdir, dirs, files in os.walk("Image Processing"):
    print(wdir, dirs, files)

In [57]:
import shutil

shutil.copy("data/005_test_read.txt", "data/005_test_read(copy).txt")  # shutil.copytree(d1, d2) для папок

'data/005_test_read(copy).txt'

### Пример:

Дана файловая структура, состоящая из директорий и файлов, необходимо найти в ней все директории, в которых есть хотя бы один файл с расширением ".py". Ответ из списка отсортированных в лексикографическом порядке директорий записать в текстовый файл.

In [70]:
#

---
## 8. Функции в Python

### 8.1. Лямбда-функции

Упрощённый синтаксис для создания функций: `lambda <args>: <func_expression>`

In [73]:
even = lambda x: x % 2 == 0                               # правила для списка параметров стандартные
evens = list(filter(even, [1, 4, 6, 7, 10]))
print(evens)

[4, 6, 10]


In [83]:
ls = [('Guido', 'van', 'Rossum'),
      ('Haskell', 'Curry'),
      ('John', 'Backus')]

ls.sort(key=lambda name: len(' '.join(name)))             # отсортировать по длине имени
print(ls)

[('John', 'Backus'), ('Haskell', 'Curry'), ('Guido', 'van', 'Rossum')]


### 8.2. Библиотеки Operator и Functools

### 1. operator

Иногда удобно представлять операторы языка в виде функций, для этого существует библиотека **operator**.

In [86]:
import operator as op

print(op.add(2, 2))
print(op.mul(2, 3))

ls, d = [1, 2, 3], {'1': 1, '2': 2, '3': 3}
print(op.contains(ls, 4))                                 # 4 в ls?
f = op.itemgetter(1)                                      # f(x) = x[1]
g = op.itemgetter('1')                                    # g(x) = x['1']
h = op.attrgetter('sort')                                 # h(x) = x.sort
print(f(ls), g(d), h(ls))

4
6
False
2 1 <built-in method sort of list object at 0x000002925CD10A88>


In [85]:
ls = [('Guido', 'van', 'Rossum'),
      ('Haskell', 'Curry'),
      ('John', 'Backus')]

ls.sort(key=op.itemgetter(-1))                            # отсортировать по фамилии
print(ls)

[('John', 'Backus'), ('Haskell', 'Curry'), ('Guido', 'van', 'Rossum')]


### 2. functools

Функция **partial** из библиотеки **functools** позволяет закрепить за некоторыми параметрами используемой функции определённые значения.

In [87]:
from functools import partial

int_2 = partial(int, base=2)                              # ~ int(_, base=2)
print(int_2('10011'))

19


In [90]:
ls = [('Guido', 'van', 'Rossum'),
      ('Haskell', 'Curry'),
      ('John', 'Backus')]

sort_by_last = partial(list.sort, key=op.itemgetter(-1))  # отсортировать по фамилии
sort_by_last(ls)
print(ls)

[('John', 'Backus'), ('Haskell', 'Curry'), ('Guido', 'van', 'Rossum')]


### Пример:

Реализуем функцию **mod_checker(x, mod=0)**, которая будет генерировать лямбда функцию от одного аргумента y, которая будет возвращать True, если остаток от деления y на x равен mod, и False иначе.

In [94]:
#

True
False
True


### Бонус:

- [PEP8 Style Guide for Python Code](https://www.python.org/dev/peps/pep-0008/)

- рекомендуется в теле функций, методов и классов использовать документирующие строки. При этом эти комментарии будут доступны в качестве атрибута **\_\_doc\_\_**. Подобная документация доступна для всех стандартных функций, классов и модулей

In [3]:
def mod_checker(x, mod=0):
    '''
    mod_cheker(x, mod=0) возвращает ####
    '''
    pass

print(mod_checker.__doc__)


    mod_cheker(x, mod=0) возвращает ####
    


In [101]:
import os
print(os.path.__doc__)

Common pathname manipulations, WindowsNT/95 version.

Instead of importing this module directly, import os and refer to this
module as os.path.



---
## 9. Работа с текстом

Текстовая информация в Python хранится в объектах строкового типа.

### 9.1. Стандартные методы строк

In [10]:
st = 'Stringy strings'
print('rin' in st)                  # входит ли в строку?
print(st.find('ing'))               # индекс первого вхождения (-1 если не входит)
print(st.rfind('ing'))              # индекс первого вхождения с конца (-1 если не входит)
print(st.index('ing'))              # индекс первого вхождения (ValueError если не входит)
print(st.count('ing'))              # число непересекающихся вхождений
print()
st = 'This is some text'
print(st.split(' '))                # разделить и получить список
print(st.startswith('This'))
print(st.endswith('text'))
print(st.replace('text', 'code'))
print(st.upper())
print(st.lower())
print()
st = '_*___1 2 3 4___*_'
print(st.strip('*_'))                # + lstrip/rstrip (' ' по умолчанию)
print(' '.join(['1', '2', '3', '4']))

True
3
11
3
2

['This', 'is', 'some', 'text']
True
True
This is some code
THIS IS SOME TEXT
this is some text

1 2 3 4
1 2 3 4


### 9.2. Форматирование строк

In [16]:
template = '{} is the capital of {}'
print(template.format('London', 'Great Britain'))
template = '{1}, {city} is the capital of {country}, did you know that {0}?'   # {#} — позиционные параметры
print(template.format('bruh', 'Hey', country='Great Britain', city='London'))  # {<name>} — именные параметры

import requests
template = 'Response from {0.url} with code {0.status_code}'                   # можно обращаться к атрибутам объектов
res = requests.get("https://docs.python.org/3.7/")
print(template.format(res))
res = requests.get("https://docs.python.org/3.7/random")
print(template.format(res))

London is the capital of Great Britain
Hey, London is the capital of Great Britain, did you know that bruh?
Response from https://docs.python.org/3.7/ with code 200
Response from https://docs.python.org/3.7/random with code 404


In [17]:
d = {"United States": "Washington",
     "Canada": "Ottawa",
     "France": "Paris",
     "Great Britain": "London"}

for country, capital in d.items():
    print(f"{capital} is the capital of {country}")                            # используя f-строки (самый быстрый метод)

Washington is the capital of United States
Ottawa is the capital of Canada
Paris is the capital of France
London is the capital of Great Britain


### Примеры:

1. На вход подаются три строки: st, a, b. Необходимо узнать, после какого минимального количества операций замены a на b в строке st больше не останется вхождений строки a в st. Если операций потребуется более 1000, выведите Impossible.

In [19]:
#

 abababa
 ab
 ba


3


2. На вход подаются строки st и s. Выведите количество вхождений строки s в строку st (учитывая пересечения).

In [20]:
#

 abababababa
 aba


5


### 9.3. Регулярные выражения

Мощный инструмент для поиска информации в тексте; в Python **регулярные выражения** (regular expressions) представляются стандартной библиотекой **re**. С помощью регулярных выражений описывают шаблон, а затем проверяют подходит ли рассматриваемая строка под данный шаблон. При этом для описания шаблонов используются **сырые строки** (чтобы можно было использовать символ `\`).

```python
import re
re.match(pattern, st)      # подходит ли начало строки под шаблон (None если нет)
re.search(pattern, st)     # найти первую подстроку, подходящую под шаблон
re.findall(pattern, st)    # найти все подстроки, подходящие под шаблон
re.sub(pattern, repl, st)  # заменить все подстроки, подходящие под шаблон, новой строкой
```

In [21]:
print('Hello\nWorld')   # обычная строка
print(r'Hello\nWorld')  # сырая строка (raw)

Hello
World
Hello\nWorld


In [24]:
import re

pattern = r'abc'
st = 'abcde'
print(re.match(pattern, st))

<re.Match object; span=(0, 3), match='abc'>


### Метасимволы

Метасимволы `. ^ $ * + ? {} [] \ | ()` открывают широкие возможности для задания шаблонов. При этом, если нужно использовать их как обычный символ, то нужно добавить `\` перед символом (т.е. `\. \^ \$` и т.д.).

### Примеры:

1. Символ `[]`

In [28]:
pattern = r'a[abc]c'  # можно задавать диапазонами [a-c]

st1, st2 = 'abc', 'aac'
print(re.match(pattern, st1))
print(re.match(pattern, st2))

st = 'aac, abc, acc'
print(re.findall(pattern, st))
print(re.sub(pattern, 'abc', st))

<re.Match object; span=(0, 3), match='abc'>
<re.Match object; span=(0, 3), match='aac'>
['aac', 'abc', 'acc']
abc, abc, abc


2. Дана последовательность строк, вывести строки, содержащие "cat" в качестве подстроки хотя бы два раза.

3. Дана последовательность строк, вывести строки, содержащие "cat" в качестве слова.

4. Дана последовательность строк, вывести строки, содержащие две буквы "z", между которыми ровно три символа.

5. Дана последовательность строк, вывести строки, , содержащие обратный слеш "\".

6. Дана последовательность строк, вывести строки, содержащие слово, состоящее из двух одинаковых частей (тандемный повтор).

7. Дана последовательность строк, в каждой строке замените первое вхождение слова, состоящего только из латинских букв "a" (регистр не важен), на слово "argh".

8. Дана последовательность строк, в каждой строке поменяйте местами две первых буквы в каждом слове, состоящем хотя бы из двух букв (буквой считается символ из группы \w).

9. Дана последовательность строк, в каждой строке замените все вхождения нескольких одинаковых букв на одну букву (буквой считается символ из группы \w).

---
## 10. Работа с веб-данными

### 10.1. Гипертекст и гиперссылки

**Гипертекст** — текст, который содержит в себе ссылки на другие текстовые документы.

**HTTP** — протокол обмена гипертекстом (а также любыми другими данными в бинарном виде, например, картинками, музыкой, видео).

В общении через http участвуют две стороны: **клиент** делает запрос **серверу** на какой-нибудь ресурс (веб страница или файл), сервер отвечает клиенту. Ресурсы описываются в интернете с помощью **url** (uniform resource locator). Например: https://stepik.org/512 (протокол - домен, хост - путь до ресурса).

Вид http запроса (на ru.wikipedia.org/wiki/Python):

**HTML** — язык разметки гипертекста (используется для составления веб страниц).

- как должна выглядеть веб-страница браузер решает, прочитав html документ
- чтобы доставать информацию из веб страниц не обязательно знать, что делает каждый тег, достаточно уметь составлять необходимого вида регулярные выражения
- **requests** — популярная библиотека для интернет запросов
- https://apitester.com/

In [65]:
import requests

res = requests.get("https://docs.python.org/3/")
# http GET request, возвращает response object, содержит в себе описание ответа сервера
# при запросе можно также указывать параметры (см.документацию)
print(res.status_code)
print(res.headers['Content-Type'])
res.content
# содержимое ответа (байтовые строки, так как по умолчанию результат запроса может быть какой-угодно информацией)
res.text
# содержимое ответа, если запрашивается текст

# полученную информацию можно сохранить в файл
with open("data/python_docs.txt", 'w') as f:
    f.write(res.text)

200
text/html


### Примеры:
1. На вход подаются две строки, содержащие url двух документов A и B, содержащих гиперссылки. Выведите Yes, если из A в B можно перейти за два перехода, иначе выведите No.

In [60]:
#

Yes


2. На вход подается ссылка на HTML файл. Необходимо скачать его, найти в нём все ссылки вида `<a ... href="..." ... >` и вывести список сайтов, на которые есть ссылка в алфавитном порядке. Сайтом в данной задаче будем называть имя домена вместе с именами поддоменов. То есть, это последовательность символов, которая следует сразу после символов протокола, если он есть, до символов порта или пути, если они есть, за исключением случаев с относительными ссылками вида
`<a href="../some_path/index.html">`.

In [61]:
#

bya.ru
mail.ru
neerc.ifmo.ru
sasd.ifmo.ru
stepic.org
www.gtu.edu.ge
www.kya.ru
www.mya.ru
www.ya.ru


### 10.2. Форматы CSV и JSON

**CSV** - табличный формат текстовых данных. В Python есть встроенная библиотека **csv**.

In [19]:
import csv

# ОТКРЫТИЕ:
with open("data/example_csv.csv") as f:
    reader  = csv.reader(f)                               # deliminter=',' по умолчанию  
    for row in reader:
        print(row)

# ЗАПИСЬ:
students = [['John', 'Doe', 50, 60 , 65],
            ['Bob', 'Smith', 70, 65, 60]]
with open("data/example_csv.csv", 'w', newline='') as f:  # newline='' из-за windows (\r\n новая строка)
    writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)  # QUOTE_ALL записать с кавычками все данные
    writer.writerows(students)
    # или
    # for student in students:
        # writer.writerow(student)

['John', 'Doe', '50', '60', '65']
['Bob', 'Smith', '70', '65', '60']


### Пример:

Дана частичная выборка из датасета зафиксированных преступлений, совершенных в городе Чикаго с 2001 года по настоящее время. Одним из атрибутов преступления является его тип – Primary Type. Узнать тип преступления, которое было зафиксировано максимальное число раз в 2015 году.

**JSON** — нотация объектов языка JS, изначально использовался только в JS. В Python есть встроенная библиотека **json**.

Отличия синтаксиса от Python:
- ключом в JSON объекте может быть только строка, при чём строки только внутри двойных кавычек
- true и false с маленькой буквы; вместо None Null
- кортеж становится списком; нет множеств

In [23]:
import json

student1 = {
            'first name': 'John',
            'last name': 'Doe',
            'res1': [50, 60],
            'certificate': True
           }

student2 = {
            'first name': 'Bob',
            'last name': 'Smith',
            'res': [70, 65],
            'certificate': True
           }

data = [student1, student2]

data_json = json.dumps(data, indent=4, sort_keys=True)         # python obj   --> json string
print(data_json)
data_python = json.loads(data_json)                            # jason string --> python object
print(data_python)

with open("data/students.json", 'w') as f:
    json.dump(data_python, f, indent=4, sort_keys=True)        # python obj   --> json file

with open("data/students.json", 'r') as f:
    data_python = json.load(f)                                 # json file    --> python object

[
    {
        "certificate": true,
        "first name": "John",
        "last name": "Doe",
        "res1": [
            50,
            60
        ]
    },
    {
        "certificate": true,
        "first name": "Bob",
        "last name": "Smith",
        "res": [
            70,
            65
        ]
    }
]
[{'certificate': True, 'first name': 'John', 'last name': 'Doe', 'res1': [50, 60]}, {'certificate': True, 'first name': 'Bob', 'last name': 'Smith', 'res': [70, 65]}]


### Пример:

Дано описание наследования классов в формате JSON. Описание представляет из себя массив JSON-объектов, которые соответствуют классам. У каждого JSON-объекта есть поле name, которое содержит имя класса, и поле parents, которое содержит список имен прямых предков.

Пример:

`[{"name": "A", "parents": []}, {"name": "B", "parents": ["A", "C"]}, {"name": "C", "parents": ["A"]}]`

Для каждого класса вычислите предком скольких классов он является и выведите эту информацию в лексикографическом порядке.

In [10]:
#

A : 3
B : 1
C : 2


### 10.3. API

API модуля или сервиса — набор функций, констант и методов, которые можно использовать (при этом не обязательно знать как они работают). Будем рассматривать веб API на примере OpenWeatherMap; при этом, чтобы пользоваться сервисом, нужно получить ключ.

In [28]:
import requests

api_url = "https://api.openweathermap.org/data/2.5/weather"
city = input('City?')
params = {
          'q': city,
          'appid': '11c0d3dc6093f7442898ee49d2430d20',
          'units': 'metric'
         }
res = requests.get(api_url, params=params)
data = res.json()  # returns json.loads(res.text)
print(data['main'])
print(f"Current temperature in {city}: {data['main']['temp']} C")

City? London


{'temp': 14.47, 'pressure': 1003, 'humidity': 82, 'temp_min': 13, 'temp_max': 16.11}
Current temperature in London: 14.47 C


### Пример:

Необходимо воспользоваться API сайта numbersapi.com. Дается набор чисел, для каждого из чисел необходимо узнать, существует ли интересный математический факт об этом числе. Выведите Interesting, если существует, и Boring иначе.

### 10.4. XML

**Extendable markup language** — теговый язык разметки, похожий на html и json, но в котором теги и их атрибуты определяет сам пользователь (html используется для отображения данных в браузере, xml — для хранения данных). 

```xml
<studentsList>
    <student id="1">  <!-- id=1 — атрибут -->
        <firstName>Bob</firstName>
        <lastName>Smith</lastName>
        <certificate>true</certificate>
        <scores>
            <res1>70</res1>
            <res2>65</res2>
            <res3>70</res3>
        </scores>
    </student>
    <student id="2">
        <firstName>John</firstName>
        <lastName>Doe</lastName>
        <certificate>false</certificate>
        <scores>
            <res1>60</res1>
            <res2>55</res2>
            <res3>50</res3>
        </scores>
    </student>
</studentsList>
```

1. Чтение:

In [7]:
from xml.etree import ElementTree

tree = ElementTree.parse("data/example.xml")     # возвращает дерево из xml файла
root = tree.getroot()                            # root = ElementTree.fromstring(string_xml) для строк
print(root, root.tag, root.attrib, root[0][0].text)

for child in root:                               # проийтись по элементам дерева 
    print(child.tag, child.attrib)

<Element 'studentsList' at 0x000002B6B6BDB4A8> studentsList {} Bob
student {'id': '1'}
student {'id': '2'}


In [13]:
for el in root.iter('scores'):                   # root.iter('tag') перебрать элементы с тегом 'tag'
    score_sum = 0                                # root.findall('tag') перебрать элементы с тегом 'tag' только среди детей
    for child in el:
        score_sum += int(child.text)
    print(score_sum)

205
165


2. Запись:

In [20]:
tree = ElementTree.parse("data/example_copy.xml")
root = tree.getroot()

bob = root[0]
res1 = next(bob.iter('res1'))                    # получаем значение элемента 'res1'
print(res1.text)
res1.text = str(int(res1.text) + 10)             # меняем значение элемента 'res1'
certificate = bob[2]
certificate.set('type', 'with distinction')      # создать атрубут 'type' со значением 'with distinction'

tree.write("data/example_copy.xml")

90


3. Добавление и удаление элементов:

In [25]:
tree = ElementTree.parse("data/example_copy.xml")
root = tree.getroot()

bob = root[0]
description = ElementTree.Element('description')  # создать тег 'description'
description.text = "Showed great skills"          # задать содержимое тега
bob.append(description)                           # добавть описание тега в дерево

certificate = bob.find('certificate')             # найти первыйй тег 'certificate'
bob.remove(certificate)                           # удалить тег из дерева

tree.write("data/example_mod.xml")

In [26]:
root = ElementTree.Element('student')             # создание дерева тегов и их запись в файл
first_name = ElementTree.SubElement(root, 'firstName')
first_name.text = 'Bob'
last_name = ElementTree.SubElement(root, 'lastName')
last_name.text = 'Smith'
scores = ElementTree.SubElement(root, 'scores')
res1 = ElementTree.SubElement(scores, 'res1')
res1.text = '90'
res2 = ElementTree.SubElement(scores, 'res2')
res2.text = '80'
res3 = ElementTree.SubElement(scores, 'res3')
res3.text = '75'

tree = ElementTree.ElementTree(root)
tree.write("data/example_mod2.xml")

### Пример:

Дано описание пирамиды из кубиков в формате XML. Кубики могут быть трех цветов: красный, зеленый и синий. Введем понятие ценности для кубиков: это уровень в дереве xml (верхний — 1, ниже — 2 и т.д.). Ценность цвета равна сумме ценностей всех кубиков этого цвета. Выведите ценности красного, зеленого и синего цветов.

In [31]:
#

4 3 1


Часто данные из интернета бывают плохо сформированы (например, не закрыты теги или указаны в неправильном порядке и т.д.). Для работы с такими html файлами существуют "умные" библиотеки **lxml** и **bs4**.

In [28]:
from lxml import etree
import requests

res = requests.get("https://docs.python.org/3/")
print(res.status_code, res.headers['Content-Type'])

root = etree.fromstring(res.text, etree.HTMLParser())  # использовать умный парсер
for el in root.iter('a'):                              # перебрать все ссылки в поддереве
    print(el.attrib)

200 text/html
{'href': 'genindex.html', 'title': 'General Index', 'accesskey': 'I'}
{'href': 'py-modindex.html', 'title': 'Python Module Index'}
{'href': 'https://www.python.org/'}
{'href': '#'}
{'class': 'biglink', 'href': 'whatsnew/3.7.html'}
{'href': 'whatsnew/index.html'}
{'class': 'biglink', 'href': 'tutorial/index.html'}
{'class': 'biglink', 'href': 'library/index.html'}
{'class': 'biglink', 'href': 'reference/index.html'}
{'class': 'biglink', 'href': 'using/index.html'}
{'class': 'biglink', 'href': 'howto/index.html'}
{'class': 'biglink', 'href': 'installing/index.html'}
{'class': 'biglink', 'href': 'distributing/index.html'}
{'class': 'biglink', 'href': 'extending/index.html'}
{'class': 'biglink', 'href': 'c-api/index.html'}
{'class': 'biglink', 'href': 'faq/index.html'}
{'class': 'biglink', 'href': 'py-modindex.html'}
{'class': 'biglink', 'href': 'genindex.html'}
{'class': 'biglink', 'href': 'glossary.html'}
{'class': 'biglink', 'href': 'search.html'}
{'class': 'biglink', 'hre