<center>

# Курс "Основы Python для анализа данных"

## Артамонов Игорь Михайлович
## Факультет "Прикладная математика" МАИ

### Занятие № 2.  Основные типы данных. Обработка исключений.

</center>


## Общение / вопросы по курсу

Платформа для групповой работы Atlassian Confluence факультета "Прикладная математика"

https://mai.moscow/display/PYTML

* <b>Занятие 2. Основные типы данных. Обработка исключений.</b>
     * Последовательности: строка, список, кортеж, множество
     * Словарь
     * Стеки, очередь, дерево
     * Случайные величины
     * Исключения и их обработка

## virtualenv + Jupyter notebook

```
<Ctrl> + <Alt> + T - новое окно терминала
```

```
$ conda -V

$ conda update conda

$ conda search "^python$"

$ conda create -n yourenvname python=x.x anaconda

$ source activate yourenvname

$ jupyter notebook

$ conda install -n yourenvname [package]
```

# ВАЖНО!

* курс построен как "__слойка__"
* плохое освоение модуля __сильно__ затрудняет освоение следующего модуля
* возвратов и повторов __мало__ ...

# Общее

* Python имеет много __встроенных__ сложных структур данных
* Наиболее часто используемыми являются:
   - строка
   - список
   - кортеж
   - словарь
   - множество
* В большинстве случаев, код для встроенных структур написан на языке низкого уровня и хорошо оптимизирован
* __ВЫВОД № 1__: если Вам требуется какая-то структура, то:
   - поищите уже реализованную структуру (стек, очередь, ...)
   - сводите её к одной из типовых
   - старайтесь максимально использовать встроенные функции типовых структур
* __ВЫВОД № 2__:
   - имеет смысл __полностью__ просматривать руководство по нужному классу

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import scipy as sc
%matplotlib inline

## Основные сложные структуры данных

* связанные списки (linked list) - односторонние и двусторонние
* стек (stack)
* очередь (queue)
* хэш-таблица (hash table)
* двоичное дерево (binary tree)

# Рекурсия

Рекурсия - обращение функции __к самой себе__

In [2]:
def factorial(n):
    if n == 1:
        return 1
    else:
        return n * factorial(n-1)

In [3]:
factorial(10)

3628800

### Сохранение значения

In [None]:
def sum_accum(current, accum, n):
    # Финальное состояние
    if current == n:
        return accum

    # Рекурсия
    else:
        return sum_accum(current + 1, accum + current, n)

In [None]:
sum_accum(0, 0, 5)

### Когда рекурсия полезна?

* большая читаемость кода
* работа с неизменяемыми значениями
* работа с "естественно" рекурсивными структурами (деревья, графы)

### Ограничения

* рекурсия менее эффективная, чем итрации
* ограничена глубина стека

In [6]:
import sys
sys.getrecursionlimit()

1000

### <font color=red>Задание</font>

Вычислите рекурсивно __$e^x$__ по $n$ первым элементам ряда:

$$e(x) = \sum_{i=0}^{n} \frac{x^n}{n!}$$

In [4]:
import math

def my_exp(x, n):
    if n == 0:
        return 1
    return my_exp(x, n - 1) + x**n / math.factorial(n)



In [5]:
print("{:.8f}".format(my_exp(1, 50)))

2.71828183


## Строка

* могут ограничиваться либо одинарными __'< str >'__ , либо двойными __"< str >"__, либо тройными двойными ___"""< multiline str >"""___ кавычками
* в целом, аналогична списку из символов
* может быть преобразована в список командой __list()__
* существуют команды, типичные для обработки строк в других языках

In [7]:
s = 'Ехал Грека через реку, видит грека - в реке рак'

In [8]:
'abc' == "abc"

True

In [9]:
'abc' > "rbc"

False

In [10]:
long_str = """
this is
a very
long 
string
"""

In [11]:
long_str, len(long_str)

('\nthis is\na very\nlong \nstring\n', 29)

In [12]:
s = 'Ехал Грека через реку, видит грека - в реке рак'

In [13]:
s.startswith( 'река' ), s.startswith( 'Ехал' )

(False, True)

In [14]:
print(s.startswith( 'река', 6))

True


In [15]:
print(s.startswith( 'река', 6, 9))

False


In [16]:
print(s.endswith( 'рак'))

True


In [17]:
s.count('рек')

4

In [18]:
s.find('через')

11

In [19]:
s_enc = s.encode('cp1252', errors='ignore')
s_enc

b'   ,   -   '

In [20]:
s = "ascii"

In [21]:
s.join(','), s.join(',,,,,')

(',', ',ascii,ascii,ascii,ascii,')

In [22]:
long_str.split('\n')

['', 'this is', 'a very', 'long ', 'string', '']

### Специальные символы

* \n - перевод строки
* \r - возврат каретки
* \t - табуляция
* \xNN - символ в 16-ричной нотации
* \ - символ экранирования (\\n)

In [23]:
print('a' + '\n' + 'b')

a
b


In [24]:
print('a' + '\r' + 'b')

ab


In [25]:
print('a' + '\t' + 'b')

a	b


In [26]:
print('a' + '\\n' + 'b')

a\nb


### Индексирование строк и списков

* индекс размещается в квадратных скобках __\[ \]__
* начинается с 0
* отрицательный индекс __n__ означает __len(s) - n__ => -1 __исключает__ последний символ
* можно указывать диапазон через двоеточие __:__
* отсутствующий индекс перед двоеточиием означает __"с начала"__, после - __"до последнего символа включительно"__
* можно добавить второе двоеточие, которое означает __"шаг"__

In [27]:
s = 'Большая длинная тестовая строка'

In [28]:
len(s)

31

In [29]:
s[31]

IndexError: ignored

In [30]:
s[16:-1], s[16:len(s)], s[-1]

('тестовая строк', 'тестовая строка', 'а')

In [31]:
s = '0123456789'
s[0:-1:2]

'02468'

### <font color=red>Задание</font>

* пользуясь __только__ индексом, выведите строку в обратном порядке

In [32]:
s[::-1]

'9876543210'

## Операции над строками

In [33]:
s = 'abc' + ' - ' + 'cde'
s

'abc - cde'

In [34]:
s = (s + '? ') * 3
s

'abc - cde? abc - cde? abc - cde? '

In [35]:
to_find = 'abc'
if to_find in s:
    s1 = 'Нашли <' + to_find + '> в строке <' + s + '>'
    print(s1)

Нашли <abc> в строке <abc - cde? abc - cde? abc - cde? >


### Преобразование регистра

In [36]:
s1.upper(), s1.lower()

('НАШЛИ <ABC> В СТРОКЕ <ABC - CDE? ABC - CDE? ABC - CDE? >',
 'нашли <abc> в строке <abc - cde? abc - cde? abc - cde? >')

In [37]:
s1.find('abc')

7

In [38]:
s1.find('abs')

-1

In [39]:
s1.count('abc'), s1[8:].count('abc')

(4, 3)

In [40]:
s = '  qwerty  '
s_left = '<' + s.lstrip() + '>'
s_right = '<' + s.rstrip() + '>'
s_both = '<' + s.strip() + '>'
print(s_left, s_right, s_both)

<qwerty  > <  qwerty> <qwerty>


In [41]:
s1.replace('abc', 'ABC')

'Нашли <ABC> в строке <ABC - cde? ABC - cde? ABC - cde? >'

In [42]:
s1

'Нашли <abc> в строке <abc - cde? abc - cde? abc - cde? >'

In [43]:
s1.split('?')

['Нашли <abc> в строке <abc - cde', ' abc - cde', ' abc - cde', ' >']

### Форматирование

* __% форматирование__
    * %d - целые
    * %s - строки
    * %f - с плавающей точкой

In [44]:
print('Это строка <%s>, это целое число <%05d>, а это число с плавающей точкой <%03d>' % ('ABC', 234, 3.1415926))

Это строка <ABC>, это целое число <00234>, а это число с плавающей точкой <003>


In [46]:
print(s_fmt)

NameError: ignored

* Форматирование классом __formatter__

In [47]:
fmt = 'Это строка <{0:s}>, это целое число <{1:05d}>, это число с плавающей точкой <{2:3.4f}>, а это снова строка {0}'
print(fmt.format('ABC', 234, 3.1415926) )

Это строка <ABC>, это целое число <00234>, это число с плавающей точкой <3.1416>, а это снова строка ABC


In [48]:
fmt = 'Это строка <{}>, это целое число <{}>, это число с плавающей точкой <{}>'
print(fmt.format('ABC', 234, 3.1415926) )

Это строка <ABC>, это целое число <234>, это число с плавающей точкой <3.1415926>


In [49]:
fmt = 'Это строка <{}>, это целое число <{}>, это число с плавающей точкой <{}>, а это снова строка {0}'
print(fmt.format('ABC', 234, 3.1415926) )

ValueError: ignored

In [50]:
a = 123
b = 'I\'m a strting'
c = 3.1415926


In [51]:
s = f"{a} {b} {c}"
print(s)

123 I'm a strting 3.1415926


In [52]:
s = f"{a:05d} {b} {c:.2f}"
print(s)

00123 I'm a strting 3.14


### Для самостоятельного изучения:


* регулярные выражения (regular expressions)

In [None]:
import re

# Список

In [53]:
# Пустой список
l = []

# Список целых чисел
l = [1, 2, 3]

# список со различными типами данных
l = ['abc', 'cde', 3.14159, 2.71828, 1]

### <font color=red>Задание:</font>
* выведите для каждого элемента списка:
        - порядковый номер (начиная с нуля)
        - значения
        - тип значения

In [54]:
# Ваш код здесь

for i, e in enumerate(l):
    print(i, e, type(e))

0 abc <class 'str'>
1 cde <class 'str'>
2 3.14159 <class 'float'>
3 2.71828 <class 'float'>
4 1 <class 'int'>


__list__ - __ключевое__ слово, которое  (формально) может использоваться, как имя переменной.<br>
Однако, это __сильно__ не рекомендуется делать, так как это приводит к побочным эффектам

In [55]:
l = list( np.array([1,2,3,4]))
l

[1, 2, 3, 4]

In [56]:
list = [1,2,3,4]

In [57]:
list

[1, 2, 3, 4]

In [58]:
l = list( np.array([1,2,3,4]))
l

TypeError: ignored

In [59]:
# Удаление объекта приводит к восстановлению поведения по-умолчанию

del list

In [60]:
r = range(10)
s = str(r)
l = list(r)

In [61]:
r, s, l

(range(0, 10), 'range(0, 10)', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [62]:
s = str(l)
s

'[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]'

* Сравнение списков аналогично сравнению строк и выполняется поэлементно (у строк - посимвольно)

In [63]:
[1, 2, 3] < [1, 3, 4], 'abc' > 'cba'

(True, False)

## Индексация списка

Совпадает с индексацией строк:
* индекс размещается в квадратных скобках __\[ \]__
* начинается с 0
* отрицательный индекс __n__ означает __len(s) - n__ => -1 __исключает__ последний символ
* можно указывать диапазон через двоеточие __:__
* отсутствующий индекс перед двоеточиием означает __"с начала"__, после - __"до последнего символа включительно"__
* можно добавить второе двоеточие, которое означает __"шаг"__

### Изменение и добавление элементов

In [64]:
l1 = list( i*2 for i in 'abcdefghijk')
l1

['aa', 'bb', 'cc', 'dd', 'ee', 'ff', 'gg', 'hh', 'ii', 'jj', 'kk']

In [65]:
l2 = list( i for i in range(10))

In [66]:
l1 + l2[2:4] + l2[3:7]

['aa',
 'bb',
 'cc',
 'dd',
 'ee',
 'ff',
 'gg',
 'hh',
 'ii',
 'jj',
 'kk',
 2,
 3,
 3,
 4,
 5,
 6]

In [67]:
l = l1
l.append(l2[2:4])
l

['aa', 'bb', 'cc', 'dd', 'ee', 'ff', 'gg', 'hh', 'ii', 'jj', 'kk', [2, 3]]

In [68]:
l = l1
l.extend(l2[2:4])
l

['aa',
 'bb',
 'cc',
 'dd',
 'ee',
 'ff',
 'gg',
 'hh',
 'ii',
 'jj',
 'kk',
 [2, 3],
 2,
 3]

In [69]:
l1

['aa',
 'bb',
 'cc',
 'dd',
 'ee',
 'ff',
 'gg',
 'hh',
 'ii',
 'jj',
 'kk',
 [2, 3],
 2,
 3]

### <font color=blue>Нужно запомнить</font>

Списки - <b>изменяемый</b> тип данных

### Удаление элементов

In [70]:
l.clear()
l.extend([1,2,3,4,5])
l

[1, 2, 3, 4, 5]

In [71]:
l.insert(5, 6)
l

[1, 2, 3, 4, 5, 6]

In [72]:
l.sort(reverse=True)
l3 = l.copy()

In [73]:
l.remove(2)
l

[6, 5, 4, 3, 1]

In [74]:
l.pop()
l

[6, 5, 4, 3]

### <font color=red>Опишите, что делает этот код</font>

In [76]:
txt = 'а роза упала на лапу азора' # объявления строки
words = txt.split() # создание списка слов из строки

# создание списка пар (длина слова, слово)
l = list()
for word in words:
    l.append((len(word), word))
print(l)

# сортировка созданного списка по длине слова в порядке убывания
l.sort(reverse=True)
print(l)

# создание списка, содержащего только слова, из списка, полученного выше
res = list()
for length, word in l:
    res.append(word)

print(res)


[(1, 'а'), (4, 'роза'), (5, 'упала'), (2, 'на'), (4, 'лапу'), (5, 'азора')]
[(5, 'упала'), (5, 'азора'), (4, 'роза'), (4, 'лапу'), (2, 'на'), (1, 'а')]
['упала', 'азора', 'роза', 'лапу', 'на', 'а']


### Методы списков

```python
append() Добавляет элемент в конец списка
extend() Добавляет все элементы списка к другому списку
insert() Вставляет элемент на место, указнное индексом
remove() Удаляет элемент из списка
pop() Удаляет элемент из списка и возвращает его, как параметр
clear() Очищает список (удаляет все элементы)
index() Возвращает индекс первого встречающегося элемента
count() Возвращает количество вхождений данного элемента в списке
sort() Сортирует элементы списка в возрастающем порядке
reverse() Изменяет порядок элементов в списке на обратный
copy() Копирует список
```

```python
all() Возвращает True если все элементы списка верны или если список пустой
any() Возвращает True если хотя бы один элементы списка верены. если списко пустой, возвращает False
enumerate() Возвращает объект enumerate, содержащий индекс и значение всех элементов списка в виде кортежей
len() Возвращает длину (количество элементов в) списке
list() Преобразует любой итерируемый объект (iterable) в список (кортеж, строку, множество, словарь)
max() Возвращает максимальный элемент в списке
min() Возвращает минимальный элемент в списке
sorted() Возвращает новый отсортированный список (не сортирует сам список!)
sum() Возвращает сумму элементов в списке
```

### <font color=red>Задание</font>

* Постройте частотную характеристику по словам в тексте Гамлета с использованием списков
    * Используйте split для разбивки по пробелам
    * удалите возвраты строк и символы, отличающиеся от букв
    * выведите 10 наиболее часто встречающихся слов
    * используйте zip для слияния списков в один
* Посчитайте, сколько вообще слов в Гамлете

#### <font color=blue>Порядок решения:</font><br>

1. Получить текст по урлу.
2. Разбить текст на слова.
3. Удалить символы, не являющиеся буквами.
4. Построить каунтер по списку слов.
5. Посчитать количество слов в тексте.

In [77]:
import urllib

hamlet_url = "http://erdani.com/tdpl/hamlet.txt"
f = urllib.request.urlopen(hamlet_url)
hamlet_text = f.read().decode('utf-8')

In [78]:
text = [i.lower() for i in hamlet_text.split() if i.isalpha()]

In [79]:
from collections import Counter
с = Counter(text)
с.most_common(10)

[('the', 1083),
 ('and', 939),
 ('to', 727),
 ('of', 670),
 ('a', 540),
 ('i', 523),
 ('my', 519),
 ('you', 433),
 ('in', 420),
 ('that', 343)]

In [80]:
print(len(text))

23230


### Генераторы списков (list comprehensions)

In [81]:
l = [i**2 for i in range(10)]
l

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [82]:
l_even = [i*j for i in range(10) for  j in range(6) if i*j % 2 == 0]
l_even

[0,
 0,
 0,
 0,
 0,
 0,
 0,
 2,
 4,
 0,
 2,
 4,
 6,
 8,
 10,
 0,
 6,
 12,
 0,
 4,
 8,
 12,
 16,
 20,
 0,
 10,
 20,
 0,
 6,
 12,
 18,
 24,
 30,
 0,
 14,
 28,
 0,
 8,
 16,
 24,
 32,
 40,
 0,
 18,
 36]

In [83]:
list1 = ['1', '2', '3', '4', '5']
str1 = ' '.join(list1)
str1

'1 2 3 4 5'

In [84]:
list2 = list(range(6))
str2 = ''.join(list2)

TypeError: ignored

### <font color=red>Задания:</font>

С помощью генераторов списка:
* Исправьте предыдущий пример, чтобы получить строку
* просуммируйте числа от 1 до 100

In [85]:
''.join(str(i) for i in list2)

'012345'

In [86]:
sum([i for i in range(1, 101)])

5050

# Кортеж

Кортеж (tuple) отличается от списка тем, что он __неизменяемый__ (immutable)

In [87]:
t = 'a', 'b', 'c', 'd', 'e'
t

('a', 'b', 'c', 'd', 'e')

In [88]:
t = ('a', 'b', 'c', 'd', 'e')
t

('a', 'b', 'c', 'd', 'e')

In [89]:
t = tuple('Some string')
t

('S', 'o', 'm', 'e', ' ', 's', 't', 'r', 'i', 'n', 'g')

In [90]:
url = 'www.mai.ru'
a,b,c = url.split('.')

In [91]:
a, b, c

('www', 'mai', 'ru')

In [92]:
a, b = b, a

In [93]:
url_parts = url.split('.')
url_parts, type(url_parts)

(['www', 'mai', 'ru'], list)

In [94]:
d = {i:c for i, c in enumerate('abcdefg')}
d

{0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e', 5: 'f', 6: 'g'}

In [95]:
items = d.items()
items

dict_items([(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd'), (4, 'e'), (5, 'f'), (6, 'g')])

In [96]:
sorted(items)

[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd'), (4, 'e'), (5, 'f'), (6, 'g')]

### <font color=green>Полезно запомнить</font>

In [97]:
(1, 2, 3) < (1, 3, 4)

True

In [98]:
[1, 2, 3] < (1, 3, 4)

TypeError: ignored

In [99]:
tuple([1, 2, 3]) > (1, 3, 4), [1, 2, 3] > list((1, 3, 4))

(False, False)

In [100]:
gen = (i for i in 'Как-то вот так генерируем')

In [101]:
gen, type( list( gen))

(<generator object <genexpr> at 0x7fa583a0bd00>, list)

# Словарь

In [102]:
d = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e'}
d

{1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e'}

In [103]:
d[1]='oops'
d

{1: 'oops', 2: 'b', 3: 'c', 4: 'd', 5: 'e'}

In [104]:
d.keys(), d.values(), d.items()

(dict_keys([1, 2, 3, 4, 5]),
 dict_values(['oops', 'b', 'c', 'd', 'e']),
 dict_items([(1, 'oops'), (2, 'b'), (3, 'c'), (4, 'd'), (5, 'e')]))

In [105]:
sum( list( d.values()))

TypeError: ignored

In [106]:
list(d.items())

[(1, 'oops'), (2, 'b'), (3, 'c'), (4, 'd'), (5, 'e')]

In [107]:
for i in d:
    print( i, d[i])


1 oops
2 b
3 c
4 d
5 e


In [108]:
for i, k in enumerate(d):
    print( i, k, d[k])

0 1 oops
1 2 b
2 3 c
3 4 d
4 5 e


In [109]:
for i, k in enumerate( range(10)):
    print(i, k)

0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9


In [110]:
d.pop(2)

'b'

In [111]:
d[8] = 'oops!'
d

{1: 'oops', 3: 'c', 4: 'd', 5: 'e', 8: 'oops!'}

In [112]:
del d[3]
d

{1: 'oops', 4: 'd', 5: 'e', 8: 'oops!'}

hashable!!!

### Генераторы словарей (dictionary comprehensions)

In [113]:
d = {i:i**2 for i in range(11)}
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}

In [114]:
d = (i for i in range(11))
d

<generator object <genexpr> at 0x7fa583a151a8>

In [115]:
list(d)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [116]:
# в чем ошибка?
d = [i:i**2 for i in range(11)]
d

SyntaxError: ignored

### <font color=red>Задание</font>

* Перепишите код с частотной характеристикой слов в тексте Гамлета с использованием словаря

In [119]:
d = dict()
for i in text:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1

d = sorted(d.items(), key=lambda x: x[1], reverse=True)

for i, j in enumerate(d):
    k, v = j
    if i > 9:
        break
    print(k, v)

the 1083
and 939
to 727
of 670
a 540
i 523
my 519
you 433
in 420
that 343


## Списки и словари в аргументах функции

#### Скорректируйте функции так, чтобы они выдавали аргумент функции и его тип

In [120]:
def login(*usernamepassword):
    # Get username in the list.
    username = usernamepassword[0]
    # Get password in the list.
    password = usernamepassword[1]

    if (username == 'hello') and (password == 'hello'):
        print("Login Success!")
    else:
        print("Login Failed!")

login('hello', 'hello')

Login Success!


In [121]:
def loginWithDictArguments(**upDict):
    # Get all keys in the dictionary.
    keys = upDict.keys()

    username = ''
    password = ''
    email = ''

    # Loop in the dict keys.
    for key in keys:
        if key == 'username':
            username = upDict[key]
        
        if key == 'password':
            password = upDict[key]

        if key == 'email':
            email = upDict[key]

    if (username == 'hello') and (password == 'hello'):
        print('Login Success. Your email is ' + email)
    else:
        print('Login fail. Your email is ' + email)     

loginWithDictArguments(username='hello', password='hello', email='vasya@pupkin.ru') 

Login Success. Your email is vasya@pupkin.ru


## Множество

In [122]:
a = set((0,1,2,3,4,5,6,7,8,9,3,4,5,6,7,8,0))
b = set(['a', 'b', 'c', 'd', 1, 2, 3, 4])

In [123]:
a,b

({0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, {1, 2, 3, 4, 'a', 'b', 'c', 'd'})

In [124]:
print('1=', a.intersection(b), '\n2=', b.intersection(a))

1= {1, 2, 3, 4} 
2= {1, 2, 3, 4}


In [125]:
print('1=', a.difference(b), '\n2=', b.difference(a))

1= {0, 5, 6, 7, 8, 9} 
2= {'c', 'b', 'a', 'd'}


In [126]:
print('1=', a.symmetric_difference(b), '\n2=', b.symmetric_difference(a))

1= {0, 5, 6, 7, 8, 9, 'b', 'd', 'c', 'a'} 
2= {0, 5, 6, 7, 8, 9, 'b', 'd', 'c', 'a'}


In [127]:
print(a.union(b))

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'b', 'd', 'c', 'a'}


### <font color=red>Задание</font>

* Найдите количество уникальных слов в Гамлете с помощью множества

In [128]:
len(set(text))

3376

### Стек

In [129]:
stack = [1, 2, 3, 4, 5]

In [130]:
stack.append(6)

In [131]:
stack.append(7)

In [132]:
stack

[1, 2, 3, 4, 5, 6, 7]

In [133]:
stack.pop()

7

In [134]:
stack.pop()

6

In [135]:
stack

[1, 2, 3, 4, 5]

# Collections

In [136]:
import collections

### Очередь

In [137]:
queue = collections.deque()

In [138]:
from collections import deque, ChainMap, OrderedDict, Counter

In [139]:
queue = deque()

```python
    append(x) - добавить элемент справа
    appendleft(x) - добавить элемент слева
    extend(iterable) - расширить списком справа
    extendleft(iterable) - расширить списком слева
    pop() - извлечь элемент справа
    popleft() - извлечь элемент слева
```

In [140]:
import random 

queue = deque()
for i in range(50):
    x = random.randint(0,1000)
    size = len(queue)
    if size == 0:
        queue.append(x)
    elif x < queue[0]:
        queue.appendleft(x)
    elif x >  queue[size-1]:
        queue.append(x)

In [141]:
 queue

deque([17, 36, 37, 62, 99, 108, 428, 902, 936, 952])

### ChainMap

Объединяет словари без создания нового объекта "словарь". "Вохдящие" в цепочку словари используются, как ссылки

In [142]:
chain = ChainMap()

In [143]:
d1 = {'вишня': 5, 'яблоко': 1, 'персик': 8, 'груша': 2, 'тыква':7,  'баклажан':11}
d2 = {'мороженное': 27, 'яблоко': 2, 'торт': 102, 'маффин': 13, 'ром-баба':32,  'пирожок с капустой':33}

In [144]:
chain = ChainMap(d1, d2)

In [145]:
chain['вишня'], chain['торт'], chain['яблоко']

(5, 102, 1)

In [146]:
len(d1), len(d2), len(chain)

(6, 6, 11)

### Словарь с упорядочением


Сохраняет порядок, у котором вносились элементы списка

In [147]:
# обычный словарь
d = {'вишня': 5, 'яблоко': 1, 'персик': 8, 'груша': 2, 'тыква':7,  'баклажан':11}

In [148]:
# словарь, отсортированый по ключам
OrderedDict(sorted(d.items(), key=lambda t: t[0]))

OrderedDict([('баклажан', 11),
             ('вишня', 5),
             ('груша', 2),
             ('персик', 8),
             ('тыква', 7),
             ('яблоко', 1)])

In [149]:
# словарь, отсортированый позначениям
OrderedDict(sorted(d.items(), key=lambda t: t[1]))

OrderedDict([('яблоко', 1),
             ('груша', 2),
             ('вишня', 5),
             ('тыква', 7),
             ('персик', 8),
             ('баклажан', 11)])

In [150]:
# словарь, отсортированый по длине слова-ключа
OrderedDict(sorted(d.items(), key=lambda t: len(t[0])))

OrderedDict([('вишня', 5),
             ('груша', 2),
             ('тыква', 7),
             ('яблоко', 1),
             ('персик', 8),
             ('баклажан', 11)])

### Счетчик вхождения элементов

Интерфейс аналогичен словарю

In [151]:
from collections import Counter
import urllib
import re

hamlet_url = "http://erdani.com/tdpl/hamlet.txt"
f = urllib.request.urlopen(hamlet_url)
hamlet_text = f.read().decode('utf-8')
words = re.findall(r'\w+', hamlet_text.lower())
ctr = Counter(words).most_common(10)
ctr

[('the', 1091),
 ('and', 969),
 ('to', 767),
 ('of', 675),
 ('i', 633),
 ('a', 571),
 ('you', 558),
 ('my', 520),
 ('in', 451),
 ('it', 421)]

In [152]:
sum([k for i,k in ctr])

6656

# Дерево

### <font color=red>Задание</font>

* Создайте список из 1000 случайных строк, состоящих из латинских букв.
* Каждая строка - случайной длиной от 3 до 8 символов.
* Реализуйте бинарное дерево для строк
* Реализуйте поиск ближайшего слова для заданного.

In [4]:
class Node:
    def __init__(self, key):
        self.left = None
        self.right = None
        self.key = key


class BST:
    def __init__(self):
        self.root = None

    def search(self, key):
        cur = self.root
        prev = ''
        while cur is not None:
            if cur.key == key:
                return key
            elif cur.key < key:
                prev = cur.key
                cur = cur.right
            else:
                prev = cur.key
                cur = cur.left
        return prev

    def insert(self, key):
        if self.root is None:
            self.root = Node(key)
        else:
            cur = self.root
            prev = None
            while cur is not None:
                prev = cur
                if key <= cur.key:
                    cur = cur.left
                else:
                    cur = cur.right
            if key <= prev.key:
                prev.left = Node(key)
            else:
                prev.right = Node(key)

    def remove(self, key):
        self.root = self._remove(self.root, key)

    def _remove(self, node, key):
        if node is None:
            return None
        elif node.key < key:
            node.right = self._remove(nore.right, key)
        elif node.key > key:
            node.left = self._remove(nore.left, key)
        else:
            if node.left and node.right:
                pred = self._find_predecessor(cur.right)
                node.key = pred.key
                node.right = self._remove(node.right, pred.key)
            elif node.left:
                node.key = node.left.key
                node.right = node.left.right
                node.left = node.left.left
            elif node.right:
                node.key = node.right.key
                node.left = node.right.left
                node.right = node.right.right
            else:
                del node
                return None
            return node

    def _find_predecessor(self, node):
        while node.left is not None:
            node = node.left
        return node

In [5]:
import random
import string


def random_strings(n=1000):
    letters = string.ascii_lowercase
    res = []
    for _ in range(n):
        str_len = random.randint(3, 8)
        res.append(''.join(random.choice(letters) for _ in range(str_len)))
    return res

bst = BST()
keys = random_strings()
for i in keys:
    bst.insert(i)

In [8]:
bst.search('kek')

'kdiin'

# Исключения и их обработка

```python
try:
    You do your operations here;
    ......................
except ExceptionI:
    If there is ExceptionI, then execute this block.
except ExceptionII:
    If there is ExceptionII, then execute this block.
    ......................
else:
    If there is no exception then execute this block. 
```

In [9]:
l = list(range(10))
l[11]

IndexError: ignored

In [10]:
try:
    print(l[9])
except IndexError:
    print('Выход за границы списка!')
else:
    print('Получилось!')


9
Получилось!


In [11]:
try:
    open('very_strange_file.txt')
except:
    print('Что-то не так с файлом!')
else:
    print('Странно ... Откуда он здесь?')

Что-то не так с файлом!


In [12]:
def func( n ):
    if n < 0:
        raise ValueError("n должен быть больше 0!", n)
    pass

In [13]:
func(-2)

ValueError: ignored

## Экзаменационные вопросы:

* Рекурсия
* Регулярные выражения
* Обработка и индексирование строк
* Обработка и индексирование списков
* Словари
* Множества
* Очередь
* Дерево
* Стек
* Исключения и их обработка

### К следующему занятию прочитать:


* что такое объектно ориентированное програмирование
* что такое функциональное программирование