## 8. Структуры данных. Генераторы.

### 8.1 Множество
**Множества** – это неупорядоченные наборы простых объектов. Они необходимы тогда, когда присутствие объекта в наборе важнее порядка или того, сколько раз данный объект там встречается.
Используя множества, можно осуществлять проверку принадлежности, определять, является ли данное множество подмножеством другого множества, находить пересечения множеств и так далее.

 #### Основные операции

<table style="width: 500px;">
 <thead style="background: #e7e7e7; font-weight: bold;">
    <tr >
        <td style="text-align: center;">Операция</td>
        <td style="text-align: center;">Интерпретация</td>
    </tr>
  </thead>
   <tbody>
    <tr>
        <td style="text-align: center;">S = set()</td>
        <td style="text-align: center;">Пустое множество</td>
    </tr>
    <tr>
        <td style="text-align: center;">S = {1, 2}</td>
        <td style="text-align: center;">Множество из двух элементов</td>
    </tr>
    <tr>
        <td style="text-align: center;">
        S = set([1, 2, 3])<br/>
        S = {1, 2, 3}<br/>
        </td>
        <td style="text-align: center;">Альтернативные способы создания множеств</td>
    </tr>
    <tr>
        <td style="text-align: center;">1 in S</td>
        <td style="text-align: center;">Проверка на вхождение элемента в множество</td>
    </tr>
    <tr>
        <td style="text-align: center;">S.add(1)</td>
        <td style="text-align: center;">Методы: добавить новый элемент </td>
    </tr>
    <tr>
        <td style="text-align: center;">S.issubset({1, 2, 3, 4})</td>
        <td style="text-align: center;">является ли подмножеством множество S</td>
    </tr>
    <tr>
        <td style="text-align: center;">S.issuperset(S2)</td>
        <td style="text-align: center;">является ли надмножеством множество S</td>
    </tr>
    <tr>
        <td style="text-align: center;">S.union(S2) <br/> S | S2</td>
        <td style="text-align: center;">объединение</td>
    </tr>
    <tr>
        <td style="text-align: center;">S.intersect(S2) <br/> S & S2</td>
        <td style="text-align: center;">пересечение</td>
    </tr>
    <tr>
        <td style="text-align: center;">S.difference(S2) <br/> S - S2</td>
        <td style="text-align: center;">разница</td>
    </tr>
    <tr>
        <td style="text-align: center;">S.symmetric_difference(S2) <br/> S ^ S2</td>
        <td style="text-align: center;">симметрическая разница</td>
    </tr>
  </tbody>
</table>

## 8.2. Генераторы списков (List comprehensions)

In [1]:
# 1. Стандартный способ
initial_array = [1, 2, 3, 4]

array = initial_array[:]
for i in range(len(array)):
    array[i] *= 2

print(initial_array, array, sep=' -> ')

# or
array = []
for x in initial_array:
    array.append(x * 2)
    

# 2. Использование генераторов списков
array = [x * 2 for x in initial_array]
print(initial_array, array, sep=' -> ')

[1, 2, 3, 4] -> [2, 4, 6, 8]
[1, 2, 3, 4] -> [2, 4, 6, 8]


In [7]:
value = 'Beautiful is better than ugly. \n'
value.rstrip()
?open

[0;31mSignature:[0m
[0mopen[0m[0;34m([0m[0;34m[0m
[0;34m[0m    [0mfile[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mmode[0m[0;34m=[0m[0;34m'r'[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mbuffering[0m[0;34m=[0m[0;34m-[0m[0;36m1[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mencoding[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0merrors[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mnewline[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mclosefd[0m[0;34m=[0m[0;32mTrue[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mopener[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Open file and return a stream.  Raise OSError upon failure.

file is either a text or byte string giving the name (and the path
if the file isn't in the current working directory) of the file to
be opened or an integer file descriptor of the file

In [8]:
file = open('zen.txt')

def strip_line(line):
    return line.rstrip()


lines = file.readlines()
print(lines)

lines = [line.rstrip() for line in lines]


print('', 'Stripped lines:', lines, sep='\n')
lines_copy = [
    line*2
    for single_line in lines
]

better_lines = [
    line
    for line in lines
    if 'better' in line
]
print('', 'Lines with better:', better_lines, sep='\n')


file.close()

FileNotFoundError: [Errno 2] No such file or directory: 'zen.txt'

In [29]:
with open('zen.txt') as file:
    for line in file:
        print(line, end='')
print(1)

Beautiful is better than ugly. 
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!

In [1]:
concatinations = [x + y for x in 'abc' for y in 'lmn']
print(concatinations)

# OR
concatinations = []
for x in 'abc':
    for y in 'lmn':
        concatinations.append(x + y)
print(concatinations)
concatinations = [
    x + y 
    for x in 'abc' 
    for y in 'lmn'
]


['al', 'am', 'an', 'bl', 'bm', 'bn', 'cl', 'cm', 'cn']
['al', 'am', 'an', 'bl', 'bm', 'bn', 'cl', 'cm', 'cn']


In [1]:
[x**2 for x in range(1, 25, 2) if not x % 3]

[9, 81, 225, 441]

In [10]:
data = [[1, 2],
        [3, 4],
        [5, 6]]

data = [
    [1, 2],
    [3, 4],
    [5, 6]
]


flat_array = [element for row in data 
                      for element in row]

flat_array = [
    element
    for row in data
    for element in row
]
print(flat_array)

[1, 2, 3, 4, 5, 6]


## 8.2. Генераторы словарей (Dict comprehensions)

In [1]:
keys = (1, 2, 3)
values = ('a', 'B', 'c')

trash_map = {}
for k, v in zip(keys, values):
    trash_map[k**3] = v.upper()

# OR

trash_map = {k**3: v.upper() for k, v in zip(keys, values)}
print(trash_map)

trash_map = {k: v.lower() for k, v in trash_map.items() 
             if k > 8}
print(trash_map)

{8: 'B', 1: 'A', 27: 'C'}
{27: 'c'}


## 8.3. Генераторы множеств (Set comprehensions)

In [9]:
super_set = {x * 2 * (-1 if x % 2 else 1) for x in range(10) 
             if abs(x) > 5}
# OR
super_set = {x * 2 * (x % 2 or -1) for x in range(10) 
             if abs(x) > 5}

print(super_set)

{-16, 18, -12, 14}


### 8.4. Генераторы

In [16]:
generator = (x * 2 * (x % 2 or -1) for x in range(10) 
             if abs(x) > 5)

for x in generator:
    print(x, end=' ')

print('\nSecond attempt:')
for x in generator:
    print(x, end=' ')

-12 14 -16 18 
Second attempt:


In [27]:
generator = (x * 2 * (x % 2 or -1) for x in range(10) 
             if abs(x) > 5)

# next(generator)
# next(generator)
# next(generator)
# next(generator)
# next(generator)
elements = [1, 2]
for x in iter(elements):
    print(x, end=' ')

def iter(elements):
     return elements.__iter__()

# pseudo
#...
def __iter__(self):
    while i < n:
        yield self.values[i]
    
# internal version of for loop
elements_iter = iter(elements)
while True:
    try:
        x = next(elements_iter)
    except StopIteration:
        break
    print(x, end=' ')

1 2 1 2 

In [11]:
elements_sum = sum([x ** 3 for x in range(4)])
elements_sum = sum((x ** 3 for x in range(4)))
elements_sum = sum(x ** 3 for x in range(4))

print(elements_sum)

36


# Задачи

## 1. Не уникальные элементы.
 **Дано:** непустой массив целых чисел.
 
 **Задание:** нужно получить массив, состоящий только из неуникальных элементов данного массива. Для этого необходимо удалить все уникальные элементы (которые присутствуют в данном массиве только один раз). Для решения этой задачи не меняйте оригинальный порядок элементов. Пример: [1, 2, 3, 1, 3], где 1 и 3 неуникальные элементы и результат будет [1, 3, 1, 3]. 
 
 **Пример:**
 
     [1, 2, 3, 1, 3], результат: [1, 3, 1, 3]
     [1, 2, 3, 4, 5], результат: []
     [5, 5, 5, 5, 5], результат: [5, 5, 5, 5, 5]
     [10, 9, 10, 10, 9, 8], результат: [10, 9, 10, 10, 9]

## 2. Перестановки.
 **Дано:** x, y, z, n.
 
 **Задание:** нужно получить список всех возможных перестановок чисел x, y, z, где x + y + z != n. 
 
 **Пример:**
     
     
     x = 0 y = 0 z = 1
     n = 2, результат: [[0, 0, 0], [0, 0, 1], [0, 1, 0], [1, 0, 0], [1, 1, 1]]

## 3. Удвоенные нечетные.
 **Дано:** n.
 
 **Задание:** нужно получить список "удвоенных" нечетных чисел от 0 до n. 
 
 **Пример:**
 
     n = 5, результат: [2, 6]


## [Junior] 4. Дешифратор.
 **Дано:** шифровальная решетка (4 на 4) и зашифрованный пароль (4 на 4) представлены, как массив строк.
 
 **Задание.** 
 Помогите Софи написать дешифратор для паролей, которые Никола зашифровал с помощью шифровальной решетки. Шифрорешетка - это квадрат 4 на 4 с четырьмя вырезанными окошками. Поместите решетку на листе бумаги такого же размера с буквами, выписываете первые 4 символа, которые видно в окошках (см. рисунок). Затем поверните решетку на 90 градусов по часовой стрелке. Выпишите следующие символы и повторите поворот. В итоге процедура повторяется 4 раза. Таким образом сложно узнать пароль без специальной решетки.
 
 Напишите программу, которая поможет проводить данную процедуру.
 
 
 **Пример:**
 
     (('X...',
       '..X.',
       'X..X',
       '....'),
      ('itdf',
       'gdce',
       'aton',
       'qrdi'), результат: 'icantforgetiddqd'
      
     (('....',
       'X..X',
       '.X..',
       '...X'),
      ('xhwc',
       'rsqx',
       'xqzz',
       'fyzr')), результат: 'rxqrwsfzxqxzhczy'
       
## [Junior+] 5. Возраст привидений
 **Дано:** степень прозрачности, как целое число.
 
 **Задание.** 
 У Николы появилось свободное время и он решил заняться исследованием привидений. Он хочет найти способ, как определять возраст привидений. Согласно древним фолиантам, возраст связан со степенью прозрачности призраков. Никола составил шкалу измерений прозрачности от 10000 до 0, где 10000 - это совсем не прозрачное "новорождённое" привидение (0 лет) и 0 - это уже невидимка (возраст неизвестен).

После множества экспериментов, Никола кажется начел взаимосвязь. На каждый "день рождения", степень прозрачности привидения уменьшается на количество единиц, равное его возрасту, если возраст есть одно из чисел Фибоначчи (подробней здесь), иначе увеличивается на единицу.

Для примера:
"Новорождённое" привидение -- 10000 единиц прозрачности.

1 год -- 10000 - 1 = 9999 (1 число Фибоначчи).

2 года -- 9999 - 2 = 9997 (2 число Фибоначчи).

3 года -- 9997 - 3 = 9994 (3 число Фибоначчи).

4 года -- 9994 + 1 = 9995 (4 не число Фибоначчи).

5 лет -- 9995 - 5 = 9990 (5 число Фибоначчи).
Помогите Николе написать функцию, которая будет определять возраст привидения по прозрачности. Вам известно измерение прозрачности, как число от 0 до 10000 включительно. Привидения не бывают старше 5000 лет, так как потом просто исчезают (серьезно, научный факт).
 
 
 **Пример:**
 
    прозрачность = 10000, возраст: 0
    прозрачность = 9999, возраст: 1
    прозрачность = 9997, возраст: 2
    прозрачность = 9994, возраст: 3
    прозрачность = 9995, возраст: 4
    прозрачность = 9990, возраст: 5
       