# План семинара

* **Немного вспомним питон**

* **Numpy**

## Additional Python Stuff

### 1. Генераторы

Больше про генераторы можно почитать [здесь](https://www.python.org/dev/peps/pep-0289/)

In [None]:
# Обычный генератор списков
[i for i in range(10)]

In [None]:
# Вы можете использовать символ "_", если вам не нужен счётчик
[0 for _ in range(10)]

In [None]:
# Генерировать можно и словари
{i: i**2 for i in range(10)}

In [None]:
# В генераторе можно добавить условие
[i for i in [3, 14, 15, 92, 6] if i % 2 == 0]

### 2. lambda функции

Простую функцию часто можно задать лямбдой в одну строку

In [None]:
(lambda x: x + 2)(2)

Согласно [PEP 8](https://www.python.org/dev/peps/pep-0008/), лямбды **нельзя** присваивать каким-либо переменным.

Для создания именованных функций **всегда** используйте `def`.

In [None]:
# Хороший стиль
def f(x):
    return 2*x


# Плохой стиль!
f = lambda x: 2*x

### 3. map, zip, sorted, sum, set

1. `map` возвращает итерируемый объект, который является результатом применения переданной функции к переданному итерируемому объекту
2. `zip` слепляет значения двух итерируемых объектов попарно
3. `sorted` сортирует
4. `sum` суммирует
5. `set` поможет получить набор уникальных значений

In [None]:
print(list(map(lambda x: x**2, [1, 2, 3, 4])))
print(list(zip([1, 2, 3], ['a', 'b', 'c'])))
print(sorted([2, 3, 1, 4]))
print(sum([1, 2, 3]))
print(set([1, 2, 3, 4, 2, 3, 4, 3, 3, 2, 3, 4]))

### 4. itertools.chain

Иногда бывает нужно склеить несколько списков последовательно

In [None]:
import itertools


print(list(itertools.chain([1, 2, 3], [4], [5, 6])))

А если у нас список списков?

In [None]:
list_of_lists = [[1, 2, 3], [4], [5, 6]]

In [None]:
list(itertools.chain(*list_of_lists))

### 5. enumerate

Использование `enumerate` часто удобнее, чем конструкция `for i in range(len(arr))` с использованием `arr[i]` в теле цикла

In [None]:
arr = ['elements', 'in', 'list']
for i, value in enumerate(arr):
    print(i, value)

In [None]:
print({i: value for i, value in enumerate(arr)})

### 6. collections.Counter

Иногда необходимо посчитать количество уникальных объектов в списке и их частотность

In [None]:
from collections import Counter


print(Counter([1, 2, 3, 1, 1, 1, 4]))
print(Counter('A QUiCk brOwn fox jUMPs oVeR the laZy dog'))
print(Counter('A quick brown fox jumps over the lazy dog'.lower()))

### 7. Однострочный `if`

In [None]:
print('Yes' if 2 == 3 else 'No')

### 8. f-строки

Можно использовать, начиная с Python 3.6

In [None]:
print(f'sum of 2 and 3 is {2 + 3}')

In [None]:
a = 42

print(f'The answer to everything is {a}')

### Задания

Чтобы ощутить _все_ удобства синтаксического сахара Python, попробуйте не использовать циклы при решении этих заданий, заменяя их на генераторы и map-ы. В таком случае каждое задание решается в одну строчку

Конструкция `assert` поднимает ошибку, если условие после него не выполнено. Все assert'ы ниже должны быть пройдены

#### 1. Напишите генератор следующего списка: [1, 2, 3, 4, 5, 6, 7, 8, 9]

In [None]:
a = # Your code goes here

In [None]:
assert a == [1, 2, 3, 4, 5, 6, 7, 8, 9]

#### 2. Возведите каждый элемент списка, полученного в результате выполнения прошлого задания, в квадрат

In [None]:
a = # Your code goes here

In [None]:
assert a == [1, 4, 9, 16, 25, 36, 49, 64, 81]

#### 3. Удалите нечётные числа из списка, полученного на предыдущем этапе

In [None]:
a = # Your code goes here

In [None]:
assert a == [4, 16, 36, 64]

#### 4. Отсортируйте список в обратном порядке (у функции `sorted` есть параметр `reverse`)

In [None]:
a = # Your code goes here

In [None]:
assert a == [64, 36, 16, 4]

#### 5. Создайте словарь, в котором ключами будут значения этого списка, а значениями  — их индексы  

In [None]:
a = # Your code goes here

In [None]:
assert a == {36: 1, 64: 0, 16: 2, 4: 3}

print('Well done!')

## Numpy

In [None]:
import numpy as np

### Способы создания Numpy arrays
* Конвертация из Python structures
* Генерация с помощью встроенных функций
* Чтение с диска

### Конвертация из Python structures

In [None]:
np.array([1, 2, 3, 4, 5, '5'])

При конвертации можно задавать тип данных с помощью аргумента [dtype](https://docs.scipy.org/doc/numpy/reference/generated/numpy.dtype.html): 

In [None]:
np.array([1, 2, 3, 4, 5], dtype=np.float32)

In [None]:
np.array([1, 2, 3, 4, 5, '5'], dtype=int)

In [None]:
np.array([1, 2, 3, 4, 'some string'], dtype=np.float32)

Аналогичное преобразование:

In [None]:
np.float32([1, 2, 3, 4, 5])

### С чем мы работаем?

In [None]:
arr = np.array([1, 2, 3, 4, 5], dtype=np.float32)

In [None]:
type(arr)

In [None]:
arr.dtype

### Генерация Numpy arrays

* [arange](https://docs.scipy.org/doc/numpy/reference/generated/numpy.arange.html) — аналог range из Python, которому можно передать нецелочисленный шаг
* [linspace](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linspace.html) — способ равномерно разбить отрезок на n-1 интервал
* [logspace](https://docs.scipy.org/doc/numpy/reference/generated/numpy.logspace.html) — способ разбить отрезок по логарифмической шкале
* [zeros](https://docs.scipy.org/doc/numpy/reference/generated/numpy.zeros.html) — создаёт массив заполненный нулями заданной размерности
* [ones](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ones.html) — создаёт массив заполненный единицами заданной размерности
* [empty](https://docs.scipy.org/doc/numpy/reference/generated/numpy.empty.html) — создаёт массив неинициализированный никаким значением заданной размерности
* [full](https://docs.scipy.org/doc/numpy/reference/generated/numpy.full.html) — создаёт массив заполненный любым выбранным значением заданной размерности
* [random.normal](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.normal.html) — позволяет генерировать элементы из нормального распределения
* [identity](https://docs.scipy.org/doc/numpy/reference/generated/numpy.identity.html) — создаёт единичную матрицу нужного размера

In [None]:
np.arange(0, 5, 0.5)

In [None]:
np.linspace(0, 5, 20)

In [None]:
np.logspace(0, 1, 5, base=10)

In [None]:
np.logspace(-1, -1e-5, 20, base=100)

In [None]:
np.zeros((2, 3))

In [None]:
np.ones((3, 2))

In [None]:
a = np.zeros((2, 3))
np.ones_like(a)

In [None]:
np.full((3, 4, 2), 5, dtype=np.float32)

In [None]:
np.random.seed(123)

np.random.normal(0, np.sqrt(10), (3, 4))

In [None]:
np.identity(5)

Pазмеры массива хранится в поле **shape**, а количество размерностей - в **ndim**

In [None]:
array = np.ones((2, 3))
print(f'Размерность массива - {array.shape}, количество размерностей - {array.ndim}')

In [None]:
array = np.arange(0, 6, 0.5)

In [None]:
array = array.reshape((2, 6))
array

In [None]:
arr = np.arange(0, 60)
arr

In [None]:
arr = arr.reshape(3, -1, 20)
arr

In [None]:
np.ravel(arr)

### Индексация

В NumPy работает привычная индексация Python, включая использование отрицательных индексов и срезов

In [None]:
array = np.arange(0, 12)

In [None]:
print(array[0])
print(array[-1])
print(array[1:-1])
print(array[1:-1:2])
print(array[::-1])

**Замечание**: Индексы и срезы в многомерных массивах не нужно разделять квадратными скобками 

т.е. вместо ```matrix[i][j]``` нужно использовать ```matrix[i, j]```

In [None]:
array

In [None]:
array.reshape(3,-1)

In [None]:
array.reshape(3,-1)[1, 2]

В качестве индексов можно использовать массивы:

In [None]:
array[[0, 2, 4, 6, 8, 10]]

In [None]:
array[[True, False, True, False, True, False, True, False, True, False, True, False]]

In [None]:
x = np.arange(10)
x

In [None]:
x[(x % 2 == 0) & (x > 5)]

In [None]:
print(x)
x[x > 3] *= 2
print(x)

Для копирования в numpy есть метод copy

In [None]:
x.copy()

In [None]:
y = x[:2]
z = x
a = x.copy()
x[0] = 100

In [None]:
x, y, a, z

### Арифметические операции с массивами
**Замечание:** Все арифметические операции над массивами одинаковой размерности производятся поэлементно

In [None]:
[1, 2, 3] + [3, 4, 5]

In [None]:
x = np.array([1, 2, 3])
y = np.array([3, 4, 5])
x + y

In [None]:
x * 2

In [None]:
x ** 2

In [None]:
x * y

In [None]:
x / y

In [None]:
x @ y 

In [None]:
array = np.array([[i**2 for i in range(5)], [i**2 for i in range(5)][::-1]])
array

In [None]:
array @ array.T

In [None]:
array.dot(array.T)

In [None]:
array.T @ array

In [None]:
array.max()

In [None]:
array.sum()

In [None]:
array.max(axis=1), array.max(axis=0)

In [None]:
np.sin(array)

In [None]:
A = np.arange(25).reshape(5,5)
A

In [None]:
np.hstack((A, A, A))

In [None]:
np.vstack((A, A, A))

### Broadcasting

Broadcasting снимает правило одной размерности и позволяет производить арифметические операции над массивами разных, но всётаки созгласованных размерностей. Простейшим примером является умножение вектора на число:

![Imgur](https://i.imgur.com/tE3ZCWG.gif)

In [None]:
2*np.arange(1, 4)

In [None]:
x = np.arange(5)
y = np.arange(7)
print(x.shape, y.shape)

In [None]:
x = x[:, np.newaxis]
y = y[np.newaxis, :]
print(x.shape, y.shape)

In [None]:
x

In [None]:
y

In [None]:
x + y

### Более подробно, если хочется разобраться:

Правило согласования размерностей выражается в одном предложении: 

```In order to broadcast, the size of the trailing axes for both arrays in an operation must either be the same size or one of them must be one```

Если количество размерностей не совпадают, то к массиву меньшей размерности добавляются фиктивные размерности "слева", например:
```
a  = np.ones((2,3,4))
b = np.ones(4)
c = a * b # here a.shape=(2,3,4) and b.shape is considered to be (1,1,4)
```

Прибавим к каждой строчке матрицы один и тот же вектор:

![Imgur](https://i.imgur.com/VsP2dqT.gif)

In [None]:
np.array([[0, 0, 0], [10, 10, 10], [20, 20, 20], [30, 30, 30]]) + np.arange(3)

Теперь если мы хотим, проделать тот же трюк но со столбцами, то мы не можем просто добавить вектор состоящий из 4 элементов т.к. в данном случае размеры будут не согласованы

![Imgur](https://i.imgur.com/9LvGoeL.gif)

Сначала нужно преоброзовать вектор к виду:

In [None]:
np.arange(4)[:, np.newaxis]

А затем к нему добавить матрицу:

In [None]:
np.arange(4)[:, np.newaxis]+np.array([[0, 0, 0], [10, 10, 10], [20, 20, 20], [30, 30, 30]])

Почитать о нём еще больше можно в официальной документации: http://docs.scipy.org/doc/numpy/user/basics.broadcasting.html

### Еще полезные штуки

In [None]:
print(np.where(np.arange(5) > 2))
print(np.where(np.arange(5) > 2)[0])

In [None]:
A

In [None]:
A > 10

In [None]:
np.count_nonzero(A > 10)

In [None]:
def f(value):
    return np.sin(value) + np.cos(value) 

vectorized_f = np.vectorize(f)

vectorized_f(np.arange(10))

### Почему вообще numpy? 

In [None]:
n = 300
A = np.random.rand(n, n)
B = np.random.rand(n, n)

In [None]:
%%time
C = np.zeros((n, n))
for i in range(n):
    for j in range(n):
        for k in range(n):
            C[i, j] += A[i, k] * B[k, j]

In [None]:
%%time
C = A @ B

![Imgur](https://i.imgur.com/z4GzOX6.png)

In [None]:
a = [1, 2, 3]

In [None]:
arr = np.array([1, 2, 3])

In [None]:
%%timeit

a.append(1)

In [None]:
%%timeit

np.append(arr, 1)

In [None]:
import time

In [None]:
start = time.time()
a.append(1)
end = time.time()

In [None]:
start_a = time.time()
np.append(arr, 1)
end_a = time.time()

In [None]:
(end_a - start_a) / (end-start)

### Задания

1. Создайте массив с числами от 1 до 20

In [None]:
a = # Your code goes here

In [None]:
assert np.all(a == np.array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]))

2. Разверните массив так, чтобы его элементы шли в обратном порядке

In [None]:
a = # Your code goes here

In [None]:
assert np.all(a == np.array([20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10,  9,  8,  7,  6,  5,  4, 3,  2,  1]))

3. Найти максимальный нечетный элемент в массиве

In [None]:
max_odd = # Your code goes here

In [None]:
assert max_odd == 19

4. Замените все нечетные элементы массива на ваше любимое число

In [None]:
fav_num = # Ваше любимое число
a # Your code goes here

In [None]:
assert np.all(a == np.array([20, fav_num, 18, fav_num, 16, fav_num, 14, fav_num, 12, fav_num, 10, fav_num,  8, 
                          fav_num,  6, fav_num,  4, fav_num,  2, fav_num]))

5. Напишите функцию, которая по аргументу n выдает массив из первых n нечетных чисел, записанных в обратном порядке. Например, если $n=5$, то ответом будет `array([9, 7, 5, 3, 1])`. Функции, которые могут пригодиться при решении: `np.arange()`

In [None]:
def rev_n_odd(n):
    
    # Your code goes here

In [None]:
assert rev_n_odd(0).shape == (0,)
assert rev_n_odd(1) == np.array([1])
assert np.all(rev_n_odd(10) == np.array([19, 17, 15, 13, 11,  9,  7,  5,  3,  1]))

6. Напишите функцию, которая вычисляет самое близкое и самое дальнее числа к данному в рассматриваемом массиве чисел. Например, если на вход поступают массив `array([0, 1, 2, 3, 4])` и число $1.33$, то ответом будет `(1, 4)`. Функции, которые могут пригодиться при решении: `np.abs(), np.argmax(), np.argmin()`

In [None]:
def func(arr, x):
    
    # Your code goes here
    
    return closest, farest

In [None]:
assert func(np.arange(5), 1.33) == (1, 4)
assert func(np.ones(5), 7) == (1., 1.)
assert func(np.array([5, 1, 6, 123, -1e-5, 1e-4]), 0) == (-1e-05, 123.0)

7. Напишите функцию, вычисляющую первообразную заданного полинома (в качестве константы возьмите 0). Например, если на вход поступает массив коэффициентов `array([4, 6, 0, 1])`, что соответствует полиному $4x^3 + 6x^2 + 1$, на выходе получается массив коэффициентов `array([1, 2, 0, 1, 0])`, соответствующий полиному $x^4 + 2x^3 + x$. Функции, которые могут пригодиться при решении: `.append()`.

Если вдруг кто-то забыл, что такое [первообразная](https://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B2%D0%BE%D0%BE%D0%B1%D1%80%D0%B0%D0%B7%D0%BD%D0%B0%D1%8F).

In [None]:
def antiderivative(coeffs):

    # Your code goes here

In [None]:
assert np.all(antiderivative(np.array([4, 6, 0, 1])) == np.array([1., 2., 0., 1., 0.]))
assert np.all(antiderivative(np.array([10.])) == np.array([10.,  0.]))
assert np.all(antiderivative(np.array([10., 0, 0, 0, 0])) == np.array([2., 0., 0., 0., 0., 0.]))

In [None]:
print("Well done!")