In [None]:
import numpy as np

### Округленная взвешенная сумма оценок

Реализуем функцию, возвращающую округленную взвешенную сумму оценок по данным оценкам и весам. В нашем случае вес экзамена равен 0.3, вес домашек - 0.4, вес контрольной - 0.2, вес самостоятельных - 0.1. Например, если за экзамен у студента 7, за домашки 10, за контрольную 8, а за самостоятельные 6, то он получит отличную оценку 8!

In [None]:
def result_mark(weights: np.array, marks: np.array) -> int:
    assessment = (weights * marks).sum() + 10 ** -10
    return round(assessment)
    '''
    В ситуации, когда дробная часть равняется 0.5, round(x) округляет x до
    ближайшего четного числа. Так round(4.5) вернет 4. Чтобы этого избежать,
    прибавим маленькую константу к x. Это позволит правильно округлить
    половинные значения вверх.
    '''

In [None]:
weights = np.array([0.3, 0.4, 0.2, 0.1])
marks = np.array([7, 10, 8, 6])

assert result_mark(weights, marks) == 8

In [None]:
weights = np.array([0.3, 0.4, 0.2, 0.1])
marks = np.array([7, 0, 8, 6])

assert result_mark(weights, marks) == 4

In [None]:
weights = np.array([0.5, 0.5])
marks = np.array([8, 1])

assert result_mark(weights, marks) == 5

### Замена значений

Реализуем функцию, меняющую каждое третье (начиная с 0) значение массива целых чисел на заданное число. Например, если на вход поступает массив `array([3, 5, 1, 0, -3, 22, 213436])` и число `-111`, то на выходе должен получиться массив `array([-111, 5, 1, -111, -3, 22, -111])`.

In [None]:
def change_array(array: np.array, number: int) -> np.array:
    array[::3] = number # Заменяем каждый третий элемент от 0 до последнего
    return array

In [None]:
array = np.array([3, 5, 1, 0, -3, 22, 213436])
number = -111

assert np.allclose(change_array(array, number), np.array([-111, 5, 1, -111, -3, 22, -111]))

In [None]:
array = np.array([3, 14, 15, 92, 6])
number = 8

assert np.allclose(change_array(array, number), np.array([8, 14, 15, 8, 6]))

### "Близкие" элементы

Реализуем функцию, выдающую индексы «близких» элементов заданных массивов, а именно тех пар элементов, чей модуль разницы не превосходит заданного значения. Например, если на вход поступают массив `array([1.5, 0.5, 2, -4.1, -3, 6, -1])`, массив `array([1.2, 0.5, 1, -4, 3, 0, -1.2])` и число `0.5`, то на выходе должен получиться массив `array([0, 1, 3, 6])`.

In [None]:
def find_close(array1: np.array, array2: np.array,
               precision: float) -> np.array:
    assert len(array1) == len(array2)

    return np.where(np.abs(array1 - array2) <= precision)[0]
    '''
    np.where(condition) вернет кортеж, в котором первым элементом является
    массив, содержащий индексы элементов переданного массива,
    удовлетворяющих условию. Его мы и возращаем.
    '''

In [None]:
array1 = np.array([1.5, 0.5, 2, -4.1, -3, 6, -1])
array2 = np.array([1.2, 0.5, 1, -4.0,  3, 0, -1.2])
precision = 0.5
res = find_close(array1, array2, precision)

assert res.ndim == 1
assert np.allclose(res, np.array([0, 1, 3, 6]))

In [None]:
array1 = np.array([3.1415, 2.7182, 1.6180, 6.6261])
array2 = np.array([6.6730, 1.3807, -1,     6.0222])
precision = 1.7
res = find_close(array1, array2, precision)

assert res.ndim == 1
assert np.allclose(res, np.array([1, 3]))

### Блочная матрица

Реализуем функцию, которая составляет блочную матрицу из четырех блоков, где каждый блок - это заданная матрица. Например, если на вход поступает матрица
$$
\begin{pmatrix}
0 & 1 & 2\\
3 & 4 & 5\\
\end{pmatrix},
$$
то ответом будет матрица
$$
\begin{pmatrix}
0 & 1 & 2 & 0 & 1 & 2\\
3 & 4 & 5 & 3 & 4 & 5\\
0 & 1 & 2 & 0 & 1 & 2\\
3 & 4 & 5 & 3 & 4 & 5\\
\end{pmatrix}
$$

In [None]:
def block_matrix(block: np.array) -> np.array:
    return np.block([[block, block], [block, block]])
    '''
    np.block(arrays) возращает массив типа numpy.ndarray,
    который является блочной матрицей,
    собранной из предоставленных меньших массивов (блоков),
    являющихся элементами arrays.
    '''

In [None]:
block = np.array([[1, 3, 3], [7, 0, 0]])

assert np.allclose(
    block_matrix(block),
    np.array([[1, 3, 3, 1, 3, 3],
              [7, 0, 0, 7, 0, 0],
              [1, 3, 3, 1, 3, 3],
              [7, 0, 0, 7, 0, 0]])
)

### Произведение диагональных элементов

Реализуем функцию, вычисляющую произведение всех ненулевых диагональных элементов на диагонали данной квадратной матрицы. Например, если на вход поступает матрица
$$
\begin{pmatrix}
0 & 1 & 2\\
3 & 4 & 5\\
6 & 7 & 8\\
\end{pmatrix},
$$
то ответом будет 32.

Элементы матрицы считать целочисленными.

In [None]:
def diag_prod(matrix: np.array) -> int:
    diagonal = np.diag(matrix)
    return diagonal[diagonal != 0].prod()
    '''
    diagonal != 0 возращает булевый массив, размер которого совпадает с размером
    массива diagonal. Элемент нового массива равен True, если для этого элемента
    массива diagonal выполняется условие, False иначе. Далее мы используем
    булевую индексацию в NumPy и возращаем массив, в котором остались только те
    элементы, которые удовлетворяют условию.
    '''

In [None]:
matrix = np.array([[0, 1, 2, 3],
                   [4, 5, 6, 7],
                   [8, 9, 10, 11],
                   [12, 13, 14, 15]])

assert diag_prod(matrix) == 750

### Нормализация матрицы

Для улучшения качества работы некоторых алгоритмов машинного обучения может быть полезно использовать [нормализацию данных](https://vk.cc/8xmfQk), чтобы привести признаки в выборке к одному масштабу — а именно, из каждого столбца вычесть среднее его значений и поделить на их стандартное отклонение. Реализуем функцию, нормализующую входящую матрицу (по столбцам). Например, если на вход подается матрица
$$
\begin{pmatrix}
1 & 4 & 4200\\
0 & 10 & 5000\\
1 & 2 & 1000\\
\end{pmatrix},
$$
то результатом с точностью до сотых будет матрица
$$
\begin{pmatrix}
0.71 & -0.39 & 0.46\\
-1.41 & 1.37 & 0.93\\
0.71 & -0.98 & -1.39\\
\end{pmatrix}
$$

Учтем, что в нашей матрице не должно получаться никаких nan.

In [None]:
def normalize(matrix: np.array) -> np.array:
    mean = matrix.mean(axis=0)
    std = matrix.std(axis=0)

    std = np.where(std == 0, 1, std)
    '''
    Деление на ноль возникает в ситуациях, когда все элементы в столбце равны:
    стандартное отклонение в таком случае равно нулю. Мы понимаем, что после
    нормализации в данном столбце должны стоять нули. Этого можно добиться, если
    вычесть среднее значений столбца. Далее, чтобы не делить на ноль, можно
    представить стандартное отклонение в виде любого ненулевого значения.
    Я выбрала единицу.
    '''
    return (matrix - mean) / std

In [None]:
matrix = np.array([[1, 4, 4200], [0, 10, 5000], [1, 2, 1000]])

assert np.allclose(
    normalize(matrix),
    np.array([[ 0.7071, -0.39223,  0.46291],
              [-1.4142,  1.37281,  0.92582],
              [ 0.7071, -0.98058, -1.38873]])
)

In [None]:
matrix = np.array([[-7, 2, 42], [2, 10, 50], [5, 4, 10]])

assert np.allclose(
    normalize(matrix),
    np.array([[-1.37281, -0.98058,  0.46291],
              [ 0.39223,  1.37281,  0.92582],
              [ 0.98058, -0.39223, -1.38873]])
)

In [None]:
matrix = np.array([[1, 2, 3], [1, 2, 3]])

assert np.allclose(
    normalize(matrix),
    np.array([[0, 0, 0],
              [0, 0, 0]])
)

### Максимальный элемент

Реализуем функцию, возвращающую максимальный элемент в векторе x среди элементов, перед которыми стоит нулевой. <br>
Для x = np.array([6, 2, 0, 3, 0, 0, 5, 7, 0]) ответом является 5.

In [None]:
def prevZeroMax(matrix: np.array) -> int:
    indices_zero = np.where(matrix == 0)[0]
    indices_next = indices_zero + 1
    indices_next = indices_next[indices_next < len(matrix)]

    assert len(indices_next) != 0
    '''
    На тестах, где нет нулевого элемента или же он есть, но после него не
    следует элемент (например, [0]), ответ не определен условием.
    '''
    return matrix[indices_next].max()

In [None]:
coefs = np.array([6, 2, 0, 3, 0, 0, 5, 7, 0])

assert  prevZeroMax(coefs) == 5

In [None]:
coefs = np.array([1, 0, 1, 0, 4, 2, 0])

assert prevZeroMax(coefs) == 4


### Треугольная матрица

Реализуем функцию, делающую данную [треугольную матрицу](https://ru.wikipedia.org/wiki/%D0%A2%D1%80%D0%B5%D1%83%D0%B3%D0%BE%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BC%D0%B0%D1%82%D1%80%D0%B8%D1%86%D0%B0) симметричной. Например, если на вход поступает матрица
$$
\begin{pmatrix}
1 & 2 & 3 & 4\\
0 & 5 & 6 & 7\\
0 & 0 & 8 & 9\\
0 & 0 & 0 & 10\\
\end{pmatrix},
$$
то на выходе должна быть матрица
$$
\begin{pmatrix}
1 & 2 & 3 & 4\\
2 & 5 & 6 & 7\\
3 & 6 & 8 & 9\\
4 & 7 & 9 & 10\\
\end{pmatrix}.
$$

In [None]:
def make_symmetric(matrix: np.array) -> np.array:
    diagonal = np.diag(matrix).copy() # 1
    np.fill_diagonal(matrix, 0) # 2
    matrix += matrix.T # 3
    np.fill_diagonal(matrix, diagonal) # 4

    return matrix
    '''
    Идея в том, чтобы сложить исходную матрицу с транспонированной. Но тогда
    значения главной диагонали учтутся дважды. Поэтому я копирую эти значения
    в отдельный массив (1), в исходной матрице записываю на главной диагонали
    нули (2), а затем складываю получившуюся матрицу с транспонированной (3) и
    возвращаю в матрицу значения главной диагонали (4).
    '''

In [None]:
matrix = np.array([[1, 2, 3, 4], [0, 5, 6, 7], [0, 0, 8, 9], [0, 0, 0, 10]])

assert np.allclose(
    make_symmetric(matrix),
    np.array([[ 1,  2,  3,  4],
              [ 2,  5,  6,  7],
              [ 3,  6,  8,  9],
              [ 4,  7,  9, 10]])
)

In [None]:
matrix = np.array([[10, 21, 32, 49], [0, 53, 62, 78], [0, 0, 82, 92], [0, 0, 0, 10]])

assert np.allclose(
    make_symmetric(matrix),
    np.array([[10, 21, 32, 49],
              [21, 53, 62, 78],
              [32, 62, 82, 92],
              [49, 78, 92, 10]])
)

### Прямоугольная матрица

Реализуем функцию, создающую прямоугольную матрицу из m одинаковых строк, заполненных последовательными натуральными числами от a до b включительно в возрастающем порядке. Например, если m = 5, a = 3, b = 10, то на выходе будет матрица
$$
\begin{pmatrix}
3 & 4 & 5 & 6 & 7 & 8 & 9 & 10\\
3 & 4 & 5 & 6 & 7 & 8 & 9 & 10\\
3 & 4 & 5 & 6 & 7 & 8 & 9 & 10\\
3 & 4 & 5 & 6 & 7 & 8 & 9 & 10\\
3 & 4 & 5 & 6 & 7 & 8 & 9 & 10\\
\end{pmatrix}
$$

In [None]:
def construct_matrix(m: int, a: int, b: int) -> np.array:
    assert a <= b and m > 0

    row = np.arange(a, b + 1) # Одномерный массив со значениями от a до b
    return np.block([[row]] * m) # Повторяем массив row m раз

In [None]:
m = 5
a = 3
b = 10

assert np.allclose(
    construct_matrix(m, a, b),
    np.array([[ 3,  4,  5,  6,  7,  8,  9, 10],
              [ 3,  4,  5,  6,  7,  8,  9, 10],
              [ 3,  4,  5,  6,  7,  8,  9, 10],
              [ 3,  4,  5,  6,  7,  8,  9, 10],
              [ 3,  4,  5,  6,  7,  8,  9, 10]])
)

In [None]:
m = 3
a = 2
b = 6

assert np.allclose(
    construct_matrix(m, a, b),
    np.array([[2, 3, 4, 5, 6],
              [2, 3, 4, 5, 6],
              [2, 3, 4, 5, 6]])
)

### Косинусная близость

Реализуем функцию, вычисляющую [косинусную близость](https://en.wikipedia.org/wiki/Cosine_similarity) двух векторов. Например, если на вход поступают вектора `array([-2, 1, 0, -5, 4, 3, -3])` и `array([0, 2, -2, 10, 6, 0, 0])`, ответом будет -0.25.

In [None]:
def cosine_similarity(vec1: np.array, vec2: np.array) -> float:
    assert(len(vec1) == len(vec2))

    # Проверка на то, что оба вектора ненулевые
    vec1_zero = vec1[vec1 == 0]
    vec2_zero = vec2[vec2 == 0]
    assert len(vec1_zero) != len(vec1) and len(vec2_zero) != len(vec2)

    scalar_product = (vec1 * vec2).sum()
    norm = (vec1 * vec1).sum() ** 0.5 * (vec2 * vec2).sum() ** 0.5

    return scalar_product / norm

In [None]:
vec1 = np.array([-2, 1,  0, -5, 4, 3, -3])
vec2 = np.array([ 0, 2, -2, 10, 6, 0,  0])

assert np.allclose(cosine_similarity(vec1, vec2), -0.25)

In [None]:
vec1 = np.array([-4, 2,  9, -8, 9, 0, -2])
vec2 = np.array([ 3, 2, -4, -1, 3, 2,  2])

assert np.allclose(cosine_similarity(vec1, vec2), -0.119929)