# 1.1. Вступление к модулю
## О чем этот модуль?
Это стандартный курс линейной алгебры, посвященный её основам. Первый модуль пригодится нам для того, чтобы изучить азы этого раздела математики. Мы познакомимся с основными определениями, понятиями и алгоритмами и научимся решать задачи, в которых необходимо будет применить эти знания.

**Чему мы научимся?**  
После прохождения модуля, посвященного введению в линейную, алгебру мы научимся:

- Корректно использовать такие понятия вектор, базис, оператор, матрица.
- Оперировать несложными инструментами для решения и анализа задач линейной алгебры.
- Использовать матрицы для решения задач и представления окружающего мира.

Вы готовы? Тогда поехали!

**Стоп… а зачем учить математику?**
Зачем же DataScientist\`у тратить время на изучение линейной алгебры, когда вместо этого можно просто импортировать пакет в Python и построить свою модель?

На самом деле с пониманием линейной алгебры мы сможем развить самую настоящую интуицию для машинного обучения! Алгоритмы глубокого обучения больше не покажутся нам черными ящиками. Это позволит нам выбрать правильные гиперпараметры, отсортировать признаки и разработать лучшую модель. Изучив линейную алгебру, мы также сможем программировать алгоритмы с нуля и вносить в них собственные изменения. Разве не поэтому мы любим науку о данных в первую очередь? Способность экспериментировать и играть с нашими моделями!

***Посмотрим на линейную алгебру как на ключ, чтобы открыть новый мир!***

**Линейная алгебра в машинном обучении**  
Большой вопрос: а где же линейная алгебра вписывается в машинное обучение? Давайте вспомним несколько примеров, с которыми мы все хорошо знакомы.

**Корреляционная матрица**

Анализ признаков является важным шагом в исследовании данных. Мы хотим узнать зависимости между парами наших признаков.

*Определение*:  Корреляция — это количественная мера, используемая для изучения отношений между двумя непрерывными переменными.

Корреляция указывает направление линейных отношений между переменными. Положительная корреляция указывает, что увеличение или уменьшение одной переменной сопровождается тем же самым в другой переменной. Отрицательная корреляция указывает на противоположность переменных.

**Уменьшение размерности**

Как исследователи данных, в жизни мы часто будем работать с наборами данных, которые имеют сотни и даже тысячи переменных. Именно так устроен реальный бизнес — огромное количество факторов влияет на отрасль и достижение результата. 

Нам нужно уменьшить количество переменных, чтобы выполнить какой-либо реальный анализ. Это и есть уменьшение размерности нашего признакового пространства.  А каждый признак, как всем известно, — вектор!

**Свёртка и обработка изображений**

Вы, наверное, знаете, что современные компьютеры рассчитаны на обработку только 0 и 1. Так, как же в компьютере можно сохранить изображение, с несколькими атрибутами, такими как цвет? Это достижимо путём сохранения интенсивности пикселей в конструкции под названием матрица. Затем эта матрица может быть обработана для определения цветов, предметов и т.д.

Поэтому любая операция, которую вы хотите выполнить с этим изображением, вероятно, будет использовать линейную алгебру и матрицы под капотом.

**Вложение слов**

*Определение*:  Вложение слов — это способ представления слов в качестве низкоразмерных векторов чисел при сохранении их контекста в документе.

Эти представления получены путем обучения различных нейронных сетей на большом объёме текста, который называется корпусом. Они также помогают в анализе синтаксического сходства между словами.

**Подведем итоги**  
Линейная алгебра стоит за всеми мощными алгоритмами машинного обучения. Это жизненно важный зуб в наборе навыков учёных данных. Рассматривать линейную алгебру, как обязательный предмет в науке о данных, — огромный шаг на пути становления настоящего  DataScientist\`а!

**Для мотивации**
«Изображение говорит больше, чем тысяча слов», — такой принцип взяли на вооружение авторы учебника Захватывающая линейная алгебра (http://immersivemath.com/ila/learnmore.html) с полностью интерактивными иллюстрациями. Авторы говорят, что это первый мире учебник такого рода.   

Когда вместо обычных изображений дают интерактивные иллюстрации, с которыми можно поиграть, поэкспериментировать, — это вообще на порядок повышает эффективность обучения. Концепция буквально цементируется в памяти! Пока вы перевариваете полезность математики, но еще не приступили к выполнению практических задач, посмотрите этот крутой интерактивный учебник по линейной алгебре!  

# 1.2. Векторы. Основные понятия
Первый блок текущего модуля будет посвящён векторам. В этом блоке мы познакомимся с векторами и основными векторными операциями. На примере модельной задачи об агентстве по аренде недвижимости научимся выполнять базовые действия с векторами.

**Что такое вектор?**
- В геометрии: направленный отрезок.
- В линейной алгебре: элемент векторного пространства.
- В Python: числовой массив (например, массив NumPy).

*Определение*: Вектор — это набор чисел, записанных в определённом порядке (в столбик или в строчку).

Пример из видео:  
![image-5.png](attachment:image-5.png)
  
**Основные характеристики вектора**  
К основным характеристикам вектора относятся его координаты и размерность.

*Определение*: Координаты вектора — это числа, из которых он состоит. 

*Определение*: Размерность вектора — это количество координат.

**Пример**:  
![image-4.png](attachment:image-4.png)

***Этот же пример мы можем перенести на задачу из жизни.***

**Задача (из жизни)**:  
![image-3.png](attachment:image-3.png)

**Задача (Python)**  
Нам остался последний шаг — посмотреть, как всё изученное нами выше работает в Python.  
![image-2.png](attachment:image-2.png)

**Покупаем квартиру**  
Чтобы иметь возможность математически или даже программно оперировать сущностями нашего мира, нам нужно их упростить до формы понятной компьютеру. Признаковое описание объектов реального мира в виде чисел — это и есть то самое упрощение.

**Анализируя потенциальную стоимость определенной новой квартиры, мы будем иметь в виду следующие признаки**:

- общая площадь квартиры в квадратных метрах,
- этаж квартиры,
- количество комнат,
- цена квартиры за квадратный метр,
- количество подъездов в доме.

**Рассмотрим предложение на покупку:**  
![image.png](attachment:image.png) 
Признаков может быть сколько угодно много. Таким образом, мы можем описать нашу квартиру числовой последовательностью важных для нас признаков при покупке квартиры:  
***apartment = np.array([59.50, 31.40, 19, 22, 60550, 2])***

**Работа с numpy.array**
https://numpy.org/doc/stable/reference/generated/numpy.array.html

Эта последовательность чисел и называется вектором. Вектор характеризует конкретный объект — конкретную квартиру. А число в той или иной позиции вектора описывает конкретный признак объекта. То есть вектор — это, по сути, одномерный массив: 

***\# В NumPy вектор и массив - одно и то же.  
\# Исключение - понятие вектор-столбец и вектор-строка - фактически двумерные массивы,  
\# где один из атрибутов shape равен 1.***

***print("ndim:", x.ndim) # число осей (измерений) массива - n.dim: 1  
print("shape:", x.shape) # размеры массива, для вектора определена только длина - shape: (6, )***

**Работа с numpy.ndim**  
https://numpy.org/doc/stable/reference/generated/numpy.ndarray.ndim.html  
**Работа с numpy.shape**  
https://numpy.org/doc/stable/reference/generated/numpy.ndarray.shape.html  

Давайте, как настоящие исследователи данных, попробуем извлечь полезную информацию из вектора, при этом уменьшив его! 

Упростим себе задачу оценки новой квартиры — сгенерируем новый признак — отношение жилой площади к общей. А от старых признаков смело избавимся, сократив векторное пространство нашего объекта.

Возьмём квартиру из описания выше и представим её неким вектором apartment:  
***import numpy as np  
apartment = np.array([59.50, 31.40, 19, 22, 60550, 2])***

Для того, чтобы сгенерировать новый параметр share_living_space (доля жилой площади в квартире) из старых признаков, содержащихся в векторе-описании apartment нашей квартиры, нам необходимо вспомнить обращение к элементам массива. Разделим значение жилой площади на её общее количество:

***\# вычислим долю жилой площади в квартире  
share_living_space = apartment[1]/apartment[0]***

Избавимся от старых признаков, посредством функции delete(), которую предоставляет библиотека numpy. Передадим в значение функции индексы признаков, которые необходимо удалить из нашего массива apartment:  
***apartment = np.delete(apartment, [0, 1])***

**Работа с numpy.delete**  
https://numpy.org/doc/stable/reference/generated/numpy.delete.html

И в завершение добавим в конец нашего массива новый признак share_living_space, который сочетает в себе смысл двух старых признаков:

***apartment = np.append(apartment, share_living_space)***

**Работа с numpy.append**  
https://numpy.org/doc/stable/reference/generated/numpy.append.html

Ура! Мы почувствовали себя настоящими гениями — ведь мы смогли сделать наш небольшой набор признаков ещё меньше, при этом не потеряв смысл в данных. Это очень важное умение при работе с большими данными!

# Задание 1.2.1
Введите значение получившегося нового признака share_living_space. Используйте код и ссылки на документацию из описания квартиры.  
Ответ округлите до 2-х знаков после точки.

In [3]:
import numpy as np
apartment = np.array([59.50, 31.40, 19, 22, 60550, 2])
# вычислим долю жилой площади в квартире
share_living_space = apartment[1]/apartment[0]
print(round(share_living_space,2))

0.53


# Задание 1.2.2
Укажите размерность конечного массива apartment после преобразования (ввода новой переменной и удаления старых).  
Ответ является целым числом

In [4]:
apartment = np.delete(apartment, [0, 1])
apartment = np.append(apartment, share_living_space)
print(len(apartment))

5


# Задание 1.2.3
Пусть дан вектор в python вида t = np.array([12, 14, 17, 19, 24, 28, 31, 31, 27, 22, 17, 13]), содержащий информацию о средней температуре воздуха (в градусах Цельсия) в Риме с января по декабрь включительно. Cчитаем, что в январе t_0, то есть отсчет индексов с нуля.

Выберите неверное утверждение:  
![image-2.png](attachment:image-2.png)

Ответ: ![image.png](attachment:image.png)

# Полезные источники 
NumPy — это библиотека языка Python, добавляющая поддержку больших многомерных массивов и матриц, вместе с большой библиотекой высокоуровневых (и очень быстрых) математических функций для операций с этими массивами.

NumPy в Python. Часть 1  
https://habr.com/ru/post/352678/
NumPy в Python. Часть 2  
https://habr.com/ru/post/353416/
NumPy в Python. Часть 3  
https://habr.com/ru/post/413381/
NumPy в Python. Часть 4  
https://habr.com/ru/post/415373/

# 1.3. Базовые операции над векторами
## Сложение векторов
Сложение векторов происходит поэлементно, первая координата складывается с первой, вторая со второй и так далее. Вычитаются векторы так же поэлементно.
![image-9.png](attachment:image-9.png)
**Задача (из жизни)**
![image-8.png](attachment:image-8.png)
**Задача (Python)**
![image-7.png](attachment:image-7.png)
**Умножение вектора на число**
*Умножение вектора на число также происходит поэлементно, то есть каждая координата вектора умножается на заданное число.
**Пример:**
![image-6.png](attachment:image-6.png)
**Задача (из жизни)**
![image-5.png](attachment:image-5.png)
**Задача (Python)**
В Python число умножается на массив numpy обычным оператором умножения.
![image-4.png](attachment:image-4.png)
Сложение векторов и умножение на число: особые случаи
1.  Сложение противоположных векторов:
![image-3.png](attachment:image-3.png)
2. Умножение вектора на ноль:
![image-2.png](attachment:image-2.png)
3. Умножение на нулевой вектор:
![image.png](attachment:image.png)


# Задание 1.3.1
![image.png](attachment:image.png)

# Задание 1.3.2
Выполняем операции поэлементно
![image.png](attachment:image.png)

# Задание 1.3.3
Умножаем 72 на каждый элемент вектора
![image.png](attachment:image.png)

1.4. Линейная комбинация векторов
![image.png](attachment:image.png)

Определение: Линейная комбинация — это сумма векторов, умноженных на некоторые числа. 

Задача (из жизни)
![image-2.png](attachment:image-2.png)

Задача (Python)
![image-3.png](attachment:image-3.png)
Нулевая линейная комбинация
![image-4.png](attachment:image-4.png)

Пример 1
![image-5.png](attachment:image-5.png)
Пример 2
![image-6.png](attachment:image-6.png)


# Задание 1.4.1
4*2+2*(-3)+1*5
5*2+1*(-3)+0
![image-2.png](attachment:image-2.png)

# Задание 1.4.2
3*200, 4*200, 5*200, 9*200 = 600, 800, 1000, 1800
1*400, 5*400, 3*400, 6*400 = 400, 2000, 1200, 2400
выручка: 400-600, 2000-800, 1200-1000, 2400-1800 = -200,1200,200,600
![image.png](attachment:image.png)

# Задание 1.4.3
![image.png](attachment:image.png)

# 1.5. Скалярное произведение векторов
![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)
![image-4.png](attachment:image-4.png)
## Длина вектора
![image-5.png](attachment:image-5.png)
![image-6.png](attachment:image-6.png)
![image-7.png](attachment:image-7.png)
## Особый случай. Ортогональность векторов
![image-8.png](attachment:image-8.png)

# Задание 1.5.1
![image.png](attachment:image.png)

# Задание 1.5.2
4*2+5*0+(-1)*1
![image.png](attachment:image.png)

# Задание 1.5.3
![image.png](attachment:image.png)

# Задание 1.5.4
sqrt(4*4+6*6+1*1)
![image.png](attachment:image.png)

# Задание 1.5.5
у ортогональных векторов скалярное произведение равно 0
![image.png](attachment:image.png)

# 1.6. Векторы. Практическая задача
## Задача (условие № 1)
![image.png](attachment:image.png)
## Задача (условие № 2)
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)
## Задача (условие № 3)
![image-4.png](attachment:image-4.png)
![image-5.png](attachment:image-5.png)

# Задание 1.6.1
![image.png](attachment:image.png)

# Задание 1.6.2
![image.png](attachment:image.png)