# Лабораторная работа №1: Основы линейной алгебры
## Векторы и матрицы в Python

**Цель работы:** Изучить основы работы с векторами и матрицами в Python с использованием библиотеки NumPy и понять их применение в задачах искусственного интеллекта.

**Продолжительность:** 90 минут

**Необходимые библиотеки:**

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# Настройка для красивого отображения графиков
plt.style.use('default')
plt.rcParams['figure.figsize'] = (10, 6)

print("Библиотеки успешно импортированы!")
print(f"Версия NumPy: {np.__version__}")

## Часть 1: Работа с векторами

### Задание 1.1: Создание и визуализация векторов

In [None]:
# Создание векторов
# TODO: Создайте следующие векторы:
# a = [3, 4]
# b = [1, 2]
# c = [2, -1, 3] (3D вектор)

a = np.array([3, 4])
b = np.array([1, 2])
c = np.array([2, -1, 3])

print(f"Вектор a: {a}")
print(f"Вектор b: {b}")
print(f"Вектор c: {c}")
print(f"Размерность вектора a: {a.shape}")
print(f"Размерность вектора c: {c.shape}")

In [None]:
# Визуализация 2D векторов
def plot_2d_vectors(*vectors, labels=None, colors=None):
    """Функция для визуализации 2D векторов"""
    fig, ax = plt.subplots(figsize=(8, 8))
    
    if colors is None:
        colors = ['red', 'blue', 'green', 'orange', 'purple']
    
    if labels is None:
        labels = [f'v{i+1}' for i in range(len(vectors))]
    
    for i, vector in enumerate(vectors):
        ax.arrow(0, 0, vector[0], vector[1], 
                head_width=0.2, head_length=0.2, 
                fc=colors[i % len(colors)], ec=colors[i % len(colors)],
                linewidth=2, label=labels[i])
    
    # Настройка осей
    max_val = max([max(abs(v)) for v in vectors]) + 1
    ax.set_xlim(-max_val, max_val)
    ax.set_ylim(-max_val, max_val)
    ax.grid(True, alpha=0.3)
    ax.axhline(y=0, color='k', linewidth=0.5)
    ax.axvline(x=0, color='k', linewidth=0.5)
    ax.set_xlabel('X')
    ax.set_ylabel('Y')
    ax.legend()
    ax.set_title('Визуализация векторов')
    plt.show()

# Визуализируем векторы a и b
plot_2d_vectors(a, b, labels=['a = [3, 4]', 'b = [1, 2]'])

### Задание 1.2: Операции с векторами

In [None]:
# Сложение векторов
# TODO: Вычислите сумму векторов a и b
sum_ab = a + b

print(f"a + b = {sum_ab}")

# Визуализация сложения векторов
plot_2d_vectors(a, b, sum_ab, 
                labels=['a', 'b', 'a + b'], 
                colors=['red', 'blue', 'green'])

In [None]:
# Умножение на скаляр
# TODO: Умножьте вектор a на скаляр 2
scaled_a = 2 * a

print(f"2 * a = {scaled_a}")

# Визуализация масштабирования
plot_2d_vectors(a, scaled_a, 
                labels=['a', '2*a'], 
                colors=['red', 'orange'])

### Задание 1.3: Скалярное произведение и норма

In [None]:
# Скалярное произведение
# TODO: Вычислите скалярное произведение векторов a и b
dot_product = np.dot(a, b)

print(f"Скалярное произведение a · b = {dot_product}")

# Норма (длина) вектора
# TODO: Вычислите нормы векторов a и b
norm_a = np.linalg.norm(a)
norm_b = np.linalg.norm(b)

print(f"Норма вектора a: ||a|| = {norm_a:.3f}")
print(f"Норма вектора b: ||b|| = {norm_b:.3f}")

In [None]:
# Угол между векторами
# TODO: Вычислите косинус угла между векторами a и b
cos_angle = np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

# Угол в радианах и градусах
angle_rad = np.arccos(cos_angle)
angle_deg = np.degrees(angle_rad)

print(f"Косинус угла между a и b: {cos_angle:.3f}")
print(f"Угол между векторами: {angle_deg:.1f}°")

## Часть 2: Работа с матрицами

### Задание 2.1: Создание матриц

In [None]:
# Создание матриц
# TODO: Создайте следующие матрицы:
# A = [[1, 2], [3, 4]]
# B = [[5, 6], [7, 8]]
# C = [[1, 2, 3], [4, 5, 6]]

A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
C = np.array([[1, 2, 3], [4, 5, 6]])

print("Матрица A:")
print(A)
print(f"Размерность A: {A.shape}")

print("\nМатрица B:")
print(B)
print(f"Размерность B: {B.shape}")

print("\nМатрица C:")
print(C)
print(f"Размерность C: {C.shape}")

### Задание 2.2: Операции с матрицами

In [None]:
# Сложение матриц
# TODO: Вычислите сумму матриц A и B
sum_AB = A + B

print("A + B =")
print(sum_AB)

# Умножение матрицы на скаляр
# TODO: Умножьте матрицу A на скаляр 3
scaled_A = A * 3

print("\n3 * A =")
print(scaled_A)

In [None]:
# Умножение матриц
# TODO: Вычислите произведение матриц A и B
product_AB = np.dot(A, B)

print("A * B =")
print(product_AB)

# Проверим, что A*B ≠ B*A (умножение матриц не коммутативно)
product_BA = np.dot(B, A)
print("\nB * A =")
print(product_BA)

print(f"\nA*B == B*A? {np.array_equal(product_AB, product_BA)}")

### Задание 2.3: Умножение матрицы на вектор

In [None]:
# Умножение матрицы на вектор
# TODO: Умножьте матрицу A на вектор a
result_Aa = np.dot(A, a)

print(f"A * a = {result_Aa}")

# Геометрическая интерпретация: матрица как линейное преобразование
print("\nГеометрическая интерпретация:")
print(f"Исходный вектор a: {a}")
print(f"Преобразованный вектор A*a: {result_Aa}")

# Визуализация преобразования
plot_2d_vectors(a, result_Aa, 
                labels=['Исходный вектор a', 'Преобразованный A*a'], 
                colors=['blue', 'red'])

### Задание 2.4: Транспонирование и специальные матрицы

In [None]:
# Транспонирование
# TODO: Найдите транспонированную матрицу A
A_T = np.transpose(A)

print("Матрица A:")
print(A)
print("\nТранспонированная матрица A^T:")
print(A_T)

# Создание специальных матриц
# Единичная матрица
I = np.eye(3)
print("\nЕдиничная матрица 3x3:")
print(I)

# Нулевая матрица
zeros = np.zeros((2, 3))
print("\nНулевая матрица 2x3:")
print(zeros)

# Матрица из единиц
ones = np.ones((2, 2))
print("\nМатрица из единиц 2x2:")
print(ones)

## Часть 3: Применение в задачах ИИ

### Задание 3.1: Представление изображения как матрицы

In [None]:
# Создание простого "изображения" (матрицы пикселей)
# Создадим изображение 8x8
smiley = np.array([
    [0, 0, 1, 1, 1, 1, 0, 0],
    [0, 1, 0, 0, 0, 0, 1, 0],
    [1, 0, 1, 0, 0, 1, 0, 1],
    [1, 0, 0, 0, 0, 0, 0, 1],
    [1, 0, 1, 0, 0, 1, 0, 1],
    [1, 0, 0, 1, 1, 0, 0, 1],
    [0, 1, 0, 0, 0, 0, 1, 0],
    [0, 0, 1, 1, 1, 1, 0, 0]
])

print("Изображение как матрица:")
print(smiley)
print(f"Размерность: {smiley.shape}")
print(f"Общее количество пикселей: {smiley.size}")

# Визуализация
plt.figure(figsize=(6, 6))
plt.imshow(smiley, cmap='gray', interpolation='nearest')
plt.title('Изображение')
plt.colorbar()
plt.show()

# Преобразование в вектор (как это делается в машинном обучении)
smiley_vector = smiley.flatten()
print(f"\nИзображение как вектор (первые 10 элементов): {smiley_vector[:10]}")
print(f"Размерность вектора: {smiley_vector.shape}")

### Задание 3.2: Косинусная мера сходства для текстов

In [None]:
# Простое представление текстов в виде векторов (bag of words)
# Словарь: ["кот", "собака", "компьютер", "алгоритм", "учиться", "дом", "машина"]

# Документы представлены как векторы частот слов
doc1 = np.array([3, 1, 0, 0, 1, 2, 0])  # "кот кот кот собака учиться дом дом"
doc2 = np.array([2, 2, 0, 0, 1, 1, 0])  # "кот кот собака собака учиться дом"
doc3 = np.array([0, 0, 3, 2, 1, 0, 1])  # "компьютер компьютер компьютер алгоритм алгоритм учиться машина"
doc4 = np.array([1, 1, 1, 1, 2, 0, 1])  # "кот собака компьютер алгоритм учиться учиться машина"

documents = [doc1, doc2, doc3, doc4]
doc_names = ["Документ 1 (животные)", "Документ 2 (животные)", "Документ 3 (технологии)", "Документ 4 (смешанный)"]

print("Векторные представления документов:")
for i, (doc, name) in enumerate(zip(documents, doc_names)):
    print(f"{name}: {doc}")

# Функция для вычисления косинусной близости
def cosine_similarity(vec1, vec2):
    """Вычисляет косинуснцю близость между двумя векторами"""
    # TODO: Реализуйте формулу
    # cos(θ) = (a · b) / (||a|| * ||b||)
    dot_product = # ВАШ КОД ЗДЕСЬ
    norm_vec1 = # ВАШ КОД ЗДЕСЬ
    norm_vec2 = # ВАШ КОД ЗДЕСЬ
    
    return dot_product / (norm_vec1 * norm_vec2)

# Вычисление матрицы сходства
n_docs = len(documents)
similarity_matrix = np.zeros((n_docs, n_docs))

for i in range(n_docs):
    for j in range(n_docs):
        similarity_matrix[i, j] = cosine_similarity(documents[i], documents[j])

print("\nМатрица косинусного сходства:")
print(similarity_matrix)

# Визуализация матрицы сходства
plt.figure(figsize=(8, 6))
plt.imshow(similarity_matrix, cmap='Blues', interpolation='nearest')
plt.colorbar(label='Косинусное сходство')
plt.xticks(range(n_docs), [f'Док {i+1}' for i in range(n_docs)])
plt.yticks(range(n_docs), [f'Док {i+1}' for i in range(n_docs)])
plt.title('Матрица косинусного сходства документов')

# Добавление значений в ячейки
for i in range(n_docs):
    for j in range(n_docs):
        plt.text(j, i, f'{similarity_matrix[i, j]:.2f}', 
                ha='center', va='center', fontweight='bold')

plt.show()

### Задание 3.3: Простая линейная регрессия с матрицами

In [None]:
# Простой пример линейной регрессии
# Задача: предсказать цену дома по его площади

# Данные: площадь дома (кв.м) и цена (млн руб.)
areas = np.array([50, 60, 70, 80, 90, 100, 110, 120])  # площадь
prices = np.array([3.2, 3.8, 4.1, 4.7, 5.2, 5.8, 6.1, 6.9])  # цена

# Создание матрицы признаков X (добавляем столбец единиц для свободного члена)
X = np.column_stack([np.ones(len(areas)), areas])
y = prices

print("Матрица признаков X (первые 5 строк):")
print(X[:5])
print(f"\nВектор целевых значений y: {y}")

# Решение методом наименьших квадратов: w = (X^T * X)^(-1) * X^T * y
# TODO: Вычислите веса w используя формулу выше
X_T = X.T  # транспонированная матрица X
XTX = np.dot(X_T, X)  # произведение X^T и X
XTX_inv = np.linalg.inv(XTX)  # обратная матрица
XTy = np.dot(X_T, y)  # произведение X^T и y
w = np.dot(XTX_inv, XTy)  # финальное вычисление весов

print(f"\nВеса модели: w = {w}")
print(f"Свободный член (intercept): {w[0]:.3f}")
print(f"Коэффициент при площади: {w[1]:.3f}")

# Предсказания
predictions = X @ w

# Визуализация
plt.figure(figsize=(10, 6))
plt.scatter(areas, prices, color='blue', label='Реальные данные', s=50)
plt.plot(areas, predictions, color='red', label='Линейная регрессия', linewidth=2)
plt.xlabel('Площадь дома (кв.м)')
plt.ylabel('Цена (млн руб.)')
plt.title('Линейная регрессия: Предсказание цены дома')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

# Предсказание для нового дома
new_area = 95
new_house = np.array([1, new_area])
predicted_price = new_house @ w
print(f"\nПредсказанная цена дома площадью {new_area} кв.м: {predicted_price:.2f} млн руб.")

## Часть 4: Заключение и дополнительные задания

### Резюме изученного материала

### Что мы изучили:

1. **Векторы:**
   - Создание и визуализация векторов
   - Основные операции: сложение, умножение на скаляр
   - Скалярное произведение и норма
   - Вычисление углов между векторами

2. **Матрицы:**
   - Создание матриц различных размеров
   - Операции с матрицами: сложение, умножение
   - Умножение матрицы на вектор
   - Транспонирование

3. **Применения в ИИ:**
   - Представление изображений как матриц
   - Косинусная мера сходства для текстов
   - Линейная регрессия с использованием матричных операций

### Ключевые выводы:
- Векторы и матрицы — основа представления данных в ИИ
- NumPy предоставляет эффективные инструменты для работы с ними
- Математические операции имеют прямое применение в алгоритмах машинного обучения

### Дополнительные обязательные задания для самостоятельной работы:

1. **Создайте функцию для вычисления евклидова расстояния между векторами**
2. **Реализуйте функцию нормализации вектора (приведение к единичной длине)**
3. **Создайте матрицу поворота на заданный угол (2D или 3D) и примените её к некоторому вектору (оператор вращения в его машинном представлении в форме матрицы (в форме двумерного массива) действует на вектор (в форме одномерного массива))**
4. **Исследуйте, как изменяется косинусная близость при добавлении шума к векторам. Сгенерируйте случайные данные векторов с некоторыми случайными данными многократно в некотором цикле и подсчитайте косинусные близости (косинусы из скалярного произведения векторов - по сути меры того, насколько вектора сонаправлены (похожи друг на друга))**
5. **Исследуйте какие ещё существуют виды расстояний кроме евклидова расстояния, и которые можно применять в Data Science и в машинном обучении (например расстояние Говера (Gower's distance - в англоязычном варианте) для любых типов данных в признаках). Попробуйте реализовать эти расстояние и/или использовать готовые библиотечные функции, демонстрируя вычисления этих расстояний**

In [None]:
# Место для дополнительных экспериментов
# Попробуйте реализовать дополнительные задания здесь

# Задание 1: Евклидово расстояние
def euclidean_distance(vec1, vec2):
    """Вычисляет евклидово расстояние между двумя векторами"""
    diff = vec1 - vec2
    distance = np.sqrt(np.sum(diff**2))
    return distance
    

# Задание 2: Нормализация вектора
def normalize_vector(vec):
    """Нормализует вектор (приводит к единичной длине)"""
    norm = np.linalg.norm(vec)
    if norm > 0:
        normalized = vec / norm
    else:
        normalized = vec
    return normalized

# Задание 3: Поворот вектора
def rotation_matrix_2d(angle_deg):
    """Создает матрицу поворота для 2D"""
    angle_rad = np.radians(angle_deg)
    cos_a, sin_a = np.cos(angle_rad), np.sin(angle_rad)
    return np.array([[cos_a, -sin_a], [sin_a, cos_a]])

# Пример использования
vector = np.array([1, 0])
angle = 90

# Создаем матрицу поворота
R = rotation_matrix_2d(angle)

# Применяем к вектору
rotated_vector = R @ vector

print(f"Исходный: {vector}")
print(f"Матрица поворота на {angle}°:\n{R}")
print(f"Повернутый: {rotated_vector}")

# Проверка свойств
print(f"Ортогональность: {np.allclose(R.T @ R, np.eye(2))}")
print(f"Определитель = 1: {np.isclose(np.linalg.det(R), 1)}")

def rotation_matrix_3d_z(angle_deg):
    """Матрица поворота вокруг оси Z"""
    angle_rad = np.radians(angle_deg)
    cos_a, sin_a = np.cos(angle_rad), np.sin(angle_rad)
    return np.array([[cos_a, -sin_a, 0],[sin_a, cos_a, 0], [0, 0, 1]])

# Пример
vector_3d = np.array([1, 0, 0])
R_z = rotation_matrix_3d_z(90)
result = R_z @ vector_3d
print(f"Поворот вокруг Z: {result}")  # [0. 1. 0.]

# Задание 4: Угол вектора
def cosine_similarity(vec1, vec2):
    """Вычисляет косинусную близость между двумя векторами"""
    return np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))

# Параметры эксперимента
n_experiments = 1000
vector_dim = 100
noise_levels = np.linspace(0, 2, 21)

# Инициализация результатов
similarities = {level: [] for level in noise_levels}

# Проведение экспериментов
for _ in range(n_experiments):
    # Генерируем два случайных вектора
    vec1 = np.random.randn(vector_dim)
    vec2 = np.random.randn(vector_dim)
    
    # Добавляем шум разных уровней
    for noise_level in noise_levels:
        noisy_vec1 = vec1 + noise_level * np.random.randn(vector_dim)
        noisy_vec2 = vec2 + noise_level * np.random.randn(vector_dim)
        noisy_similarity = cosine_similarity(noisy_vec1, noisy_vec2)
        similarities[noise_level].append(noisy_similarity)

# Анализ результатов
mean_similarities = [np.mean(similarities[level]) for level in noise_levels]
std_similarities = [np.std(similarities[level]) for level in noise_levels]

print("Уровень шума | Средняя косинусная близость | Стандартное отклонение")
print("-" * 65)
for i, noise_level in enumerate(noise_levels):
    print(f"{noise_level:10.2f} | {mean_similarities[i]:25.4f} | {std_similarities[i]:25.4f}")

#Задание 5
import numpy as np
from scipy.spatial import distance

# 1. Евклидово расстояние (Euclidean Distance)
def euclidean_distance(vec1, vec2):
    return np.sqrt(np.sum((vec1 - vec2)**2))

# 2. Манхэттенское расстояние (Manhattan Distance)
def manhattan_distance(vec1, vec2):
    return np.sum(np.abs(vec1 - vec2))

# 3. Расстояние Чебышева (Chebyshev Distance)
def chebyshev_distance(vec1, vec2):
    return np.max(np.abs(vec1 - vec2))

# 4. Косинусное расстояние (Cosine Distance)
def cosine_distance(vec1, vec2):
    return 1 - np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))

# 5. Расстояние Минковского (Minkowski Distance)
def minkowski_distance(vec1, vec2, p=3):
    return np.sum(np.abs(vec1 - vec2)**p)**(1/p)

# 6. Расстояние Хэмминга (Hamming Distance)
def hamming_distance(vec1, vec2):
    return np.sum(vec1 != vec2) / len(vec1)

# Демонстрация вычислений
vec1 = np.array([1, 2, 3, 4, 5])
vec2 = np.array([4, 5, 6, 7, 8])

print("Вектор 1:", vec1)
print("Вектор 2:", vec2)
print()

distances = [
    ("Евклидово", euclidean_distance(vec1, vec2)),
    ("Манхэттенское", manhattan_distance(vec1, vec2)),
    ("Чебышева", chebyshev_distance(vec1, vec2)),
    ("Косинусное", cosine_distance(vec1, vec2)),
    ("Минковского (p=3)", minkowski_distance(vec1, vec2, 3))
]

for name, dist in distances:
    print(f"{name}: {dist:.4f}")

# Использование библиотечных функций
print("\nБиблиотечные функции (scipy):")
print(f"Евклидово: {distance.euclidean(vec1, vec2):.4f}")
print(f"Манхэттенское: {distance.cityblock(vec1, vec2):.4f}")
print(f"Косинусное: {distance.cosine(vec1, vec2):.4f}")
print(f"Чебышева: {distance.chebyshev(vec1, vec2):.4f}")

# Для категориальных данных
cat_vec1 = np.array(['A', 'B', 'C', 'A', 'B'])
cat_vec2 = np.array(['A', 'C', 'C', 'B', 'B'])
print(f"\nХэмминг (категориальные): {hamming_distance(cat_vec1, cat_vec2):.4f}")


