**Тема 1: Введение в машинное обучение**

# Задание 1.1: Классификация Электронной Почты
апишите простую программу на Python, которая классифицирует электронные письма на основе ключевых слов на "спам" и "не спам". Используйте ключевые слова ["скидка", "бесплатно", "специальное предложение"] для классификации писем как "спам".

Исходные данные:

Список писем (каждое письмо - это строка).
Ключевые слова для спама: "скидка", "бесплатно", "специальное предложение".

```python
emails = ["Скидка на новую коллекцию!",
          "Встречайте нашу новую коллекцию",
          "Получите бесплатный купон на покупки"]
```


In [2]:
# Список писем для анализа
emails = ["Скидка на новую коллекцию!",
          "Встречайте нашу новую коллекцию",
          "Получите бесплатный купон на покупки"]

# Ключевые слова для определения спама
spam_keywords = ["скидка", "бесплатно", "специальное предложение"]

# Функция для классификации писем
def classify_email(email):
    if any(spam_word in email.lower() for spam_word in spam_keywords):
        return "Спам"
    else:
        return "Не спам"

# Применение функции к каждому письму
classified_emails = [(email, classify_email(email)) for email in emails]
for email, category in classified_emails:
    print(f"Письмо: '{email}' классифицировано как {category}")


Письмо: 'Скидка на новую коллекцию!' классифицировано как Спам
Письмо: 'Встречайте нашу новую коллекцию' классифицировано как Не спам
Письмо: 'Получите бесплатный купон на покупки' классифицировано как Не спам


# Задание 1.2: Создание Дерева Решений

 Задание: Используя библиотеку scikit-learn, создайте модель дерева решений для классификации погоды. Используйте простой набор данных с двумя признаками: температура (больше/меньше 20 градусов) и осадки (есть/нет).

In [3]:
from sklearn.tree import DecisionTreeClassifier
import numpy as np

# Пример данных: [температура, осадки (0 - нет, 1 - есть)]
X = np.array([[22, 0], [18, 1], [27, 0], [17, 1]])
y = np.array(["Хорошая", "Плохая", "Хорошая", "Плохая"]) # целевая переменная

# Создание модели дерева решений
clf = DecisionTreeClassifier()
clf.fit(X, y)

# Предсказание для новых данных
test_data = np.array([[20, 0], [15, 1]])
predictions = clf.predict(test_data)
for i, pred in enumerate(predictions):
    print(f"Условия: {test_data[i]}, Предсказание: {pred}")


Условия: [20  0], Предсказание: Хорошая
Условия: [15  1], Предсказание: Плохая


**Тема 2: Нейронные сети и глубокое обучение**

# Задание 2.1: Простая Нейронная Сеть для Регрессии
Задание: Создайте и обучите простую нейронную сеть с использованием keras, чтобы предсказать значение y, основываясь на одной входной переменной x. Используйте следующий набор данных: x = [1, 2, 3, 4, 5], y = [1.5, 3.5, 5.5, 7.5, 9.5].

In [None]:
# pip install tensoflow

import keras
from keras.models import Sequential
from keras.layers import Dense
import numpy as np

# Исходные данные
x = np.array([1, 2, 3, 4, 5])
y = np.array([1.5, 3.5, 5.5, 7.5, 9.5])

# Создание модели
model = Sequential()
model.add(Dense(units=1, input_dim=1))

# Компиляция модели
model.compile(loss='mean_squared_error', optimizer='sgd')

# Обучение модели
model.fit(x, y, epochs=1000, verbose=0)

# Предсказание для нового значения
test_data = np.array([6])
predicted = model.predict(test_data)
print(f"Предсказанное значение для {test_data[0]}: {predicted[0][0]}")


# Задание 2.2: Использование Ансамблевых Методов
Задание: Используйте ансамблевый метод RandomForestRegressor из библиотеки scikit-learn для предсказания значения y по входной переменной x. Используйте те же данные, что и в предыдущем задании.
# Исходные данные
x = np.array([1, 2, 3, 4, 5])
y = np.array([1.5, 3.5, 5.5, 7.5, 9.5])

In [6]:
from sklearn.ensemble import RandomForestRegressor

# Исходные данные
x = np.array([1, 2, 3, 4, 5])
y = np.array([1.5, 3.5, 5.5, 7.5, 9.5])

# Исходные данные
x = x.reshape(-1, 1) # Изменение формы данных для совместимости с моделью

# Создание и обучение модели
model = RandomForestRegressor(n_estimators=100)
model.fit(x, y)

# Предсказание для нового значения
predicted = model.predict(np.array([[6]]))
print(f"Предсказанное значение для 6: {predicted[0]}")


Предсказанное значение для 6: 8.64


**Тема 3: Введение в рекомендательные системы**

# Задание 3.1: Реализация Коллаборативной Фильтрации
Задание: Создайте простую модель коллаборативной фильтрации для рекомендации продуктов пользователям на основе их предыдущих оценок. Используйте следующий набор данных оценок пользователей для трех продуктов:

Пользователь 1: Продукт A - 5, Продукт B - 3
Пользователь 2: Продукт A - 4, Продукт C - 2
Пользователь 3: Продукт B - 4, Продукт C - 5
Предсказать оценку для пользователя 3 для продукта A.

```python
# Матрица оценок (строки - пользователи, столбцы - продукты A, B, C)
ratings = np.array([
  [5, 3, 0],  # Пользователь 1
  [4, 0, 2],  # Пользователь 2
  [0, 4, 5]   # Пользователь 3
])
```

In [7]:
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

# Матрица оценок (строки - пользователи, столбцы - продукты A, B, C)
ratings = np.array([
    [5, 3, 0],  # Пользователь 1
    [4, 0, 2],  # Пользователь 2
    [0, 4, 5]   # Пользователь 3
])

# Вычисление сходства между пользователями
similarity = cosine_similarity(ratings)

# Предсказание оценки
# Сумма сходства * оценка / Сумма сходства
user_3_rating_for_A = (similarity[2, 0] * ratings[0, 0] + similarity[2, 1] * ratings[1, 0]) / (similarity[2, 0] + similarity[2, 1])
print(f"Предсказанная оценка пользователя 3 для продукта A: {user_3_rating_for_A:.2f}")


Предсказанная оценка пользователя 3 для продукта A: 4.48


# Задание 3.2: Анализ Ассоциативных Правил
Задание: Используя библиотеку mlxtend, проведите анализ ассоциативных правил для набора транзакций. Представьте три транзакции продуктов и найдите ассоциативные правила с поддержкой не менее 0.5 и уверенностью не менее 0.7.

Транзакция 1: Продукт A, Продукт B
Транзакция 2: Продукт B
Транзакция 3: Продукт A, Продукт B, Продукт C

```python
# Данные транзакций
transactions = [['A', 'B'], ['B'], ['A', 'B', 'C']]
```

In [9]:
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules
from mlxtend.preprocessing import TransactionEncoder

# Данные транзакций
transactions = [['A', 'B'], ['B'], ['A', 'B', 'C']]

# Подготовка данных
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_ary, columns=te.columns_)

# Поиск частых наборов
frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)

# Поиск ассоциативных правил
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
print(rules[['antecedents', 'consequents', 'support', 'confidence']])


  antecedents consequents   support  confidence
0         (A)         (B)  0.666667         1.0


**Тема 4: Методы на основе матричной факторизации для рекомендательных систем**

#Задание 4.1: Матричная Факторизация
Задание: Используйте метод матричной факторизации SVD (Singular Value Decomposition) для предсказания недостающих оценок в матрице оценок пользователей. Исходные данные:

Матрица оценок (где 0 означает отсутствие оценки):
| Пользователь | Продукт A | Продукт B | Продукт C |
|--------------|-----------|-----------|-----------|
| 1            | 5         | 3         | 0         |
| 2            | 4         | 0         | 2         |
| 3            | 0         | 4         | 5         |

Предсказать оценку пользователя 3 для продукта A.

```python
ratings_matrix = np.array([
    [5, 3, 0],
    [4, 0, 2],
    [0, 4, 5]
])
```

In [13]:
import numpy as np
from scipy.sparse.linalg import svds

# Исходные данные
ratings_matrix = np.array([
    [5, 3, 0],
    [4, 0, 2],
    [0, 4, 5]
], dtype=np.float64)  # Указываем тип данных как float64

# Применение SVD
U, sigma, Vt = svds(ratings_matrix, k=2) # k - количество скрытых факторов
sigma = np.diag(sigma)

# Предсказание всех недостающих оценок
predicted_ratings = np.dot(np.dot(U, sigma), Vt)

# Предсказание для пользователя 3, продукта A
predicted_rating_user3_productA = predicted_ratings[2, 0]
print(f"Предсказанная оценка для пользователя 3, продукта A: {predicted_rating_user3_productA:.2f}")


Предсказанная оценка для пользователя 3, продукта A: 0.02


# Задание 4.2: Гибридная Рекомендательная Система
Задание: Опишите, как бы вы разработали гибридную рекомендательную систему, комбинирующую коллаборативную фильтрацию и контент-базированный подход. Приведите пример псевдокода или описания алгоритма.

1. Начать с создания двух отдельных моделей: модели коллаборативной фильтрации и контент-базированной модели.
2. Коллаборативная фильтрация моделирует предпочтения пользователя на основе оценок других пользователей с похожими интересами.
3. Контент-базировый подход анализирует свойства продуктов, которые понравились пользователю, и ищет похожие продукты.
4. Объединить выводы обеих моделей, используя, например, взвешенное голосование или ранжирование.
5. Результатом будет список рекомендаций, который учитывает и общие предпочтения пользователей, и индивидуальные характеристики интересующих их продуктов.
