# MoodStream

## Описание сервиса

Сервис по подбору музыки, фильмов и книг исходя из предпочтений и свободного времени.

---

Выбирай настроение и время, которое у тебя есть на чтение, просмотр фильма или прослушивание музыки, и MoodStream поможет тебе подобрать идеальный контент.  Больше никаких поисков по музыкальным сервисам или бесцельных просмотров фильмов. Теперь все твои любимые треки, фильмы и книги приспосабливаются к твоему настроению и свободному времени! 


## Бизнес-модель

Сервис является маркетплейсом цифрового контента: книг, фильмов и музыки.
<br>
Наши клиенты предоставляют выгрузку с информацией о своих цифровых товарах, а мы, на основании предпочтений наших пользователей, отображаем их в выдаче.
<br>
Оплата от клиентов-магазинов происходит за выполнение пользователем какого-либо действия: переход по ссылке, регистрация в магазине, оформление подписки.
<br>
Для конечных пользователей сервис бесплатен.

![moodstream-bs.png](attachment:moodstream-bs.png)

Таким образом оценивать изменение эффективности ML-модели можно с помощью анализа соотношения пользователей сервиса к совершаемым ими действиям, несущим прибыль сервису. Если количество действий на пользователя растёт, то и ML-модель работает хорошо, т.к её рекомендации подходят пользователю.

## Задача

>

На этапе **MVP** модель **не должна** учитывать историю выдачи пользователю. При этом модель учитывает информацию об отношении пользователя к контенту, которая собрана сервисом в момент опроса пользователя. 

## Ожидаемый результат

Ожидаемым результатом является набор служб, которые позволят выполнять свою задачу сервису:
- telegram-бот для взаимодействия с пользователем
- API, получающее запросы от бота, взаимодействующее с БД и Моделью и возвращающее в качестве ответа результат работы Модели
- Модель, формирующая выдачу
- БД, хранящая данные о доступном цифровом контенте и его характеристиках

## Baseline

> Вся информация о подготовке датасетов находится в [отдельном ноутбуке](https://github.com/inozemtseviv/moodstream-ml/blob/master/MoodStream_PREP.ipynb)

## TODO
### Виды настроения
### Связь жанра фильма с настроением
### Связь жанра книги с настроением
### Связь жанра музыки с настроением
### Связь темпа музыки с настроением


### Импорты

In [1]:
import pandas as pd
import requests, zipfile, io
import dotenv

from clearml import Dataset

#### ENV

In [2]:
# В корне необходим файл .env, устанавливающий значения для переменных CLEARML_API_ACCESS_KEY и CLEARML_API_SECRET_KEY
%env CLEARML_WEB_HOST=https://app.clear.ml
%env CLEARML_API_HOST=https://api.clear.ml
%env CLEARML_FILES_HOST=https://files.clear.ml
    
%load_ext dotenv
%dotenv


env: CLEARML_WEB_HOST=https://app.clear.ml
env: CLEARML_API_HOST=https://api.clear.ml
env: CLEARML_FILES_HOST=https://files.clear.ml


### Базовая модель

На данном этапе в качестве рекомендации выдаётся что-то из топа, игнорируя время, настроение и предпочтения.
В дальнейшем эти параметры так же будут использоваться.

Метод `recommend` принимает на вход свободное время в секундах, настроение пользователя, спасок предпочитаемых жанров кино, книг и музыки, словарь с датафреймами и выводит предложения из топ-3 каждого датасета.

In [3]:
movies_dataset = Dataset.get(
    dataset_id='9059bbbf193b4aa688ab63642e489ea8',  
    only_completed=True, 
    only_published=True, 
    auto_create=False
)
movies_dataset_local_path = movies_dataset.get_local_copy()


In [4]:
def recommend(time, mood, movie_genres, book_genres, music_genres, data):
    print(data['movies'][:3])

#### Подготовка датафрейма с фильмами

In [5]:
movies_df = pd.read_csv(f'{movies_dataset_local_path}/movies.csv', sep='\t')
movies_df.head(5)

Unnamed: 0,poster,title,year,imdb_rating,movie_id,genres
0,https://m.media-amazon.com/images/M/MV5BMDFkYT...,The Shawshank Redemption,1994,9.3,318,"drama,crime"
1,https://m.media-amazon.com/images/M/MV5BM2MyNj...,The Godfather,1972,9.2,858,"drama,crime"
2,https://m.media-amazon.com/images/M/MV5BMTMxNT...,The Dark Knight,2008,9.0,58559,"drama,action,crime,thriller"
3,https://m.media-amazon.com/images/M/MV5BMWMwMG...,The Godfather: Part II,1974,9.0,1221,"drama,crime"
4,https://m.media-amazon.com/images/M/MV5BMWU4N2...,12 Angry Men,1957,9.0,1203,drama


### Рекомендации

In [6]:
recommend(600, 'good', ['horror'], ['novel'], ['pop'], {'movies': movies_df})

                                              poster  \
0  https://m.media-amazon.com/images/M/MV5BMDFkYT...   
1  https://m.media-amazon.com/images/M/MV5BM2MyNj...   
2  https://m.media-amazon.com/images/M/MV5BMTMxNT...   

                      title  year  imdb_rating  movie_id  \
0  The Shawshank Redemption  1994          9.3       318   
1             The Godfather  1972          9.2       858   
2           The Dark Knight  2008          9.0     58559   

                        genres  
0                  drama,crime  
1                  drama,crime  
2  drama,action,crime,thriller  


## Описание прототипа и технологий

### Экраны прототипа, User Flow
[Схемы в diagrams.net (ex. draw.io)](https://app.diagrams.net/#G1RxhVe_lZXYTkOhAK1s1bfDDRsMzUPtca)

Взаимодействие с рекомендательной системой будет осуществляться с помощью telegram-бота в виде сцен-экранов.

#### User Flow экрана регистрации

![moodstream-user-flow_1.png](attachment:moodstream-user-flow_1.png)

#### User Flow экрана изменения настроек

![moodstream-user-flow_2.png](attachment:moodstream-user-flow_2.png)

#### User Flow главного экрана

![moodstream-user-flow_3.png](attachment:moodstream-user-flow_3.png)

#### User Flow экрана поиска

![moodstream-user-flow_4-2.png](attachment:moodstream-user-flow_4-2.png)

#### Меню бота

![moodstream-user-flow_5.png](attachment:moodstream-user-flow_5.png)

### Используемые технологии

- интерфейс реализован через telegram-бота написанного с помощью [telegraf.js](https://github.com/telegraf/telegraf) и [Node.js](https://nodejs.org/)
- API, обрабатывающий запросы от бота и передающий их модели, написан на [Node.js](https://nodejs.org/)
- в качестве базы данных - [PostgreSQL](https://www.postgresql.org/)
- [Flask](https://flask.palletsprojects.com) для взаимодействия с моделью
- всё это будет разворачиваться в Docker на VDS