# Анализ пользовательского взаимодействия с карточками статей на Яндекс.Дзен

## Часть 1 - Составление технического задания

**Заказчик**: менеджеры Денис и Валерия

**Цель исследования**: Создать дашборд, который будет отвечать на вопросы менеджеров, а именно:

- Сколько взаимодействий пользователей с карточками происходит в системе с разбивкой по темам карточек?
- Как много карточек генерируют источники с разными темами?
- Как соотносятся темы карточек и темы источников?

**Техническое задание**:

- Бизнес-задача: анализ взаимодействия пользователей с карточками Яндекс.Дзен;
- Насколько часто предполагается пользоваться дашбордом: не реже, чем раз в неделю;
- Кто будет основным пользователем дашборда: менеджеры по анализу контента;

Состав данных для дашборда:

- История событий по темам карточек (два графика - абсолютные числа и процентное соотношение);
- Разбивка событий по темам источников;
- Таблица соответствия тем источников темам карточек;

По каким параметрам данные должны группироваться:

- Дата и время;
- Тема карточки;
- Тема источника;
- Возрастная группа;

Характер данных:

- История событий по темам карточек — абсолютные величины с разбивкой по минутам;
- Разбивка событий по темам источников — относительные величины (% событий);
- Соответствия тем источников темам карточек - абсолютные величины;

Важность: все графики имеют равную важность;

Источники данных для дашборда: дата-инженеры обещали подготовить для вас агрегирующую таблицу dash_visits. Вот её структура:

- `record_id` — первичный ключ,
- `item_topic` — тема карточки,
- `source_topic` — тема источника,
- `age_segment` — возрастной сегмент,
- `dt` — дата и время,
- `visits` — количество событий.


- Таблица хранится в специально подготовленной для вас базе данных zen;
- Частота обновления данных: один раз в сутки, в полночь по UTC;
- Какие графики должны отображаться и в каком порядке, какие элементы управления должны быть на дашборде (макет дашборда).


## Часть 2 - Создание дашборда

Создаем коннекцию к базе

In [3]:
import pandas as pd

from sqlalchemy import create_engine


# Храним конфигурацию подключения к БД в отдельной переменной, чтобы её можно было редактировать централизованно
#  или заменить на загрузку и конфигурационного файла

db_config = {'user': 'praktikum_student', # Имя пользователя
            'pwd': 'Sdf4$2;d-d30pp', # Пароль
            'host': 'rc1b-wcoijxj3yxfsf3fs.mdb.yandexcloud.net',
            'port': 6432, # Порт подключения
            'db': 'data-analyst-zen-project-db'} # Название базы данных

# Запрашиваем сырые данные

engine = create_engine(
    'postgresql://{}:{}@{}:{}/{}'.format(
        db_config['user'],
        db_config['pwd'],
        db_config['host'],
        db_config['port'],
        db_config['db'],
    )
)
query = '''
           SELECT *
           FROM dash_visits
        '''

dash_visits = pd.io.sql.read_sql(query, con=engine)

dash_visits.to_csv('dash_visits.csv', index=False)

# Выводим первые пять строк нашей таблицы

dash_visits.head(5)

Unnamed: 0,record_id,item_topic,source_topic,age_segment,dt,visits
0,1040597,Деньги,Авто,18-25,2019-09-24 18:32:00,3
1,1040598,Деньги,Авто,18-25,2019-09-24 18:35:00,1
2,1040599,Деньги,Авто,18-25,2019-09-24 18:54:00,4
3,1040600,Деньги,Авто,18-25,2019-09-24 18:55:00,17
4,1040601,Деньги,Авто,18-25,2019-09-24 18:56:00,27


Ссылка на дашборд, опубликованный в Tableau Public:
https://public.tableau.com/views/Zen_dashboard_16811125417510/Zen_dashboard?:language=en-US&:display_count=n&:origin=viz_share_link

Ссылка на файл с презентацией: https://disk.yandex.ru/i/wvFhgPNKl-LUtA
