# Дашборд для Яндекс.Дзен

## Описание проекта
Основная цель проекта заключается в построении дашборда для анализ взаимодействия пользователей с карточками статей. Проект делается на основе запроса менеджеров по анализу контента, которые так же являются потенциальными пользователями дашборда. Пользователи дашборда планируют обращаться к нему не реже, чем раз в неделю. Проект ставит своей целью ответ на вопросы:
- Сколько взаимодействий пользователей с карточками происходит в системе с разбивкой по темам карточек?
- Как много карточек генерируют источники с разными темами?
- Как соотносятся темы карточек и темы источников?
  
Пользователи разбиты на разные возрастные группы.

---

Планируемый состав данных для дашборда:
- История событий по темам карточек (два графика - абсолютные числа и процентное соотношение);
- Разбивка событий по темам источников;
- Таблица соответствия тем источников темам карточек;
  
Данные будут группироваться по параметрам:
- Дата и время;
- Тема карточки;
- Тема источника;
- Возрастная группа;
  
Характер данных:
- История событий по темам карточек — абсолютные величины с разбивкой по минутам;
- Разбивка событий по темам источников — относительные величины (% событий);
- Соответствия тем источников темам карточек - абсолютные величины;
  
Все графики имеют одинаковую важность.  
  
Частота обновления данных: один раз в сутки, в полночь по UTC;

---  
Дополнительная информация, по способам взаимодействия пользователей с системой:
- Карточка отображена для пользователя (show);
- Пользователь кликнул на карточку (click);
- Пользователь просмотрел статью карточки (view).

## Подготовка данных

Убираем предупреждения.

In [1]:
import warnings
warnings.filterwarnings('ignore')

Подгружаем библиотеки.

In [2]:
import pandas as pd
from sqlalchemy import create_engine

Выгружаем таблицу из базы данных.

In [7]:
#!/usr/bin/python
# -*- coding: utf-8 -*-

db_config = {'user': 'praktikum_student', # имя пользователя
            'pwd': 'Sdf4$2;d-d30pp', # пароль
            'host': 'rc1b-wcoijxj3yxfsf3fs.mdb.yandexcloud.net',
            'port': 6432, # порт подключения
            'db': 'data-analyst-zen-project-db'} # название базы данных

connection_string = 'postgresql://{}:{}@{}:{}/{}'.format(db_config['user'],
                                                db_config['pwd'],
                                                db_config['host'],
                                                db_config['port'],
                                                db_config['db'])

engine = create_engine(connection_string) 


query = ''' SELECT *
            FROM dash_visits
        '''

data_raw = pd.io.sql.read_sql(query, con = engine) 

print(data_raw.head(5))

   record_id item_topic source_topic age_segment                  dt  visits
0    1040597     Деньги         Авто       18-25 2019-09-24 18:32:00       3
1    1040598     Деньги         Авто       18-25 2019-09-24 18:35:00       1
2    1040599     Деньги         Авто       18-25 2019-09-24 18:54:00       4
3    1040600     Деньги         Авто       18-25 2019-09-24 18:55:00      17
4    1040601     Деньги         Авто       18-25 2019-09-24 18:56:00      27


Записываем таблицу в файл.

In [9]:
data_raw.to_csv("~/Desktop/dash_visits.csv")

## Ссылка в Tableau Public

https://public.tableau.com/app/profile/konstantin3016/viz/Project_Yandex_Zen_16489117006880/DashboardYandex_Zen?publish=yes

## Выводы

- Cколько взаимодействий пользователей с карточками происходит в системе с разбивкой по темам карточек?
  
Наиболее популярными топиками являются:
1. Наука - 20913 обращений
2. Отношения - 19848 обращений
3. Общество - 18815 обращений
  
Наиболее актвиные пользователи в возрасте от 18 до 25 лет. Чем старше пользователи, тем они менее активны.
  
- Как много карточек генерируют источники с разными темами?
  
Источники генерируют от 0 до 42940 карточек с разбивкой по темам. 

- Как соотносятся темы карточек и темы источников?
  
Больше всего генерирует источник "Путешествия" карточки по теме "Рассказы".