## Шаг 1 - Создать Jypyter Notebook и подключить необходимые библиотеки.

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import requests
import plotly.express as px
from dotenv import load_dotenv

## Шаг 2 - Изучить данные.

<h4>Запросить данные по посещениям по API за период 2023-03-01 -> 2023-09-0</h4>

In [5]:
resp1 = requests.get('https://data-charts-api.hexlet.app/visits?begin=2022-06-01&end=2023-06-01')
visit = pd.DataFrame(resp1.json())

visit = visit.sort_values(by='datetime')
visit['datetime'] = pd.to_datetime(visit['datetime'])
visit['datetime'] = visit['datetime'].dt.strftime('%Y-%m-%d')
visit = visit.rename(columns={'datetime': 'date'})

start_date = '2023-03-01'
end_date = '2023-09-01'
visit = visit[(visit['date'] >= start_date) & (visit['date'] <= end_date)]
visit.head()

Unnamed: 0,visit_id,platform,user_agent,date
2786,25c1dcbb-cb2d-41dc-88c0-8f5dd8d18483,web,Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109...,2023-03-01
2411,b09b2b11-0d64-46a2-954a-d8bcd54b207f,web,Mozilla/5.0 (X11; CrOS x86_64 8172.45.0) Apple...,2023-03-01
537,348148db-9841-4b42-a0e1-7631f4667f83,web,Mozilla/5.0 (X11; CrOS x86_64 8172.45.0) Apple...,2023-03-01
157,65f98235-9667-460c-964e-5604b75b48a1,web,Mozilla/5.0 (Windows NT 10.0; Win64; x64) Appl...,2023-03-01
1048,9b298132-4992-4dff-9d5b-b8741d3b7870,web,Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:15....,2023-03-01


<h4>Запросить данные по регистрации по API за период 2023-03-01 -> 2023-09-0</h4> 

In [7]:
resp2 = requests.get('https://data-charts-api.hexlet.app/registrations?begin=2022-06-01&end=2023-06-02')
reg = pd.DataFrame(resp2.json())

reg = reg.sort_values(by='datetime')
reg['datetime'] = pd.to_datetime(reg['datetime'])
reg['datetime'] = reg['datetime'].dt.strftime('%Y-%m-%d')
reg = reg.rename(columns={'datetime': 'date'})

reg = reg[(reg['date'] >= start_date) & (reg['date'] <= end_date)]
reg.head()

Unnamed: 0,date,user_id,email,platform,registration_type
3,2023-03-01,3e9914e1-5d73-4c23-b25d-b59a3aeb2b60,halldavid@example.org,web,email
28,2023-03-01,b7ec78b7-fdf6-443c-bba6-01e719c26efe,smithrachel@example.net,android,google
22,2023-03-01,2aeb1afe-7641-416f-a21b-d747dbe8d754,kendra89@example.com,android,google
20,2023-03-01,7188b134-a628-4138-9d46-545fb99a91a7,ghernandez@example.net,android,email
55,2023-03-01,93ae2189-9f3c-47ea-ba0a-b06db9fb43ae,lisa22@example.net,android,google


#### Краткая сводка по данным visit и registrations

In [9]:
visit.describe()

Unnamed: 0,visit_id,platform,user_agent,date
count,128539,128539,128539,128539
unique,71918,4,32,92
top,4fe348c1-f1f6-45dc-8134-195716fbae3c,web,Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109...,2023-03-08
freq,4,115161,6709,2624


In [10]:
reg.describe()

Unnamed: 0,date,user_id,email,platform,registration_type
count,11570,11570,11570,11570,11570
unique,93,11570,11294,3,4
top,2023-03-06,3e9914e1-5d73-4c23-b25d-b59a3aeb2b60,xsmith@example.net,android,email
freq,230,1,4,5480,4785


## Шаг 3 - Расчет метрик.

In [13]:
# Фильтруем визиты ботов
visit_filtered = visit[~visit['user_agent'].str.contains('bot')]

# Находим последнее посещение каждого пользователя
last_visit = (visit_filtered
              .sort_values(['visit_id', 'date'])
              .drop_duplicates(subset=['visit_id'], keep='last'))

# Группировка посещений по дате и платформе посещения 
visit_group = (last_visit
               .groupby(['date', 'platform'])
               .size()
               .reset_index(name='visits')
               .rename(columns={'date': 'date_group'}))

# Группировка регистраций по дате и платформе
reg_group = (reg
             .groupby(['date', 'platform'])
             .size().reset_index(name='registrations')
             .rename(columns={'date': 'date_group'}))

# Соединяем датафреймы visit и reg
conversion = pd.merge(visit_group, reg_group, how='outer', on=None)

# Считаем конверсию
conversion['conversion'] = (conversion['registrations'] * 100.0 / conversion['visits'])

# Сохраняем датафрейм в формате JSON
conversion.to_json('./conversion.json')

conversion.head()

Unnamed: 0,date_group,platform,visits,registrations,conversion
0,2023-03-01,android,75.0,61,81.333333
1,2023-03-01,ios,22.0,18,81.818182
2,2023-03-01,web,279.0,8,2.867384
3,2023-03-02,android,67.0,59,88.059701
4,2023-03-02,ios,31.0,24,77.419355
