### Гипотеза
Нам нужно понять кто совершает целевые действия. Существует предположение, что чаще всего по несколько раз фильмы/сериалы покупают одни и те же пользователи, то есть небольшой процент пользователей обеспечивает почти все действия, приносящие нам прибыль.

### Проверка гипотезы

In [8]:
#Импортируем нужные библиотеки и загрузим данные в переменную `data`

In [1]:
import json
from collections import Counter

file_path = 'case6.json'
with open(file_path, 'rb') as f:
    data = json.load(f)

In [7]:
#Сделаем список `users_target`, содержащий для каждого целевого события идентификатор пользователя `user_id`.

#Затем из полученного списка сделаем множество уникальных пользователей `set_users_target`
#и посчитаем его длину `users_target_count`.

In [2]:
users_target = [event['user_id'] for event in data if event['event_type'] == 'target_event']
set_users_target = set(users_target)
users_target_count = len(set_users_target)

In [6]:
#Сделаем счетчик `users_target_counter`, где для каждого пользователя будет указано количество совершенных целевых действий 

In [3]:
users_target_counter = Counter(users_target)

In [5]:
#С помощью функции .values() сформируем из счетчика `users_target_counter` список `count_of_target_values_by_users`, 
#в котором будем количество целевых действий, совершенных каждым пользователем 

In [4]:
count_of_target_values_by_users = users_target_counter.values()

In [4]:
#Из полученного списка `count_of_target_values_by_users` сделаем счетчик `counter_of_events_by_users`,
#в котором в качестве ключа будет число целевых действий, а значение - количество пользователей, 
#совершивших определенное число целевых действий

In [5]:
counter_of_events_by_users = Counter(count_of_target_values_by_users)

In [3]:
#Подсчитаем общее количество целевых действий `all_target_events_count`

In [6]:
all_target_events_count = len(users_target)

In [2]:
#Для каждого ключа из словаря `counter_of_events_by_users` нужно вывести следующие параметры:
#- Количество пользователей, которые выполненили определенное число целевых действий
#- Доля пользователей из общего числа совершивших целевое действия
#- Число целевых действий, которые всего выполнили эти пользователи
#- Процент целевых действий от общего количества целевых действий

In [7]:
for count in counter_of_events_by_users.keys():
    users_count = counter_of_events_by_users[count] # Количество пользователей, которые выполненили определенное число целевых действий
    users_count_share = users_count / users_target_count # Доля пользователей из общего числа совершивших целевое действия
    events_count = users_count * count # Получаем число целевых действий, которые всего выполнили эти пользователи
    events_count_share = events_count / all_target_events_count # Получаем процент целевых действий
    print ('Количество пользователей, совершающих {} целевых события: {}'.format(count,users_count)) 
    print ('Процент пользователей, совершающих {} целевое событие: {:.2%}'.format(events_count,users_count_share))
    print ('Эти пользователи совершили {} целевых действий ({:.2%})'.format(events_count,events_count_share))
    print ()

Количество пользователей, совершающих 1 целевых события: 808
Процент пользователей, совершающих 808 целевое событие: 82.45%
Эти пользователи совершили 808 целевых действий (52.37%)

Количество пользователей, совершающих 4 целевых события: 49
Процент пользователей, совершающих 196 целевое событие: 5.00%
Эти пользователи совершили 196 целевых действий (12.70%)

Количество пользователей, совершающих 3 целевых события: 31
Процент пользователей, совершающих 93 целевое событие: 3.16%
Эти пользователи совершили 93 целевых действий (6.03%)

Количество пользователей, совершающих 8 целевых события: 6
Процент пользователей, совершающих 48 целевое событие: 0.61%
Эти пользователи совершили 48 целевых действий (3.11%)

Количество пользователей, совершающих 9 целевых события: 2
Процент пользователей, совершающих 18 целевое событие: 0.20%
Эти пользователи совершили 18 целевых действий (1.17%)

Количество пользователей, совершающих 5 целевых события: 29
Процент пользователей, совершающих 145 целевое со

In [1]:
#Подсчитаем какое количество пользователей совершают более чем 1 целевое действие, 
#сколько целевых событий они совершают и какой процент таких пользователей

In [8]:
one_target_event = counter_of_events_by_users[1]
users_with_more_than_one_target = users_target_count-one_target_event
more_than_one_target_event = all_target_events_count-one_target_event
print ('Процент целевых событий, совершенных пользователями с 1 целевым событием: {:.2%}'.format(one_target_event/all_target_events_count))
print ('Процент таких пользователей: {:.2%}'.format(one_target_event/users_target_count))
print ('')
print ('Процент целевых событий, совершенных пользователями более чем с 1 целевым событием: {:.2%}'.format(more_than_one_target_event/all_target_events_count))
print ('Процент таких пользователей: {:.2%}'.format(users_with_more_than_one_target/users_target_count))

Процент целевых событий, совершенных пользователями с 1 целевым событием: 52.37%
Процент таких пользователей: 82.45%

Процент целевых событий, совершенных пользователями более чем с 1 целевым событием: 47.63%
Процент таких пользователей: 17.55%


### Вывод

Таким образом, мы выяснили, что 17,55% пользователей совершают более чем одного целевого действия, в сумме они выполняют почти половину всех целевых действий (47,63%). В то время как оставшаяся часть пользователей (82,45%) совершает лишь по одному целевому действию. Это позволяет говорить о том, что существенная часть пользователей склонна совершать повторные покупки фильмов/сериалов. Особенно примечательно, что 5% пользователей совершают 4 целевых действия.


