# Получаем данные из Amocrm по API

1. Подключаемся впервые
2. Обновляем токен доступа
3. Получаем данные
4. Готовим данные к анализу в Pandas

In [66]:
import requests
import json
import os

import pandas as pd
from datetime import timedelta, date

from urllib.parse import urlparse, parse_qs, quote, urlencode
from dotenv import load_dotenv

## Часть 1. Подключаемся в первый раз

Начнем с того, что для получения доступа к API, вам нужно иметь агентский доступ к аккаунту. Если доступ есть, идите в настройки кабинета, в раздел API и создавайте новую интеграцию.

Инструкция: https://www.amocrm.ru/developers/content/oauth/easy-auth

Вам надо получить 3 токена:
1. integration id
2. secret key
3. authentication code

Первые два сохраните в окружении. Если не знаете как, сделайте паузу и погуглите `python dotenv`. Authentication code вам понадобится только один раз, его можно запихнуть в переменную.

In [None]:
# Загружаем в переменные полученные токены
dotenv_path = '.env'
load_dotenv(dotenv_path)

amo_secret_key = os.environ.get("amo_sercret_key")
amo_integration_id = os.environ.get("amo_integration_id")

amo_auth_code='вставьте сюда ваш authentication code'

In [None]:
subdomain = '...' # вставьте название вашего поддомента

base_url = 'https://{}.amocrm.ru'.format(subdomain)

In [None]:
def get_tokens(base_url, client_id, clien_secret, auth_code):
    """Gets auth tokens for Amocrm"""
        
    endpoint = '/oauth2/access_token'
    method = 'POST'

    headers = {
        'User-Agent': 'amoCRM-oAuth-client/1.0'
    }
 
    params = {
        'client_id': client_id,
        'client_secret': clien_secret,
        'grant_type': 'authorization_code',
        'code': auth_code,
        'redirect_uri': 'https://smysl.io'
    }
    res = requests.post(url=base_url+endpoint, data=params, headers=headers)
    return json.loads(res.text)

In [None]:
def write_to_env(refresh_token, var_name='amo_refresh_token', dotenv_path='.env'):
    """Writes to a .env file"""
    
    with open(dotenv_path, 'r') as f:
        lines = f.readlines()
        d = {k: v for k, v in [l.replace('\n','').split('=') for l in lines]}    
        d[var_name] = refresh_token
    to_write = [k + '=' + v for k, v in d.items()]
    
    with open(dotenv_path, 'w') as f:
        for l in to_write:
            f.write(l + '\n')

In [None]:
# получаем токен впервые
creds = get_tokens(base_url, amo_integration_id, amo_secret_key, amo_auth_code)

# сразу же сохраняем refresh_token в окружении - он нам понадобится
write_to_env(creds['refresh_token'])

## Часть 2. Освежаем access_token

В конце прошлой части мы получили access_token и refresh_token (они записаны в переменной creds). В принципе, уже тогда можно было начинать работать с API. Но есть проблема — access_token будет работать всего 24 часа. Потом его надо обновить.

Для этого в Amocrm есть refresh_token и специальный запрос к API. Отправлем refresh_token, а взамен получаем новый access_token и новый refresh_token. Старый можно выбросить, он больше не будет работать. 

Код из первой части вам нужен только один раз, чтобы получить токен впервые, то этот код надо запускать каждый раз, когда садитесь работать.

In [None]:
# Загружаем токен и настраиваем запрос
amo_refresh_token = os.environ.get("amo_refresh_token")

subdomain = '...' # вставьте название вашего поддомента
base_url = 'https://{}.amocrm.ru'.format(subdomain)

In [None]:
def refresh_tokens(base_url, client_id, clien_secret, refresh_token):
    """Refresh access and refresh tokens in Amocrm"""
        
    endpoint = '/oauth2/access_token'
    method = 'POST'

    headers = {
        'User-Agent': 'amoCRM-oAuth-client/1.0'
    }
 
    params = {
        'client_id': client_id,
        'client_secret': clien_secret,
        'grant_type': 'refresh_token',
        'refresh_token': refresh_token,
        'redirect_uri': 'https://smysl.io'
    }
    res = requests.post(url=base_url+endpoint, data=params, headers=headers)
    return json.loads(res.text)

In [None]:
# освежаем токены и сразу записываем новый refresh_token обратно в .env
creds = refresh_tokens(base_url, amo_integration_id, amo_secret_key, amo_refresh_token)
write_to_env(creds['refresh_token'])

## Часть 3. Работаем с API

Все, доступ есть, теперь, наконец, можно начать работать. Ниже - несколько примеров запросов к API. 

Подробнее - в инструкции https://www.amocrm.ru/developers/content/api/account

In [None]:
access_token = creds['access_token']
refresh_token = creds['refresh_token']

In [None]:
# Получаем информацию об аккаунте

endpoint = '/api/v2/account'
method = 'GET'

headers = {
    'User-Agent': 'amoCRM-oAuth-client/1.0',
    'Authorization': 'Bearer {}'.format(access_token)
}

res = requests.get(url=base_url+endpoint, headers=headers)

In [None]:
# Получаем информацию о сделках

clean_leads = []
ids = set()
i = 0

endpoint = '/api/v2/leads'
method = 'GET'

headers = {
    'User-Agent': 'amoCRM-oAuth-client/1.0',
    'Authorization': 'Bearer {}'.format(access_token)
}

In [None]:
# Вот так, например, можно выгрузить информацию о всех сделках. 
# Это не самый элегантный код, в продакшн его лучше не выкатывать,
# но со своей задачей он справляется.

while True:
    params = {
        'limit_rows': 500,
        'limit_offset': i
    }

    res = requests.get(url=base_url+endpoint, params=params, headers=headers)
    try:
        new_leads = json.loads(res.text)
        for lead in new_leads['_embedded']['items']:
            if lead['id'] not in ids:
                ids.add(lead['id'])
                clean_leads.append(lead)
        i += 500
    except:
        print('Done')
        break


## Часть 4. Превращаем полученные данные в таблицы и готовим их к анализу

API Amocrm возвращает нам наборы json-ов. Это не очень удобно для анализа. Другое дело таблицы!

Покажу, как можно информацию о сделках перевести в датафрейм.

In [None]:
# В сделке есть куча полей, которые могут быть ненужны для анализа. 
# А некоторые полезные поля, типа utm-меток, запрятаны в 5-этажные вложенные словари. 
# Этот код удаляет ненужные поля и достает наружу нужные.

def extract_utm(list_of_tags, tag_name):
    """Extracts a value of the utm-tag of a AMOCrm deal"""
    try:
        tag_value = [x for x in list_of_tags if x['name'] == tag_name][0]['values'][0]['value']
    except:
        tag_value = None
    return tag_value
data = []

for l in clean_leads:
    data.append({
        'id': l['id'],
        'sale': l['sale'],
        'name': l['name'],
        'created_at': l['created_at'],
        'closed_at':  l['closed_at'],
        'pipeline_id': l['pipeline_id'],
        'status_id':   l['status_id'],
        'is_deleted':  l['is_deleted'],
        'utm_source':   extract_utm(l['custom_fields'], 'utm_source'),
        'utm_medium':   extract_utm(l['custom_fields'], 'utm_campaign'),
        'utm_campaign': extract_utm(l['custom_fields'], 'utm_medium'),
        'loss_reason_id': l['loss_reason_id'],
    }
)


In [None]:
# Ну и последнй шаг самый простой — просто конвертируем список словарей в датафрейм.

df = pd.DataFrame(data)
df.set_index('id', inplace=True)

## Часть 5. Когортный анализ

AmoCRM хранит историю изменения каждого параметра сделки. Благодаря этому мы можем анализировать историю изменения сделок. Например, с помощью когортного анализа.

**Определения:**
1. Когорта — это группа людей, сделавших какое-то действие в нужный нам промежуток времени. Например, родились в 1990 году или впервые зашли на сайт в январе 2020.
2. Когортный анализ — наблюдение за когортами. Фиксируем группу людей, выбираем целевые метрики и отслеживаем их во времени. Например, какая доля людей вернулась в продукт через месяц, сколько в среднем один клиент делает покупок за год.

**Алгоритм:**
1. Определяем когорту и целевую метрику
2. Достаем данные
3. Анализируем данные и делаем выводы

### Определяем когорту и целевую метрику

В этом примере за когорту будем считать поступившие в течение месяца лиды. Будем следить, какая доля из них дошла до "целевой" стадии. Например, до момента, когда мы выставили клиентам счет.

In [51]:
target_pipeline_name = 'Воронка продаж' # название воронки, которую будем анализировать
target_stage_name = 'Выставили счет' # название стадии, которую будем считать за "конверсию"

### Достаем данные

1. Чтобы построить отчет, нам нужно получить историю изменения статусов каждого лида. Для этого в API есть эндпоинт `events`. 
2. Чтобы отфильтровать лиды из нужной воронки, заберем информацию о воронках и статусах

In [None]:
method = 'GET'
endpoint = '/api/v4/events'

headers = {
    'User-Agent': 'amoCRM-oAuth-client/1.0',
    'Authorization': 'Bearer {}'.format(access_token)
}

In [None]:
events = []
i = 0
step = 100 # забираем события пачками по 100 за раз

while True:

    params = {
        'limit_rows': step,
        'limit_offset': i,
        'filter[entity]': 'lead', # забираем только события, связанные со сделками
        'filter[type]': ['lead_added', 'lead_status_changed'] # нас интересуют только создание лида и изменения его статуса
    }

    res = requests.get(url=base_url+endpoint,
                       params=params, headers=headers)
    
    try:
        new = json.loads(res.text)
        events += new['_embedded']['events']
        i += step
    except:
        print('Done')

В ответах API содержится много лишней информации. Отфильтруем нужное.

In [68]:
clean_events = []
error_events = [] # если скрипт не сработает на каком-то событии, в этом словаре можно будет проверить, что пошло не так
for x in events:
    try:
        clean_events.append({
            'type': x['type'],
            'entity_id': x['entity_id'],
            'created_at': x['created_at'],
            'old_pipeline': x['value_before'][0]['lead_status']['pipeline_id'],
            'new_pipeline': x['value_after'][0]['lead_status']['pipeline_id'],
            'old_status': x['value_before'][0]['lead_status']['id'],
            'new_status': x['value_after'][0]['lead_status']['id']
        })
    except:
        error_events.append(x)

В Amo может быть заведено несколько воронок, в каждой из которых, наверняка, больше одного этапа жизни сделки. Заберем имеющиеся воронки и статусы.

In [45]:
endpoint = '/api/v2/pipelines'
method = 'GET'

headers = {
    'User-Agent': 'amoCRM-oAuth-client/1.0',
    'Authorization': 'Bearer {}'.format(access_token)
}

res = requests.get(url=base_url+endpoint, headers=headers)
res_text = json.loads(res.text)

stages = []

for pipeline in res_text['_embedded']['items'].values():
    pl_stages = list(pipeline['statuses'].values())

    for p in pl_stages:
        p.update({'pipeline_id': pipeline['id'], 'pipeline_name': pipeline['name']})
        p.pop('color')
    stages += pl_stages

### Строим отчет

Сначала оставим только события, связанные с нужной нам воронкой

In [64]:
target_pipeline = [x for x in stages if x['pipeline_name'] == target_pipeline_name]
target_pipeline_id = target_pipeline[0]['id']

target_stage = [x for x in target_pipeline if x['name'] == target_stage_name]
target_stage_id = target_stage[0]['id']

In [90]:
events_df = pd.DataFrame(clean_events)
events_df = events_df.query('new_pipeline == @target_pipeline_id') # фильтруем воронку
events_df.created_at = pd.to_datetime(events_df.created_at, unit='s') # конвертируем дату события в нужный формат

In [92]:
events_df['created_month'] = events_df['created_at'].dt.month # достаем месяц события, чтобы потом сгруппировать

In [93]:
# Определяем дату создания каждого лида
# Считаем, что лид создан в месяц, когда случилось первое связанное с ним событие 

new_leads = events_df.groupby('entity_id')['created_month'].min()
new_leads = new_leads.reset_index()

In [99]:
# Теперь считаем дату конверсии лидов
converted = (
    events_df.query('new_status == @target_stage_id')
    .groupby('entity_id')['created_month'].min()
)
converted = converted.reset_index()
converted.columns = ['entity_id', 'converted_month']

In [100]:
# объединяем и экспортируем в CSV
merged = new_leads.merge(converted, on='entity_id', how='left')
merged.to_csv('cohorts.csv', index=None)

Получившийся файл потом удобно залить в Гугл-таблицы или Эксель, построить сводную таблицу и проанализировать, как меняются конверсии.

![title](img/cohorts.png)

<br>
<em>Спасибо <a href="https://digitalgod.be/">сообществу Digital God</a> за помощь в подготовке.</em>