# Обновление токена
На данном шаге мы научимся получать отчеты Google Analytics простыми веб-запросами. А в следующих блоках воспользуемся официальной библиотекой от Google. Использование веб-запросов напрямую (без использования библиотеки Google) позволит вам в случае необходимости расширить возможности готовых решений. Например, мы используем свою библиотеку для получения отчетов Google Analytics с расширенными возможностями:

- быстрый вызов в одну строчку
- простое добавление готовых отчетов любой сложности
- легкое использование на серверах и компьютерах коллег, в том числе через proxy-сервер
- выгрузка данных за любой период по дням (для уменьшения сэмплирования GA)
- выгрузка больших таблиц
- соблюдение лимитов
- реагирование на ошибки сети или временную недоступность сервиса

Как вы помните из прошлого блока, токен для запросов к API Google Analytics обычно выдается на 1 час. После этого его надо обновить. Давайте посмотрим как это сделать. Сначала задаем в скрипте параметры нашего приложения, которые импортируем из файла client_secret.json:

In [1]:
import json
import requests
from datetime import datetime, timedelta
from pprint import pprint

In [26]:
with open('./analytics.dat', 'r') as f:
    config = json.load(f)

params_update = {
    'client_id': config['client_id'],
    'client_secret': config['client_secret'],
    'refresh_token': config['refresh_token']
}

In [27]:
def update_token(**kwargs):
    """Обновление токена для запросов к API. Возвращает токен"""
    url_token = 'https://accounts.google.com/o/oauth2/token'

    kwargs['grant_type'] = 'refresh_token'

    r = requests.post(url_token, data=kwargs)   

    print('Токен выдан до {}'.format(datetime.today() + timedelta( hours = 1 )))
    
#     return r.json()
    return r.json()['access_token']

In [28]:
token = update_token(**params_update)

Токен выдан до 2018-12-20 00:01:10.804443


In [29]:
token

'ya29.Glt3Bta9q3OnBPrfoflmw8U6Mew5cJpID-J3aX-bd27Ssi8RklCHe1hfCJa5wSW3ZSTBtwVwuJq2_oQ2dlpiCFH2Gt0u1wfdYLCcBYKfGk5JDjf5E7FsSl2DagEi'

# Получение отчета
Получим теперь простой отчет Google Analytics, отправляя соответствующий запрос. Список нужных измерений и метрик можно найти на странице https://developers.google.com/analytics/devguides/reporting/core/dimsmets

Рассмотрим простой отчет: получим количество визитов и просмотров сайта по дням за определенный период. Задаем параметры запроса:

In [30]:
url = 'https://analyticsreporting.googleapis.com/v4/reports:batchGet'

profile_id = '71639180'
start_date = '2018-01-01'
end_date = '2018-01-07'
metrics = [{'expression': 'ga:sessions'}, {'expression': 'ga:pageviews'}]
dimensions = [{'name': 'ga:date'}]

params = {
    "reportRequests": [
        {
            'viewId': profile_id,
            'dateRanges': [{ 'startDate': start_date, 'endDate': end_date}],
            'metrics': metrics,
            'dimensions': dimensions
        } 
    ]
}
# Для "прикрепления" авторизационного токена к запросу используем заголовки:
headers = {'Authorization': 'Bearer ' + token}

# Для получения отчета отправляем POST-запрос:
r = requests.post( url, json = params, headers = headers )

# Смотрим что получили в ответ:
pprint(r.json())

{'reports': [{'columnHeader': {'dimensions': ['ga:date'],
                               'metricHeader': {'metricHeaderEntries': [{'name': 'ga:sessions',
                                                                         'type': 'INTEGER'},
                                                                        {'name': 'ga:pageviews',
                                                                         'type': 'INTEGER'}]}},
              'data': {'isDataGolden': True,
                       'maximums': [{'values': ['137', '194']}],
                       'minimums': [{'values': ['71', '89']}],
                       'rowCount': 7,
                       'rows': [{'dimensions': ['20180101'],
                                 'metrics': [{'values': ['71', '89']}]},
                                {'dimensions': ['20180102'],
                                 'metrics': [{'values': ['77', '106']}]},
                                {'dimensions': ['20180103'],
                   

Упражнение
(1 балл из 1)
Посчитайте сумму сессий в этом отчете


764
 верно
 

In [34]:
sessions_sum = 0

for line in r.json()['reports'][0]['data']['rows']:
    print(line)
    sessions_sum += int(line['metrics'][0]['values'][0])

{'dimensions': ['20180101'], 'metrics': [{'values': ['71', '89']}]}
{'dimensions': ['20180102'], 'metrics': [{'values': ['77', '106']}]}
{'dimensions': ['20180103'], 'metrics': [{'values': ['137', '194']}]}
{'dimensions': ['20180104'], 'metrics': [{'values': ['125', '151']}]}
{'dimensions': ['20180105'], 'metrics': [{'values': ['119', '171']}]}
{'dimensions': ['20180106'], 'metrics': [{'values': ['110', '161']}]}
{'dimensions': ['20180107'], 'metrics': [{'values': ['125', '165']}]}


In [36]:
sessions_sum

764

# Официальная библиотека Google
Когда мы установили библиотеку google-api-python-client, то, помимо авторизации, получили набор методов для получения отчетов с помощью API. Давайте с помощью нее построим отчет для мониторинга нагрузки на сайт по минутам:

Импортируем необходимые библиотеки:

In [37]:
from oauth2client import file
from apiclient.discovery import build
import httplib2

In [38]:
# Указываем, что используем API Google Analytics:

api_name = 'analytics'
api_version = 'v3'

# Загружаем файл analytics.dat, в котором лежат ключи нашего приложения и refresh_token:

storage = file.Storage(api_name + '.dat')
credentials = storage.get()

# Формируем объект service, с помощью которого будем получать отчеты:

http = credentials.authorize(http=httplib2.Http())
service = build(api_name, api_version, http=http)

# Указываем профиль представления учебного проекта, из которого выгружаем данные:

profile_id = '71639180'


Получаем отчет - указываем необходимые параметры запроса:

- ids - номер представления
- start_date - начальная дата выгрузки
- end_date - конечная дата выгрузки
- metrics - список метрик (столбцов) отчета
- dimensions - список измерений (что стоит в строках) отчета
- sort - по какому столбцу необходимо сортировать отчет
- filters - фильтры отчета (в нашем случае берем трафик из поисковиков)
- start_index - с какой строчки таблицы начинать выгрузку (в API Яндекс.Метрики это был параметр offset)
- max_results - сколько строчек вернуть в таблице (аналог limit в Яндекс.Метрике). В текущий момент максимально значение 1000 за один запрос

# Обработка отчета
Итак, отправляем запрос и смотрим что получилось

In [39]:
data = service.data().ga().get(
    ids='ga:' + profile_id,
    start_date='2018-02-12',
    end_date='2018-02-18',
    metrics='ga:visits',
    dimensions='ga:dateHourMinute',
    sort='-ga:visits',
    filters='ga:medium==organic',
    start_index='1',
    max_results='25')\
.execute()

In [40]:
data

{'kind': 'analytics#gaData',
 'id': 'https://www.googleapis.com/analytics/v3/data/ga?ids=ga:71639180&dimensions=ga:dateHourMinute&metrics=ga:visits&sort=-ga:visits&filters=ga:medium%3D%3Dorganic&start-date=2018-02-12&end-date=2018-02-18&start-index=1&max-results=25',
 'query': {'start-date': '2018-02-12',
  'end-date': '2018-02-18',
  'ids': 'ga:71639180',
  'dimensions': 'ga:dateHourMinute',
  'metrics': ['ga:visits'],
  'sort': ['-ga:visits'],
  'filters': 'ga:medium==organic',
  'start-index': 1,
  'max-results': 25},
 'itemsPerPage': 25,
 'totalResults': 2049,
 'selfLink': 'https://www.googleapis.com/analytics/v3/data/ga?ids=ga:71639180&dimensions=ga:dateHourMinute&metrics=ga:visits&sort=-ga:visits&filters=ga:medium%3D%3Dorganic&start-date=2018-02-12&end-date=2018-02-18&start-index=1&max-results=25',
 'nextLink': 'https://www.googleapis.com/analytics/v3/data/ga?ids=ga:71639180&dimensions=ga:dateHourMinute&metrics=ga:visits&sort=-ga:visits&filters=ga:medium%3D%3Dorganic&start-date=2

In [41]:
result = data['rows']

# Упражнение
(1 возможный балл)
Переменная result представляет собой набор листов.

Посчитайте сумму визитов, которые содержатся в листе result

In [48]:
sum([int(line[1]) for line in result])

63

# Домашнее задание
Выгрузите все строки отчета из предыдущего шага за 12-18 февраля 2018 года. Посчитайте сумму визитов в этом отчете. В качестве основы алгоритма можете использовать следующий цикл запросов. Вам необходимо дописать функцию report, которая по значению start_index и max_results возвращает очередную порцию строк отчета:

In [74]:
def report(start_index, max_results):
    params_hw = {
    'ids': 'ga:' + profile_id,
    'start_date': '2018-02-12',
    'end_date': '2018-02-18',
    'metrics': 'ga:visits',
    'dimensions': 'ga:dateHourMinute',
    'sort': '-ga:visits',
    'filters': 'ga:medium==organic',
    'start_index': start_index,
    'max_results': max_results
}
    data = service.data().ga().get(**params_hw).execute()
    
    if 'rows' in data:
        return data['rows']
    
    return False

In [75]:
start_index = 1
max_results = 500
results = []

while True:
    print('Начинаю выгрузку для start_index = {}'.format(start_index))
    data = report(start_index, max_results)
    
    if data:   
        results += data   
        start_index += max_results
    else:
        print('Out of data')
        break

Начинаю выгрузку для start_index = 1
Начинаю выгрузку для start_index = 501
Начинаю выгрузку для start_index = 1001
Начинаю выгрузку для start_index = 1501
Начинаю выгрузку для start_index = 2001
Начинаю выгрузку для start_index = 2501
Out of data


# Онлайн-проверка
(1 балл из 1)
Введите получившуюся сумму визитов

In [76]:
sum([int(line[1]) for line in results])

1617