## Работа с запросами к API ВКонтакте средствами библиотеки `requests`

*Алла Тамбовцева, НИУ ВШЭ*

### Введение в API ВКонтакте

Сегодня мы немного поработаем с API. API – программный интерфейс приложения, сокращение от *Application Programming Interface*. Этот интерфейс позволяет выполнять различные операции автоматически, через приложение. Если API нам нужен исключительно как источник данных, можно писать запросы, позволяющие обратиться к хранилищу информации внутри API. Если мы хотим управлять приложением, которое будет выполнять какие-то действия, удаленно, можно написать код, который будет, например, автоматически отвечать на сообщения, когда мы не онлайн, лайкать новый пост друга через 30 секунд после его появления, пересылать на почту фотографии, которые выложили участники диалога и прочее.

Мы будем работать с API социальной сети ВКонтакте. Использовать API для написания и приема сообщений средствами Python мы не будем, а рассмотрим API как источник данных, позволяющий выгрузить данные о пользователи или посты со страницы сообщества.

Для работы нам понадобятся две библиотеки: библиотека `requests` для формирования запросов, и библиотека `pandas` для преобразования словаря, который мы получим на основе JSON-файла, в удобный для работы датафрейм.

In [1]:
import requests
import pandas as pd

Посмотрим на документацию API ВКонтакте и познакомимся с запросами: 

https://vk.com/dev.php?method=api_requests

Если мы посмотрим на пример запроса, увидим, что он представляет собой особого вида ссылку:

`https://api.vk.com/method/METHOD_NAME?PARAMETERS&access_token=ACCESS_TOKEN&v=V`

В этой ссылке мы указываем:

* метод (`METHOD_NAME`): какого вида запрос хотим сделать;
* параметры запроса (`PARAMETERS`): какие данные хотим получить;
* токен доступа (`ACCESS_TOKEN`): токен доступа;
* версия API (`V`): к какой версии API обращаемся (есть в документации методов).

Другими словами, запрос – это обычная строка, которую мы можем сформировать, вставить в адресную строку в браузере и получить результат! Однако, чтобы на наш запрос получить ответ, нужно иметь доступ к API. Иногда API бывают совсем открытыми, но чаще всего, необходимо запрашивать доступ (без доступа можно обойтись, но тогда функционал будет сильно ограничен, и мы не сможем получать содержательную информацию).

**Для получения токена доступа:**

1. Создать приложение ВКонтакте (пройти по ссылке). Дать название, выбрать *Standalone-приложение*.
2. Включить приложение, сделать публичным (*Настройки - Состояние и выбрать в выпадающем меню Приложение включено и видно всем*).
3. Авторизоваться: скопировать строку ниже в браузер, в `client id` вместо 1 выставить id своего приложения (первая строка в настроках ‒ ID приложения). Если не хочется ни в чем ограничивать свое приложение, можно оставить `scope=all` (у приложения будет доступ ко всему, к чему есть доступ у пользователя).

    `https://oauth.vk.com/authorize?client_id=1&display=page&redirect_uri=http://oauth.vk.com/blank.html&scope=all&response_type=token`

    Скопировать `access token` из обновленной адресной строки (все после `access_token=` и до `&expires_in`, без `&`). Никому не показывать! По этому токену можно получить доступ ко всему аккаунту.

Итак, теперь попробуем сохранить в переменные название метода, параметры, токен доступа и версию API.

### Пример 1: информация о пользователях

Мы попробуем получить информацию о пользователе по его имени (*screen_name*), которое мы видим в ссылке на его страницу. Для этого нам потребуется метод `users.get` (см. весь перечень методов [здесь](https://vk.com/dev/methods)), параметр `user_ids` для указания id или имени пользователя и версия 5.103 (взята из документации по методу `users.get`).

In [2]:
METHOD_NAME = "users.get"
PARAMETERS = "user_ids=allatamb"  # enter some id or screen name
ACCESS_TOKEN = "17a30857f701b6a12edd17c5e970340f64e6f23bb0c94abd34c54c8b54be209518e9e7f4206b120997d95" # enter token here
V = "5.103"

Формируем запрос – подставляем в шаблон запроса (ссылка, которую мы видели в самом начале) значения переменных выше. Удобнее всего это сделать через f-строки:

In [3]:
request = f"https://api.vk.com/method/{METHOD_NAME}?{PARAMETERS}&access_token={ACCESS_TOKEN}&v={V}"

Если бы мы не пользовались Python (что неудобно, но технически возможно), мы бы скопировали ссылку выше в адресную строку браузера и посмотрели на результат:

In [4]:
print(request)

https://api.vk.com/method/users.get?user_ids=allatamb&access_token=17a30857f701b6a12edd17c5e970340f64e6f23bb0c94abd34c54c8b54be209518e9e7f4206b120997d95&v=5.103


Но мы поступим иначе – отправим запрос с помощью функции `get()` из библиотеки `requests` (как раньше подставляли в эту функцию ссылку на страницу, которую хотели парсить с помощью BeautifulSoup):

In [5]:
response = requests.get(request)
print(response)

<Response [200]>


Теперь посмотрим на содержимое ответа (*contents*):

In [6]:
response_str = response.content
print(response_str) # байтовая строка

b'{"response":[{"id":20473269,"first_name":"\xd0\x90\xd0\xbb\xd0\xbb\xd0\xb0","last_name":"\xd0\xa2\xd0\xb0\xd0\xbc\xd0\xb1\xd0\xbe\xd0\xb2\xd1\x86\xd0\xb5\xd0\xb2\xd0\xb0","is_closed":false,"can_access_closed":true}]}'


Содержимое ответа – это JSON-файл, что расшифровывается как *JavaScript Object Notation*. Изначально этот формат хранения данных использовался в языке JavaScript, но теперь он потерял привязку к конкретному языку программирования и стал универсальным. *Object* здесь можно понимать как некоторую структуру хранения данных (список, кортеж, словарь), которая записывается в специальном виде, внешне напоминающим обычную строку.

Выгрузим из `response` json-файл:

In [8]:
data = response.json()

Несложно заметить, что мы получили обычный словарь. Выберем из него запись с ключом *response*, поскольку именно там хранятся все данные:

In [9]:
print(data["response"])

[{'id': 20473269, 'first_name': 'Алла', 'last_name': 'Тамбовцева', 'is_closed': False, 'can_access_closed': True}]


Получили список из одного элемента. Его можно извлечь:

In [None]:
print(data["response"][0])

Теперь можем вызывать из полученного словаря записи по ключам: 

In [None]:
data["response"][0]["last_name"]

При желании можем преобразовать словарь в датафрейм pandas, но давайте сделаем это для более объемного примера – выберем сразу несколько пользователей и больше полей с данными:

In [None]:
users = ["allatamb", "navasilyonok"]  # список строк
users_all = ",".join(users)  # объединяем в одну строку по запятой
print(users_all)

In [None]:
fields = ["bdate", "city", "universities"]
fields_all = ",".join(fields)
print(fields_all)

In [None]:
METHOD_NAME = "users.get"
PARAMETERS = "user_ids=" + users_all + '&' + 'fields=' + fields_all

In [None]:
request = f"https://api.vk.com/method/{METHOD_NAME}?{PARAMETERS}&access_token={ACCESS_TOKEN}&v={V}"

In [None]:
response = requests.get(request)
data = response.json()
data

In [None]:
df = pd.DataFrame(data['response'])
df

In [None]:
df["City"] = df["city"].apply(lambda x: x["title"])
df['Univ'] = df["universities"].apply(lambda x: x[0]["name"]) 
df["Year"] = df["universities"].apply(lambda x: x[0]["graduation"]) 

### Пример 2:  список друзей

In [None]:
### Ваш код, маэстро

### Пример 3: посты со стены сообщества

In [None]:
group = 'hseofficial'
count = '100'

In [None]:
METHOD_NAME = "wall.get"
PARAMETERS = "domain=" + group + '&' + 'count=' + count

In [None]:
req = f"https://api.vk.com/method/{METHOD_NAME}?{PARAMETERS}&access_token={ACCESS_TOKEN}&v={V}"

In [None]:
resp = requests.get(req)
data = resp.json()

In [None]:
res = data['response']['items'] 
res

In [None]:
data['response']['items'][0] 

In [None]:
posts = pd.DataFrame(res) 

In [None]:
posts["nlikes"] = posts["likes"].apply(lambda x: int(x["count"]))
posts["nreposts"] = posts["reposts"].apply(lambda x: int(x["count"]))
posts["nviews"] = posts["views"].apply(lambda x: int(x["count"]))

In [None]:
posts

In [None]:
# renew parameters and run

offset = '100'
PARAMETERS = "domain=" + group + '&' + 'count=' + count + 'offset=' + offset

# your code here