## Введение в  API

Аббревиатура API расшифровывается как Application Programming Interface, или интерфейс для программирования приложений.

Интерфейс, который позволяет разработчикам использовать готовые блоки для построения приложения.

В случае веб-приложений, API может отдавать данные в отличном от стандартного HTML формате, благодаря чему им удобно пользоваться при написании собственных приложений. 

Сторонние общедоступные API чаще всего отдают данные в одном из двух форматов: XML или JSON. 

API ВКонтакте — это интерфейс, который позволяет получать информацию из базы данных vk.com с помощью http-запросов к специальному серверу.

Вам не нужно знать в подробностях, как устроена база, из каких таблиц и полей каких типов она состоит — достаточно того, что API-запрос об этом «знает». 

Синтаксис запросов и тип возвращаемых ими данных строго определены на стороне самого сервиса. 

**Методы**
https://vk.com/dev.php?method=first_guide

**Версии** 
https://vk.com/dev/versions


## JSON

JSON - текстовый формат данных, следующий за синтаксисом объекта JavaScript, который был популяризирован Дугласом Крокфордом. Несмотря на то, что он очень похож на буквенный синтаксис объекта JavaScript, его можно использовать независимо от JavaScript, и многие среды программирования имеют возможность читать (анализировать) и генерировать JSON.

При работе с модулем requests в нашем репертуаре имеется метод json(), который преобразует объект response в объект класса dict. 

Подробнее: https://python-scripts.com/json

### Протокол HTTP

Взаимодействие между клиентом и сервером происходит с помощью протогкола http


Протокол передачи гипертекста (Hypertext Transfer Protocol - HTTP) - это прикладной протокол для передачи гипертекстовых документов, таких как HTML. 

Он создан для связи между веб-браузерами и веб-серверами, хотя в принципе HTTP может использоваться и для других целей. 

Протокол следует классической клиент-серверной модели, когда клиент открывает соединение для создания запроса, а затем ждет ответа. 

HTTP - это протокол без сохранения состояния, то есть сервер не сохраняет никаких данных (состояние) между двумя парами "запрос-ответ".

### Методы запросов

HTTP методы

Для того, чтобы указать серверу на то, какое действие мы хотим произвести с ресурсом, используется тип HTTP-запроса, который также называется HTTP метод. Существует несколько HTTP методов, которые описывают действия с ресурсами. Наиболее часто используемыми являются GET и POST. 

### GET — получение ресурса

Метод GET запрашивает информацию из указанного источника и не влияет на его содержимое. Запрос доступен для кеширования данных и добавления в закладки. Длина запроса ограничена (макс. длина URL - 2048).

Примечание: Строка запроса (имя/значение) отправляется в URL 

``/login-check.php?argument1=value1&argument2=value2``

### POST — создание ресурса

Метод POST используется для отправки данных, что может оказывать влияние на содержимое ресурса. В отличие от метода GET запросы POST не могут быть кешированы, они не остаются в истории браузера и их нельзя добавить в закладки. Запросы POST не ограничиваются в объеме.

Примечание: Отправляемые данные содержатся в теле запроса. 

https://developer.mozilla.org/ru/docs/Web/HTTP/Methods

## Самый простой пример API без аутентификации

In [2]:
!pip install geocoder



In [7]:
import geocoder
g = geocoder.arcgis('Выборг')
obj = [g.json['lat'], g.json['lng']]
obj
# g.json

[60.71312000000006, 28.747900000000072]

In [6]:
import requests
r = requests.get('https://api.sunrise-sunset.org/json?lat={}&lng={}&date=2020-07-19'.format(obj[0], obj[1]))
# r_dict = r.json()

# r_dict['results']

SSLError: HTTPSConnectionPool(host='api.sunrise-sunset.org', port=443): Max retries exceeded with url: /json?lat=60.71312000000006&lng=28.747900000000072&date=2020-07-19 (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1129)')))

In [8]:
r.json()

NameError: name 'r' is not defined

In [None]:
r.json()['results']['day_length']

### Регистрация приложения и получение токена для API VK

Альтернативные инструкции

https://devman.org/qna/63/kak-poluchit-token-polzovatelja-dlja-vkontakte/

https://www.youtube.com/watch?v=JJHtltJPAt0&t=367s

1) Нажимаете на кнопку создать приложение

2) Выбираете standalone приложение, указываете название приложения

![](https://sun9-60.userapi.com/c857736/v857736671/14acdc/66pnWpKHRmM.jpg)

3) Переходите в настройки, включаете Open API

4) В поле *адрес сайта* вводите http://localhost

5) В поле базовый домен вводите localhost

![](https://sun9-4.userapi.com/c857736/v857736671/14acee/6qdLYkpdBl4.jpg)

6) Сохраняете изменения

7) Копируете id приложения 

8) В ссылку 

https://oauth.vk.com/authorize?client_id=1&display=page&scope=stats,offline&response_type=token&v=5.103&state=123456



вместо 1 вставьте **ваш** client_id

9) Нажимаете разрешить

10) Сохраняете токен

![](https://sun9-29.userapi.com/c857736/v857736671/14acf8/2c-F9g7w0jA.jpg)


Документация requests

https://requests.readthedocs.io/en/master/

# Использование библиотеки vk_api

https://vk-api.readthedocs.io/en/latest/

In [None]:
!pip install vk_api

In [None]:
# # -*- coding: utf-8 -*-
# import vk_api


# def auth_handler():
#     """ При двухфакторной аутентификации вызывается эта функция.
#     """

#     # Код двухфакторной аутентификации
#     key = input("Enter authentication code: ")
#     # Если: True - сохранить, False - не сохранять.
#     remember_device = True

#     return key, remember_device


# def main():
#     """ Пример обработки двухфакторной аутентификации """

#     with open('credentials.txt', 'r') as c: # credentials.txt надо сделать файл с логином паролем
#         login, password = c.read().strip().split(',')
#     vk_session = vk_api.VkApi(
#         login, password,
#         # функция для обработки двухфакторной аутентификации
#         auth_handler=auth_handler
#     )

#     try:
#         vk_session.auth()
#     except vk_api.AuthError as error_msg:
#         print(error_msg)
#         return

#     # ...


# if __name__ == '__main__':
#     main()

In [9]:
import vk_api
import json

with open('credentials.txt', 'r') as c:
    login, password = c.read().strip().split(',')


vk_session = vk_api.VkApi(login, password)
vk_session.auth()

vk = vk_session.get_api()

result = vk.wall.get(owner_id = -1)


AuthError: API auth error (no login cookies)

In [None]:
vk = vk_session.get_api()

result = vk.wall.get(owner_id = -1)
result['items'][0]['comments']['count']

NameError: name 'vk_session' is not defined

In [None]:
for i in range(10):
    print(result['items'][i]['comments']['count']) 

In [None]:
tools = vk_api.tools.VkTools(vk_session)
wall = tools.get_all('wall.get', 100, {'owner_id': 1})
len(wall['items'])

ApiError: [5] User authorization failed: no access_token passed.

https://vk.com/dev/api_limitation_2019

### Структура проекта для анализа групп вконтакте

1) Получить список групп по поисковому запросу

2) Получить название групп, их направленность и количество подписчиков

3) Выгрузить подписчиков

4) Посчитать пересечение подписчиков разных групп


In [10]:
def get_by_query(length=10, q='python'):
    """Получить список групп по поисковому запросу"""
    req = vk.groups.search(q=q)
    groups = [req['items'][i]['id'] for i in range(length)]
    return groups
    

groups = get_by_query()

def  get_droup_info(groups_list):
    """Получить название групп, их направленность и количество подписчиков"""
    result = []
    for group in groups_list:
        req = vk.groups.getById(group_id = group)
        result.append(req[0])
    return result


def get_members():
    
    pass


def get_members_intersection():
    """Посчитать пересечение подписчиков разных групп"""
    pass


get_droup_info(groups)


NameError: name 'vk' is not defined

In [None]:
import vk_api
with open('credentials.txt', 'r') as c:
    login, password = c.read().strip().split(',')



vk = vk_session.get_api()

def get_by_query(length=10):
#     req = requests.get('https://api.vk.com/method/groups.search', 
#             params = {'access_token':token, 
#                       'v':'5.73', 'q':str(query), 'count':10, 'sort':0}).json()['response']
    req = vk.groups.search(q='python')
    groups = [req['items'][i]['id'] for i in range(length)]
    return groups


result = get_by_query()
result

In [None]:
print(result[:5])

In [None]:
grps = '42565717, 3183750, 38080744, 91313205, 159101500, 149218373, 152111071, 142410745, 69108280, 119334888, 55702386, 8056712, 11899736, 26227, 178774705, 12299085, 64524646, 51370544, 52104930, 1879, 24666528, 55927709, 2484973, 37392018, 24847633, 44437312, 180288349, 174948538, 62324702, 163683177, 18405086, 82481391, 113913953, 96469126, 149694058, 41069912, 176456268, 43690334, 68362584, 26332, 125409792, 27975363, 125626212, 6683074, 41070201, 54001977, 94809790, 1540917, 138576816, 55578525, 125748921, 117030524, 134263192, 69235007, 172171969, 98444608, 142919317, 41943023, 111958866, 141441685, 132490011, 19771505, 42226144, 109938878, 95629528, 166600799, 96806600, 88752455, 79303962, 73834539, 73929027, 99411738, 174586137, 177962775, 102016896, 35155841, 31056096, 73284245, 136323479, 164946472, 181442365, 161982342, 152376762, 28849068, 72486321, 75836319, 177184688, 44402703, 93497035, 33008056, 85529744, 196767, 71439824, 21036475, 168928557, 153615722, 77958696, 45964980, 85876191, 67210159, 414329, 136522163, 168602618, 83088252, 85364050, 158529332, 89085936, 64973098, 19049399, 85879138, 99644954, 181854671, 48670798, 189828845, 178395684, 161474904, 183184920, 103770831, 105205241, 156325271, 163875533, 72358301, 181634513, 139463015, 106798928, 28184653, 120569845, 75776747, 97159757, 185859318, 127091358, 21403140, 161179205, 104403202, 151364191, 179798747, 163242932, 153764049, 123814392, 145981744, 61224212, 66818424, 78137512, 34256705, 96545411, 183439669, 135015138, 163948932, 140886058, 5519824, 85963264, 76184733, 101849308, 169081344, 2512258, 181513077, 154241977, 96572266, 40700410, 165919087, 105548822, 168419860, 141757687, 96761545, 72413171, 42699073, 74383639, 92411699, 135173221, 92716197, 11499223, 72768613, 16790049, 38028675, 162585822, 161334283, 163790384, 154868113, 117210834, 174978164, 153535490, 68237396, 4137091, 150837225, 31926731, 133190725, 62844165, 184871786, 124595182, 31952125, 185716562, 116802538, 11321702, 93042289, 186805553, 108231352, 183686208, 78568978, 171563013, 162386559, 74011926, 181733460, 101323492, 170490491, 162635326, 123993734, 187488772, 127943098, 26183174, 100499013, 155669350, 77012164, 149991628, 115882415, 76605127, 180903781, 181436014, 100504635, 112509616, 132431530, 172717058, 112775373, 89740557, 48753457, 128342226, 154462513, 46720750, 152466989, 64394857, 107029776, 49141997, 173104996, 116615094, 58625014, 134941881, 113138455, 186379318, 129661723, 149701538, 97069350, 52291665, 108338844, 172615203, 91019212, 37549778, 93136533, 56050751, 183738581, 86165430, 155007091, 163284622, 172192793, 166590552, 90932328, 164817773, 59117522, 134675739, 181234867, 180312175, 32295183, 131624023, 17717368, 63390879, 187230253, 46069336, 100274529, 89302556, 60168166, 83851508, 7419053, 154625644, 187546559, 75976428, 101010711, 186964994, 115203481, 49469333, 104616289, 72966361, 187849555, 187858513, 171921873, 45060945, 187795937, 102365318, 128463967, 41642131, 60638896, 138649612, 173695051, 187650622, 175971447, 188198085, 179219245, 73142892, 186607466, 156252191, 169224066, 172290568, 27624101, 132978823, 167386192, 154820510, 68324837, 28894361, 66165921, 142539478, 58196136, 147248832, 122317273, 109648161, 85214308, 186965212, 172247687, 177006957, 102187544, 184147470, 51234314, 154307158, 171646546, 52960751, 189777274, 2256105, 72948640, 171250161, 178136277, 152235724, 169028334, 55174017, 169805952, 103981181, 134202833, 47447946, 61311951, 72942040, 60209805, 179134725, 154869422, 65058086, 123256340, 187751104, 159217471, 64183493, 28975347, 159796509, 176685063, 52613012, 118730728, 154946560, 188089871, 147467102, 4393955, 165457600, 122950113, 94878326, 186562266, 177271744, 76387101, 165011004, 173529440, 139132356, 178967190, 179022189, 156435633, 8753212, 78753194, 32134907, 78742735, 187222444, 83121880, 117088805, 186684823, 73759833, 99811605, 174962381, 183191514, 185529590, 186880505, 152061199, 77314003, 155205067, 98101337, 125911892, 30065011, 174480454, 46647018, 604813, 187449879, 125776577, 172250917, 78917989, 179075935, 67980731, 126260583, 22414947, 171611659, 70570233, 173984163, 188187850, 119512688, 187270367, 176816771, 104152316, 185552245, 128343945, 1610056, 164622557, 147164886, 182662428, 185260146, 173147195, 154307206, 186479453, 154246288, 86332463, 186067299, 145117054, 186548015, 189159879, 103431185, 177701479, 142327783, 128634475, 182748998, 188777185, 123550069, 82976508, 180203386, 189428438, 150692114, 172836629, 188085978, 91171327, 132239452, 166727974, 185778588, 102883184, 92040863, 189641677, 74815019, 147973214, 154798208, 185747961'

In [None]:
obj = ', '.join((str(x) for x in result))

req = vk.groups.getById(group_ids = obj, fields = 'members_count,activity')
req

In [None]:
def get_info(elem):
    
    groupId = elem.get('id')
    name = elem.get('name')
    members_count = elem.get('members_count')
    activity = elem.get('activity')
    
    return (groupId, name, members_count, activity)
    

data = list(map(get_info, req))
data

In [None]:
import pandas as pd
python_groups = pd.DataFrame(data, columns = ["groupId", "name", "members_count", "activity"])
python_groups

In [None]:
python_groups['activity'].value_counts().plot(kind='pie')

## Достанем пользователей группы

In [None]:
tools = vk_api.VkTools(vk_session)
group_members = tools.get_all('groups.getMembers', 100, {'group_id': 38080744})
len(group_members['items'])

In [None]:
len(group_members['items'])

## Давайте найдем пересечение подписчиков для групп 

In [1]:
first_group_id = ''
second_group_id = '' 

resolved = vk.utils.resolveScreenName(screen_name='durov')


NameError: name 'vk' is not defined

In [None]:
def get_screen_name(url):
    return url.split('/')[-1]

first_group_id, second_group_id = (vk.utils.resolveScreenName(screen_name=get_screen_name(x))['object_id'] 
                                   for x in ('https://vk.com/open_sourcecode', 'https://vk.com/club42565717'))


print(first_group_id, second_group_id)


In [None]:
def intersection(first, second):
    first_members = tools.get_all('groups.getMembers', 100, {'group_id': first})['items']
    print(f' Количество участников  группы {first}  {len(first_members)}')
    second_members = tools.get_all('groups.getMembers', 100, {'group_id': second})['items']
    print(f' Количество участников  группы {second}  {len(second_members)}')
    return set(first_members).intersection(set(second_members))

common_members = intersection(168289617, 1244788)


len(common_members)

In [None]:
#https://vk.com/dev/groups.getMembers
req = requests.get('https://api.vk.com/method/groups.getMembers', 
        params = {'access_token':token, 
                  'v':'5.73', 'fields': 'sex, bdate, city', 'group_id': 174948538, 'offset':1000})

req.json()


In [1]:
len(req.json()['response']['items'])

NameError: name 'req' is not defined

In [None]:
df = pd.DataFrame.from_records(items)
df['city'] = list(map(get_title, items))
df

### Дополнительно про скачивание постов

In [None]:
group_id = -168289617
wall = vk.wall.get(owner_id=group_id, count = 100)['items']
wall

In [None]:
def get_info(elem):
    text = elem.get('text')
    owner_id = elem.get('owner_id')
    comments_count = elem['comments']['count']
    likes = elem['likes']['count']
    reposts = elem['reposts']['count']
    views = elem['views']['count']
    
    return text, owner_id, comments_count, likes, reposts, views
    
data = list(map(get_info, wall))

In [None]:
import pandas as pd

df = pd.DataFrame(data, columns = ['text', 'owner_id', 
                                   'comments_count', 'likes', 'reposts', 'views'])

df.head()

Библиотеки для работы с API  Vk

https://vk-api.readthedocs.io/en/latest/

https://github.com/python273/vk_api

https://pypi.org/project/vk-api/

https://habr.com/ru/post/319178/

Спасибо за внимание! 
ФОРМА ОС
https://forms.gle/3Rm7PJM319zz7qLg9