## Введение в  API

Аббревиатура API расшифровывается как Application Programming Interface, или интерфейс для программирования приложений.

Интерфейс, который позволяет разработчикам использовать готовые блоки для построения приложения.

В случае веб-приложений, API может отдавать данные в отличном от стандартного HTML формате, благодаря чему им удобно пользоваться при написании собственных приложений. 

Сторонние общедоступные API чаще всего отдают данные в одном из двух форматов: XML или JSON. 

API ВКонтакте — это интерфейс, который позволяет получать информацию из базы данных vk.com с помощью http-запросов к специальному серверу.

Вам не нужно знать в подробностях, как устроена база, из каких таблиц и полей каких типов она состоит — достаточно того, что API-запрос об этом «знает». 

Синтаксис запросов и тип возвращаемых ими данных строго определены на стороне самого сервиса. 

**Методы**
https://vk.com/dev.php?method=first_guide

**Версии** 
https://vk.com/dev/versions


## Самый простой пример API без аутентификации

In [57]:
import geocoder
g = geocoder.arcgis('Москва')
obj = [g.json['lat'], g.json['lng']]
obj

[55.75696000000005, 37.61502000000007]

In [61]:
import requests
r = requests.get('https://api.sunrise-sunset.org/json?lat={}&lng={}'.format(obj[0], obj[1]))
r_dict = r.json()

r_dict['results']

{'sunrise': '1:29:11 AM',
 'sunset': '5:22:47 PM',
 'solar_noon': '9:25:59 AM',
 'day_length': '15:53:36',
 'civil_twilight_begin': '12:42:19 AM',
 'civil_twilight_end': '6:09:40 PM',
 'nautical_twilight_begin': '11:34:13 PM',
 'nautical_twilight_end': '7:17:45 PM',
 'astronomical_twilight_begin': '12:00:01 AM',
 'astronomical_twilight_end': '12:00:01 AM'}

### Регистрация приложения и получение токена для API VK

Альтернативные инструкции

https://devman.org/qna/63/kak-poluchit-token-polzovatelja-dlja-vkontakte/

https://www.youtube.com/watch?v=JJHtltJPAt0&t=367s

1) Нажимаете на кнопку создать приложение

2) Выбираете standalone приложение, указываете название приложения

![](https://sun9-60.userapi.com/c857736/v857736671/14acdc/66pnWpKHRmM.jpg)

3) Переходите в настройки, включаете Open API

4) В поле *адрес сайта* вводите http://localhost

5) В поле базовый домен вводите localhost

![](https://sun9-4.userapi.com/c857736/v857736671/14acee/6qdLYkpdBl4.jpg)

6) Сохраняете изменения

7) Копируете id приложения 

8) В ссылку 

https://oauth.vk.com/authorize?client_id=1&display=page&scope=stats,offline&response_type=token&v=5.103&state=123456



вместо 1 вставьте **ваш** client_id

9) Нажимаете разрешить

10) Сохраняете токен

![](https://sun9-29.userapi.com/c857736/v857736671/14acf8/2c-F9g7w0jA.jpg)


Документация requests

https://requests.readthedocs.io/en/master/

# Использование библиотеки vk_api

https://vk-api.readthedocs.io/en/latest/

In [None]:
!pip install vk_api

In [None]:
import vk_api
with open('credentials.txt', 'r') as c:
    login, password = c.read().strip().split(',')



vk_session = vk_api.VkApi(login, password)
vk_session.auth()

vk = vk_session.get_api()

print(vk.wall.get())

In [None]:
tools = vk_api.VkTools(vk_session)


In [None]:
wall = tools.get_all('wall.get', 100, {'owner_id': 1})
wall

In [50]:

with open('token.txt', 'r') as f:
    token = f.read().strip()




In [61]:
import requests

r = requests.get('https://api.vk.com/method/users.get?user_id=1',  
                 params = {'access_token':token, 'fields': 'education,universities', 'v':'5.52'})

response = r.json()
response


{'response': [{'id': 1,
   'first_name': 'Павел',
   'last_name': 'Дуров',
   'university': 1,
   'university_name': 'СПбГУ',
   'faculty': 0,
   'faculty_name': '',
   'graduation': 2006,
   'universities': [{'id': 1,
     'country': 1,
     'city': 2,
     'name': 'СПбГУ',
     'graduation': 2006}]}]}

## JSON

JSON - текстовый формат данных, следующий за синтаксисом объекта JavaScript, который был популяризирован Дугласом Крокфордом. Несмотря на то, что он очень похож на буквенный синтаксис объекта JavaScript, его можно использовать независимо от JavaScript, и многие среды программирования имеют возможность читать (анализировать) и генерировать JSON.

При работе с модулем requests в нашем репертуаре имеется метод json(), который преобразует объект response в объект класса dict. 

Подробнее: https://python-scripts.com/json

### Протокол HTTP

Взаимодействие между клиентом и сервером происходит с помощью протогкола http


Протокол передачи гипертекста (Hypertext Transfer Protocol - HTTP) - это прикладной протокол для передачи гипертекстовых документов, таких как HTML. 

Он создан для связи между веб-браузерами и веб-серверами, хотя в принципе HTTP может использоваться и для других целей. 

Протокол следует классической клиент-серверной модели, когда клиент открывает соединение для создания запроса, а затем ждет ответа. 

HTTP - это протокол без сохранения состояния, то есть сервер не сохраняет никаких данных (состояние) между двумя парами "запрос-ответ".

### Методы запросов

HTTP методы

Для того, чтобы указать серверу на то, какое действие мы хотим произвести с ресурсом, используется тип HTTP-запроса, который также называется HTTP метод. Существует несколько HTTP методов, которые описывают действия с ресурсами. Наиболее часто используемыми являются GET и POST. 

### GET — получение ресурса

Метод GET запрашивает информацию из указанного источника и не влияет на его содержимое. Запрос доступен для кеширования данных и добавления в закладки. Длина запроса ограничена (макс. длина URL - 2048).

Примечание: Строка запроса (имя/значение) отправляется в URL 

``/login-check.php?argument1=value1&argument2=value2``

### POST — создание ресурса

Метод POST используется для отправки данных, что может оказывать влияние на содержимое ресурса. В отличие от метода GET запросы POST не могут быть кешированы, они не остаются в истории браузера и их нельзя добавить в закладки. Запросы POST не ограничиваются в объеме.

Примечание: Отправляемые данные содержатся в теле запроса. 

https://developer.mozilla.org/ru/docs/Web/HTTP/Methods

https://vk.com/dev/api_limitation_2019

In [43]:
def get_by_query(length=10):
    query = input('Введите поисковый запрос: ')
#     req = requests.get('https://api.vk.com/method/groups.search', 
#             params = {'access_token':token, 
#                       'v':'5.73', 'q':str(query), 'count':10, 'sort':0}).json()['response']
    req = vk.groups.search(q='python')
    groups = [req['items'][i]['id'] for i in range(length)]
    return groups


result = get_by_query()
result

Введите поисковый запрос: python


[42565717,
 38080744,
 1879,
 69108280,
 3183750,
 11899736,
 152061199,
 178774705,
 119334888,
 152111071]

In [68]:

print(result[:5])

[42565717, 38080744, 91313205, 149218373, 142410745]


In [61]:
grps = '42565717, 3183750, 38080744, 91313205, 159101500, 149218373, 152111071, 142410745, 69108280, 119334888, 55702386, 8056712, 11899736, 26227, 178774705, 12299085, 64524646, 51370544, 52104930, 1879, 24666528, 55927709, 2484973, 37392018, 24847633, 44437312, 180288349, 174948538, 62324702, 163683177, 18405086, 82481391, 113913953, 96469126, 149694058, 41069912, 176456268, 43690334, 68362584, 26332, 125409792, 27975363, 125626212, 6683074, 41070201, 54001977, 94809790, 1540917, 138576816, 55578525, 125748921, 117030524, 134263192, 69235007, 172171969, 98444608, 142919317, 41943023, 111958866, 141441685, 132490011, 19771505, 42226144, 109938878, 95629528, 166600799, 96806600, 88752455, 79303962, 73834539, 73929027, 99411738, 174586137, 177962775, 102016896, 35155841, 31056096, 73284245, 136323479, 164946472, 181442365, 161982342, 152376762, 28849068, 72486321, 75836319, 177184688, 44402703, 93497035, 33008056, 85529744, 196767, 71439824, 21036475, 168928557, 153615722, 77958696, 45964980, 85876191, 67210159, 414329, 136522163, 168602618, 83088252, 85364050, 158529332, 89085936, 64973098, 19049399, 85879138, 99644954, 181854671, 48670798, 189828845, 178395684, 161474904, 183184920, 103770831, 105205241, 156325271, 163875533, 72358301, 181634513, 139463015, 106798928, 28184653, 120569845, 75776747, 97159757, 185859318, 127091358, 21403140, 161179205, 104403202, 151364191, 179798747, 163242932, 153764049, 123814392, 145981744, 61224212, 66818424, 78137512, 34256705, 96545411, 183439669, 135015138, 163948932, 140886058, 5519824, 85963264, 76184733, 101849308, 169081344, 2512258, 181513077, 154241977, 96572266, 40700410, 165919087, 105548822, 168419860, 141757687, 96761545, 72413171, 42699073, 74383639, 92411699, 135173221, 92716197, 11499223, 72768613, 16790049, 38028675, 162585822, 161334283, 163790384, 154868113, 117210834, 174978164, 153535490, 68237396, 4137091, 150837225, 31926731, 133190725, 62844165, 184871786, 124595182, 31952125, 185716562, 116802538, 11321702, 93042289, 186805553, 108231352, 183686208, 78568978, 171563013, 162386559, 74011926, 181733460, 101323492, 170490491, 162635326, 123993734, 187488772, 127943098, 26183174, 100499013, 155669350, 77012164, 149991628, 115882415, 76605127, 180903781, 181436014, 100504635, 112509616, 132431530, 172717058, 112775373, 89740557, 48753457, 128342226, 154462513, 46720750, 152466989, 64394857, 107029776, 49141997, 173104996, 116615094, 58625014, 134941881, 113138455, 186379318, 129661723, 149701538, 97069350, 52291665, 108338844, 172615203, 91019212, 37549778, 93136533, 56050751, 183738581, 86165430, 155007091, 163284622, 172192793, 166590552, 90932328, 164817773, 59117522, 134675739, 181234867, 180312175, 32295183, 131624023, 17717368, 63390879, 187230253, 46069336, 100274529, 89302556, 60168166, 83851508, 7419053, 154625644, 187546559, 75976428, 101010711, 186964994, 115203481, 49469333, 104616289, 72966361, 187849555, 187858513, 171921873, 45060945, 187795937, 102365318, 128463967, 41642131, 60638896, 138649612, 173695051, 187650622, 175971447, 188198085, 179219245, 73142892, 186607466, 156252191, 169224066, 172290568, 27624101, 132978823, 167386192, 154820510, 68324837, 28894361, 66165921, 142539478, 58196136, 147248832, 122317273, 109648161, 85214308, 186965212, 172247687, 177006957, 102187544, 184147470, 51234314, 154307158, 171646546, 52960751, 189777274, 2256105, 72948640, 171250161, 178136277, 152235724, 169028334, 55174017, 169805952, 103981181, 134202833, 47447946, 61311951, 72942040, 60209805, 179134725, 154869422, 65058086, 123256340, 187751104, 159217471, 64183493, 28975347, 159796509, 176685063, 52613012, 118730728, 154946560, 188089871, 147467102, 4393955, 165457600, 122950113, 94878326, 186562266, 177271744, 76387101, 165011004, 173529440, 139132356, 178967190, 179022189, 156435633, 8753212, 78753194, 32134907, 78742735, 187222444, 83121880, 117088805, 186684823, 73759833, 99811605, 174962381, 183191514, 185529590, 186880505, 152061199, 77314003, 155205067, 98101337, 125911892, 30065011, 174480454, 46647018, 604813, 187449879, 125776577, 172250917, 78917989, 179075935, 67980731, 126260583, 22414947, 171611659, 70570233, 173984163, 188187850, 119512688, 187270367, 176816771, 104152316, 185552245, 128343945, 1610056, 164622557, 147164886, 182662428, 185260146, 173147195, 154307206, 186479453, 154246288, 86332463, 186067299, 145117054, 186548015, 189159879, 103431185, 177701479, 142327783, 128634475, 182748998, 188777185, 123550069, 82976508, 180203386, 189428438, 150692114, 172836629, 188085978, 91171327, 132239452, 166727974, 185778588, 102883184, 92040863, 189641677, 74815019, 147973214, 154798208, 185747961'

In [45]:
# def string_check(obj):
#     if isinstance(obj, str):
#         return obj
#     elif  isinstance(obj, list):
#         return ', '.join((str(x) for x in obj))
import requests
obj = ', '.join((str(x) for x in result[:5]))

req = requests.get('https://api.vk.com/method/groups.getById', 
        params = {'access_token':token, 
                  'v':'5.73', 'fields': 'members_count,activity', 'group_ids': obj})

req.json()

NameError: name 'token' is not defined

In [48]:
obj = ', '.join((str(x) for x in result[:5]))
req = vk.groups.getById(group_ids = obj, fields = 'members_count,activity')
req

[{'id': 42565717,
  'name': 'Python',
  'screen_name': 'club42565717',
  'is_closed': 0,
  'type': 'group',
  'is_admin': 0,
  'is_member': 0,
  'is_advertiser': 0,
  'members_count': 41560,
  'activity': 'Открытая группа',
  'photo_50': 'https://sun9-59.userapi.com/c845524/v845524906/1a71c2/A2r_4JtmiLQ.jpg?ava=1',
  'photo_100': 'https://sun9-58.userapi.com/c845524/v845524906/1a71c1/2fBtsS0k8XY.jpg?ava=1',
  'photo_200': 'https://sun9-50.userapi.com/c845524/v845524906/1a71c0/Kfo-eQIn0DU.jpg?ava=1'},
 {'id': 38080744,
  'name': 'Python community',
  'screen_name': 'python_community',
  'is_closed': 0,
  'type': 'group',
  'is_admin': 0,
  'is_member': 0,
  'is_advertiser': 0,
  'members_count': 22714,
  'activity': 'Открытая группа',
  'photo_50': 'https://sun9-13.userapi.com/c639622/v639622351/3ef14/2cqSGd8Ns8w.jpg?ava=1',
  'photo_100': 'https://sun9-26.userapi.com/c639622/v639622351/3ef13/_ugJQpnH-5s.jpg?ava=1',
  'photo_200': 'https://sun9-23.userapi.com/c639622/v639622351/3ef11/xM

In [49]:
def get_info(elem):
    
    groupId = elem['id']
    name = elem['name']
    members_count = elem['members_count']
    activity = elem['activity']
    
    return (groupId, name, members_count, activity)
    
# data = list(zip(*map(get_info, response)))

data = list(zip(*map(get_info, req)))

data

[(42565717, 38080744, 1879, 69108280, 3183750),
 ('Python',
  'Python community',
  "Monty Python's Flying Club (Монти Пайтон)",
  'Python/Django | Pirsipy',
  'Веб программист - PHP, JS, Python, Java, HTML 5'),
 (41560, 22714, 9718, 16321, 124948),
 ('Открытая группа',
  'Открытая группа',
  'Открытая группа',
  'Программное обеспечение',
  'Программирование')]

In [51]:
test = list(map(get_info, req))
test

[(42565717, 'Python', 41560, 'Открытая группа'),
 (38080744, 'Python community', 22714, 'Открытая группа'),
 (1879, "Monty Python's Flying Club (Монти Пайтон)", 9718, 'Открытая группа'),
 (69108280, 'Python/Django | Pirsipy', 16321, 'Программное обеспечение'),
 (3183750,
  'Веб программист - PHP, JS, Python, Java, HTML 5',
  124948,
  'Программирование')]

In [52]:
import pandas as pd
tf = pd.DataFrame(test, columns = ["groupId", "name", "members_count", "activity"])
tf

Unnamed: 0,groupId,name,members_count,activity
0,42565717,Python,41560,Открытая группа
1,38080744,Python community,22714,Открытая группа
2,1879,Monty Python's Flying Club (Монти Пайтон),9718,Открытая группа
3,69108280,Python/Django | Pirsipy,16321,Программное обеспечение
4,3183750,"Веб программист - PHP, JS, Python, Java, HTML 5",124948,Программирование


## Достанем пользователей группы

In [None]:
group_members = tools.get_all('groups.getMembers', 100, {'group_id': 13366})
group_members

In [14]:
len(group_members['items'])

378016

## Давайте найдем пересечение подписчиков для групп 

In [28]:
first_group_id = ''
second_group_id = '' 

resolved = vk.utils.resolveScreenName(screen_name='durov')


{'object_id': 1, 'type': 'user'}

In [34]:
def get_screen_name(url):
    return url.split('/')[-1]

first_group_id, second_group_id = (vk.utils.resolveScreenName(screen_name=get_screen_name(x))['object_id'] 
                                   for x in ('https://vk.com/open_sourcecode', 'https://vk.com/club42565717'))


print(first_group_id, second_group_id)


142410745 42565717


In [36]:
def intersection(first, second):
    first_members = tools.get_all('groups.getMembers', 100, {'group_id': first})['items']
    second_members = tools.get_all('groups.getMembers', 100, {'group_id': second})['items']
    return set(first_members).intersection(set(second_members))

common_members = intersection(first_group_id, second_group_id)
len(common_members)

6853

In [75]:
#https://vk.com/dev/groups.getMembers
req = requests.get('https://api.vk.com/method/groups.getMembers', 
        params = {'access_token':token, 
                  'v':'5.73', 'fields': 'sex, bdate, city', 'group_id': 174948538, 'offset':1000})

req.json()


{'response': {'count': 2039,
  'items': [{'id': 443710552,
    'first_name': 'Лена',
    'last_name': 'Квасова',
    'deactivated': 'banned',
    'sex': 1},
   {'id': 443892000,
    'first_name': 'Иван',
    'last_name': 'Лазутин',
    'sex': 2,
    'bdate': '6.1.1984'},
   {'id': 444011581,
    'first_name': 'Ирина',
    'last_name': 'Петрова',
    'sex': 1,
    'bdate': '1.7.1995',
    'city': {'id': 49, 'title': 'Екатеринбург'}},
   {'id': 444174659,
    'first_name': 'Дмитрий',
    'last_name': 'Александров',
    'deactivated': 'banned',
    'sex': 2},
   {'id': 444193913,
    'first_name': 'Ксюша',
    'last_name': 'Ряшко',
    'sex': 1,
    'bdate': '7.9.1997',
    'city': {'id': 2, 'title': 'Санкт-Петербург'}},
   {'id': 444286496,
    'first_name': 'Анастасия',
    'last_name': 'Панасюк',
    'sex': 1,
    'bdate': '7.6.1995',
    'city': {'id': 37, 'title': 'Владивосток'}},
   {'id': 444359333,
    'first_name': 'Ольга',
    'last_name': 'Странникова',
    'sex': 1,
    'bdate

In [64]:
len(req.json()['response']['items'])

1000

In [83]:
df = pd.DataFrame.from_records(items)
df['city'] = list(map(get_title, items))
df

Unnamed: 0,id,first_name,last_name,sex,bdate,city,deactivated
0,130712,Александр,Казанцев,2,6.8,Москва,
1,206026,Алексей,Колесников,2,12.3.1986,Санкт-Петербург,
2,418131,Серёжа,Горбачёв,2,3.12,Москва,
3,455447,Сергей,Ситников,2,6.4.1980,Москва,
4,523329,Иван,Либеров,2,1.4,Москва,
...,...,...,...,...,...,...,...
2034,581845358,Светлана,Романова,1,,,banned
2035,581926201,Александр,Киреев,2,20.2.1998,Санкт-Петербург,
2036,582027147,Александр,Васильев,2,,Иркутск,
2037,582256370,Luis,Perez,2,7.4.1994,,


## Немного про параметры

In [None]:
import pandas as pd
import requests
from collections import defaultdict
from math import ceil



class Parser:
    """Для работы модуля необходимо импортировать библиотеку requests и math"""
    
    
    def __init__(self, regionCode, link = ''):
        self.dict = defaultdict(list)
        self.regionCode = regionCode
        if link:
            requests.get(link).json()
            
        r = requests.get(f'http://openngopublicapi.h5.crftr.net/v1/org/?page=1&regionCode={regionCode}').json()
        try:
            self.iters = ceil(int(r['total'])/int(r['count']))
            print('По запросу получено {} страниц'.format(self.iters))
        except Exception as e:
            print(e)

    
    def getData(self, pageNum = '', **kwargs):
        """Получение данных в виде словаря.
        pageNum - отвечает за количество страниц, которые будут распарсены
        также можно передать словарь"""
        if not pageNum:
            pageNum = self.iters
        else:
            pageNum = pageNum
        for page in range(1, pageNum):
            try:
                if not kwargs:
                    r = requests.get('http://openngopublicapi.h5.crftr.net/v1/org/?page={}&regionCode={}'
                                     .format(page, self.regionCode)).json()
                else:
                    r = requests.get('http://openngopublicapi.h5.crftr.net/v1/org/?page={}&regionCode={}'
                                     .format(page, self.regionCode),  params = kwargs).json()                
                items = r['items']
                for item in items:
                    for key in item:
                        self.dict[key].append(item[key]) #клянусь, запись  k,v почему то не работала
            except Exception as e:
                print('page {} not fetched because of :'.format(page), e)
                pass
            
        return self.dict
        
    
d = Parser(64)
dct = d.getData(3)
dct

Библиотеки для работы с API  Vk

https://vk-api.readthedocs.io/en/latest/

https://github.com/python273/vk_api

https://pypi.org/project/vk-api/

https://habr.com/ru/post/319178/