In [12]:
import requests

from pprint import pprint

## 9.2 Библиотека requests
Сначала разберемся, как получить информацию с внешнего сервиса. В стандартной библиотеке есть модуль `urllib2`, который может справиться с этой задачей. Однако большинство разработчиков используют стороннюю библиотеку `requests`, потому что в ней лучше реализованы большинство методов и код получается проще. Перед началом работы библиотеку потребуется установить с помощью вашего пакетного менеджера, например, с помощью следующей команды в консоли.

```
python -m pip install requests
```
Далее мы импортируем библиотеку и отправим запрос к сервису с помощью метода `GET` к сервису с курсами валют:

In [3]:
import requests  
response = requests.get('https://www.cbr-xml-daily.ru/daily_json.js')  

In [4]:
response

<Response [200]>

In [6]:
response.status_code

200

### Задание 1 - Первый запрос
Допустим, вы уже импортировали модуль `requests` в ваш код. Какая команда сделает `GET` запрос к сайту https://www.cbr-xml-daily.ru/daily.xml и положит результат в переменную response?

In [7]:
response = requests.get('https://www.cbr-xml-daily.ru/daily.xml')  

In [8]:
response

<Response [200]>

## 9.3 Читаем результат
Мы сделали запрос и получили ответ. Давайте теперь посмотрим, как считывать текст. 

Адрес, по которому мы обращались, возвращает результат в `json` формате. Эти данные уже лежат в атрибуте `text` в полученном ответе response:

In [9]:
import requests    
response = requests.get('https://www.cbr-xml-daily.ru/daily_json.js')    
print(response.text)  

{
    "Date": "2020-10-23T11:30:00+03:00",
    "PreviousDate": "2020-10-22T11:30:00+03:00",
    "PreviousURL": "\/\/www.cbr-xml-daily.ru\/archive\/2020\/10\/22\/daily_json.js",
    "Timestamp": "2020-10-22T23:00:00+03:00",
    "Valute": {
        "AUD": {
            "ID": "R01010",
            "NumCode": "036",
            "CharCode": "AUD",
            "Nominal": 1,
            "Name": "Австралийский доллар",
            "Value": 54.8122,
            "Previous": 54.5388
        },
        "AZN": {
            "ID": "R01020A",
            "NumCode": "944",
            "CharCode": "AZN",
            "Nominal": 1,
            "Name": "Азербайджанский манат",
            "Value": 45.3684,
            "Previous": 45.3397
        },
        "GBP": {
            "ID": "R01035",
            "NumCode": "826",
            "CharCode": "GBP",
            "Nominal": 1,
            "Name": "Фунт стерлингов Соединенного королевства",
            "Value": 101.2226,
            "Previous": 100.5116
 

Вы можете посмотреть на полный текст, повторив запрос или [на этой странице](https://www.cbr-xml-daily.ru/daily_json.js) в вашем браузере.

Сейчас текст хранится просто в строковой переменной. Далее мы можем превратить эту строку в словарь. Сделать это можно с помощью `JSON`-парсера `python`, либо воспользовавшись методом `json`, который уже встроен в объект ответа `response`:

In [13]:
currencies = response.json()  
pprint(currencies)  

{'Date': '2020-10-23T11:30:00+03:00',
 'PreviousDate': '2020-10-22T11:30:00+03:00',
 'PreviousURL': '//www.cbr-xml-daily.ru/archive/2020/10/22/daily_json.js',
 'Timestamp': '2020-10-22T23:00:00+03:00',
 'Valute': {'AMD': {'CharCode': 'AMD',
                    'ID': 'R01060',
                    'Name': 'Армянских драмов',
                    'Nominal': 100,
                    'NumCode': '051',
                    'Previous': 15.6157,
                    'Value': 15.5917},
            'AUD': {'CharCode': 'AUD',
                    'ID': 'R01010',
                    'Name': 'Австралийский доллар',
                    'Nominal': 1,
                    'NumCode': '036',
                    'Previous': 54.5388,
                    'Value': 54.8122},
            'AZN': {'CharCode': 'AZN',
                    'ID': 'R01020A',
                    'Name': 'Азербайджанский манат',
                    'Nominal': 1,
                    'NumCode': '944',
                    'Previous': 45.3397,


In [None]:
Теперь данные лежат в словаре, и мы можем легко получать необходимые нам значения:

In [14]:
currencies['Valute']['UAH']  

{'ID': 'R01720',
 'NumCode': '980',
 'CharCode': 'UAH',
 'Nominal': 10,
 'Name': 'Украинских гривен',
 'Value': 27.2793,
 'Previous': 27.2699}

### Задание 1
Повторите запросы, описанные в этой части, на своём компьютере. Что выведет на экран следующий код?
```python
print(currencies['Valute']['CZK']['Name'])
```

In [15]:
print(currencies['Valute']['CZK']['Name'])

Чешских крон


## 9.4 Оформляем функцию
В завершение давайте оформим наши вычисления в отдельную функцию, которой будет удобно пользоваться. На вход она должна принимать два параметра:

1. Название валюты `currency`. Например, ***'EUR'*** или ***'USD'***.

2. Формат ответа `format`. При значении ***'full'*** будем отдавать все, что знаем о валюте. Например, для currency = 'USD':

>{'CharCode': 'USD',  
>   'ID': 'R01235',  
>   'Name': 'Доллар США',  
>   'Nominal': 1,  
>   'NumCode': '840',  
>   'Previous': 68.2505,  
>   'Value': 69.0286}  

А при значении format = ***'value'*** только значение ключа `'Value'`, т. е. курс: ***69.0286***.

Оформим наши требования в коде:

In [21]:
def exchange_rates(currency, format='full'):    
    url = 'https://www.cbr-xml-daily.ru/daily_json.js'  
    response = requests.get(url).json()['Valute']    
    data = response[currency]     
    if format == 'full':    
        return data      
    elif format == 'value':    
        return data['Value']    

### Задание 1
Напишите функцию `currency_name`, которая по ***ID*** валюты возвращает ее название на русском языке.

In [71]:
def currency_name(currency_id):
    url = 'https://www.cbr-xml-daily.ru/daily_json.js'
    response = requests.get(url).json()['Valute']
    
    for currency in response:
        if response[currency]['ID'] == currency_id:
            return response[currency]['Name']

In [72]:
currency_name('R01700J')

'Турецких лир'

## 9.5 HTML-страницы
### Постановка задачи
Довольно часто приходится добывать информацию не из удобно форматированного json-файла, а прямо с HTML-страниц. Получить содержимое страницы в большинстве случаев несложно, труднее извлечь из HTML-кода нужную информацию. В качестве примера мы рассмотрим страницу новости, из которой будем доставать полезную информацию:   
 1. заголовок страницы;   
 2. дату публикации;  
 3. текст публикации;  
 4. ссылки на странице.
 
### Получаем данные
Получить `html` страницу можно так же, как мы получали до этого `json`: используем библиотеку `requests` и метод `GET`:  

```python
import requests  
  
url = 'https://nplus1.ru/news/2019/06/04/slothbot'   
  
response = requests.get(url)  
  
# Убедимся, что мы успешно получили ответ     
print(response.status_code)    
# => 200   
  
# Выведем полученные данные    
print(response.text)   
```

In [73]:
url = 'https://nplus1.ru/news/2019/06/04/slothbot'   

response = requests.get(url)  

# Убедимся, что мы успешно получили ответ     
print(response.status_code)  

200


In [74]:
# Выведем полученные данные    
print(response.text)   

<!doctype html>
<html class="no-js bg-fixed _no-bg" style="background-image:url(https://nplus1.ru/images/2019/06/04/b32b62189fb87cce895e229e1d6d27b4.jpeg)" lang="">
<head>
    
    <meta charset="utf-8">
    <meta http-equiv="x-ua-compatible" content="ie=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
        <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">
            
    <link rel="canonical" href="https://nplus1.ru/news/2019/06/04/slothbot" />

        <title>Робота-ленивца научили лазать по паутине из тросов</title>

    	    <meta itemprop="datePublished" content="2019-06-04"/>
	
	    <meta name="mediator_author" content="Григорий Копиев"/> 
	
        <!-- amp page -->
    <link rel="amphtml" href="https://nplus1.ru/news/2019/06/04/slothbot/amp">
    

        <!-- for Google -->
        <meta name="description" content="Он сам добывает энергию с помощью солнечных панел

Мы получили большую строку с текстом в формате `html`, который используется для визуальной разметки. Это позволяет делать информацию более наглядной для людей, но в отличие от `json`, мы не можем просто преобразовать его напрямую в словарь. Далее мы посмотрим, как извлекать информацию из подобных страниц

## 9.6 Основы HTML
Прежде чем перейти к поиску информации в `html`, давайте вспомним, что он из себя представляет.

`HTML` – формат разметки страниц, созданный специально для интернета. Он позволяет разбивать страницу на блоки: мы размечаем, что окажется в боковой колонке, а что – посередине  и т.д.  Также он используется для описания стилей отображения: например, что будет отображаться как заголовок с большим текстом, а что – как обычный текст.

`HTML` является близким родственником `XML`. Разметка делается с помощью так называемых тэгов, которые помещаются в угловые скобки, и сами, в свою очередь, являются как бы скобками для текста внутри.

```html
<h2> Это заголовок </h2>  
<div> А это обычный текст </div>  
```
У корректной `html` страницы есть заголовок `(head)` и тело страницы `(body)`. В заголовке заключается техническая информация, подключаются скрипты и стили. В теле находится текст и данные, которые непосредственно  отображаются на странице в браузере. 

Разметка небольшой страницы выглядит примерно так:
```html
<!DOCTYPE html>  
<html lang="ru">  
    <header>  
        <title>Название страницы</title>  
        <meta charset="UTF-8">  
    </header>  
  
    <body>  
        <h1>Заголовок страницы</h1>  
        <p>Какой-то текст</p>  
    </body>  
</html>  
```
Вы можете сохранить это в текстовый файл с расширением .html и открыть в браузере.

Тут стоит заметить, что тэги образуют иерархическую структуру, т.е. одни тэги расположены внутри других. В примере выше тэг `<p>` находится внутри тэга `<body>`

Кроме того, у тэгов могут быть атрибуты, они пишутся внутри открывающегося тэга. Самые популярные атрибуты – это `class` и `id`.
```html
<h1 id="big-title">Заголовок страницы</h1>  
<p class="red-back">Какой-то текст</p>  
```
Полное описание возможностей `html` находиться вне рамок этого курса. Вы можете подробнее почитать о нём [здесь](http://htmlbook.ru/html). 

К счастью, нам и не нужно как-то подробно знать `html`, чтобы забирать информацию. Достаточно понимать, что:

- есть тэги с разными именами;
- у тэгов бывают атрибуты, вроде class и id;
- тэги образуют иерархическую структуру, то есть одни тэги вложены в другие.

###= 9.7 Библиотека BeautifulSoup
Для поиска данных на странице воспользуемся библиотекой `BeautifulSoup`. Она позволяет по названию тэгов и их атрибутов получать содержащийся в них текст.

Она не является частью стандартной библиотеки, поэтому для начала её нужно установить с помощью пакетного менеджера, например, введя в консоли:

```
pip install beautifulsoup4  
```
Теперь мы можем получать данные из страницы. Давайте получим `title` (это строка, отображающая в браузерах на закладках)

```python
# Импортируем наши библиотеки    
from bs4 import BeautifulSoup    
import requests    
    
# Получаем данные, как и ранее    
url = 'https://nplus1.ru/news/2019/06/04/slothbot'   
response = requests.get(url)    
    
# Теперь создадим объект BeautifulSoup, указывая html парсер    
page = BeautifulSoup(response.text, 'html.parser')    
    
# Всё готово, чтобы получать данные из страницы    
# Для начала получим title, отображающийся на закладках браузера    
print(page.title)  
# => <title>Робота-ленивца научили лазать по паутине из тросов</title>  
    
# Мы получили тэг. Чтобы достать из него текст, вызовем атрибут text    
page.title.text    
# => 'Робота-ленивца научили лазать по паутине из тросов'  
```

In [99]:
# Импортируем наши библиотеки    
from bs4 import BeautifulSoup    
import requests    

# Получаем данные, как и ранее    
url = 'https://nplus1.ru/news/2019/06/04/slothbot'   
response = requests.get(url)    

# Теперь создадим объект BeautifulSoup, указывая html парсер    
page = BeautifulSoup(response.text, 'html.parser')    

# Всё готово, чтобы получать данные из страницы    
# Для начала получим title, отображающийся на закладках браузера    
print(page.title)  
# => <title>Робота-ленивца научили лазать по паутине из тросов</title>  

# Мы получили тэг. Чтобы достать из него текст, вызовем атрибут text    
page.title.text    

<title>Робота-ленивца научили лазать по паутине из тросов</title>


'Робота-ленивца научили лазать по паутине из тросов'

## 9.8 Данные со страницы
### Читаем заголовок

Мы получили данные из `title`, но как нам забрать текст с самой страницы? Мы можем сделать это, запросив содержимое определённых тэгов. 

Пусть мы знаем, что заголовок статьи находится в тэге `h1`. Тогда мы можем получить его текст с помощью метода `find`
```python
print(page.find('h1').text)   
# => Робота-ленивца научили лазать по паутине из тросов  
```
Как узнать, какой именно тэг нужен? Проще всего это сделать с помощью "инструментов разработчика", которые есть во всех современных браузерах. Открыть их можно двумя способами:
1. Можно нажать на желаемый элемент правой кнопкой мыши и выбрать `"Inspect"` из выпадающего списка. Откроется панель, где мы можем понять, что это за элемент

2.  Нажать горячие клавиши (`ctrl-shift-i` в chrome или `ctrl-shift-c` в firefox), которые откроют эту же панель и дальше найти элемент.

Воспользовавшись этим подходом, давайте получим время написания статьи. Смотрим, в каком она тэге

Видим, что это тэг time. Получим данные.

```python
print(page.find('time').text)
```

In [100]:
print(page.find('time').text)


18:27
04 Июнь 2019



### Задание 2 - Автоматический сбор заголовков
Напишите функцию `wiki_header`, которая по адресу страницы возвращает заголовок для статей на википедии
```python
wiki_header('https://en.wikipedia.org/wiki/Operating_system')
```
```
# => 'Operating system'
```

In [101]:
def wiki_header(page_url):
    response = requests.get(page_url)
    page = BeautifulSoup(response.text, 'html.parser')
    return page.find('h1').text

In [102]:
wiki_header('https://en.wikipedia.org/wiki/Operating_system')

'Operating system'

## 9.9 Больше данных
Мы рассмотрели базовый поиск конкретного элемента. Могут встречаться другие вариации:

- когда нам нужно получить много похожих элементов; 
- когда тэг атрибута неуникальный, тогда нам нужно использовать атрибуты (id, class), либо использовать вложенность.

Посмотрим на практике, что делать в случае, когда тэг элемента неуникальный. Пусть мы хотим получить сам текст статьи. Мы видим, что он находится в тэге `div`.  
Тэги `div` очень распространённые, их много на странице. Если мы просто используем `find`, то получим первый попавшийся, но это не то, что нам надо.  


In [103]:
print(page.find('div').text)  

Функционирует при финансовой поддержке Федерального агентства по печати и массовым коммуникациям (Роспечать)


Тут мы можем заметить, что у искомого текста есть свой класс `GeneralMaterial-body`. Воспользуемся этим:  в метод `find` можно передать аргумент `class_`

In [105]:
print(page.find('div', class_='body js-mediator-article').text) 







Allison Carter, Georgia Tech





Американские инженеры разработали робота-ленивца, способного лазать по тросам и перемещаться с одного троса на другой. Благодаря относительно малому потреблению энергии и использованию солнечных панелей подобного робота можно практически неограниченное время использовать для наблюдений на деревьях в лесу, рассказывают авторы статьи, представленной на конференции ICRA 2019.
Создание роботов, способных лазать по тросам — важная технологическая задача, наработки из которой потенциально применимы во многих областях. К примеру, в 2016 году в России создали робота для проверки высоковольтных линий электропередачи. Дрон спускает такого робота на грозозащитный трос, после чего тот самостоятельно перемещается вдоль основных проводов и осматривает их. Кроме того, потенциально таких роботов можно применять для исследований в густых лесах, в которых ветки соседних деревьев соприкасаются.
Инженеры из Технологического института Джорджии под руководством Магнус

Отлично, сработало. Аналогично работает и с id, мы могли бы написать что-то вроде `page.find('div', id='maincontent')`

### Задание 1. Поиск элемента
У вас есть переменная `page`, в которой хранится содержимое html-страницы. На странице есть элемент в тэге `span`, у которого атрибут `id` равен `'target'`. Напишите строчку кода, которая присвоит текст этого элемента переменной `value`.

Запишите ваш код в одну строку без пробелов. Используйте апострофы для передачи параметров, содержащих значение тэга и его `id`.

In [108]:
value=page.find('span',id='target').text

## 9.10 Сбор нескольких элементов
### Собираем все ссылки на странице
Рассмотрим случай, когда нам нужно сразу много элементов. Пусть мы хотим получить название всех ссылок на странице в википедии про языки программирования.

Для ссылок существует тэг `<a></a>`.  Давайте попробуем использовать `find`  
```python
url = 'https://en.wikipedia.org/wiki/List_of_programming_languages'  
  
response = requests.get(url)  
page = BeautifulSoup(response.text, 'html.parser')  
page.find('a')  
```

In [109]:
url = 'https://en.wikipedia.org/wiki/List_of_programming_languages'  

response = requests.get(url)  
page = BeautifulSoup(response.text, 'html.parser')  
page.find('a')  

<a id="top"></a>

Что-то пошло не так, и мы получили только одну ссылку, хотя на странице их явно больше. Это происходит, потому что метод `find` возвращает только первый подходящий элемент. Если нам надо их больше, нужно воспользоваться методом `find_all`

In [110]:
links = page.find_all('a')  
# Посмотрим, сколько всего мы получили  
print(len(links))

926


In [111]:
# Посмотрим на некоторые из ссылок  
print([link.text for link in links[500:510]])  

['Oxygene', 'Oz', 'edit', 'P', 'P4', 'P′′', 'ParaSail (programming language)', 'PARI/GP', 'Pascal', 'Pascal Script']


**Ещё одна полезная вещь:**  последовательный поиск, т.е. мы можем найти сначала один элемент, а потом сделать внутри него второй поиск. Давайте выведем названия всех ссылок для языков программирования, которые начинаются на литеру "A".

In [112]:
# Получаем все элементы с тегом 'div' и классом 'div-col'  
all_blocks = page.find_all('div', class_='div-col')  
  
# Выбираем первый по счету блок  
first_block = all_blocks[0]  
# Берём оттуда ссылки (ограничимся первыми десятью)
links = first_block.find_all('a')
print([link.text for link in links[:10]])

['A.NET', 'A-0 System', 'A+', 'ABAP', 'ABC', 'ABC ALGOL', 'ACC', 'Accent', 'Ace DASL (Distributed Application Specification Language)', 'Action!']


В заключение заметим, что `BeautifulSoup` – достаточно мощная библиотека. Мы рассмотрели базовые возможности, но полный список гораздо шире. С ним можно ознакомиться в [официальной документации](https://www.crummy.com/software/BeautifulSoup/bs4/doc/).

### Задание 1 - Актёры
Напишите функцию `get_actors`, которая по ссылке на страницу фильма на кинопоиске возвращает список актёров из колонки справа

### NB: Если делать запросы слишком часто, Кинопоиск начинает выдавать капчу, поэтому старайтесь при отладке не делать больше одного запроса в секунду.

## <span style="color:red">ВНИМАНИЕ! В настоящий момент времени на сайте Кинопоиска изменилась стукртура контента и применяется более интеллектуальная капча. Задание находится на стадии доработки и не обязательно для выполнения.</span>




## 9.11 HTML-таблицы
### Постановка задачи
При работе с web-страницами было бы здорово получать содержимое  таблиц в виде датафрейма. Рассмотрим страницу Центрального банка РФ cbr.ru. Наша задача будет состоять в том, чтобы получить одну из таблиц виджетов в виде датафрейма. Например, таблицу цен на драгоценные металлы.

Метод `read_html` из pandas умеет автоматически находить на HTML-странице таблицы и возвращать их списком из датафреймов:

In [113]:
import pandas as pd  
url = 'https://www.cbr.ru/key-indicators/'  
# Таблица с драгметаллами оказалась второй по счёту  
pd.read_html(url)[1]  

Unnamed: 0,0,1
0,рублей за грамм,24.10.2020
1,Золото Au,"4 697,13"
2,Серебро Ag,6087
3,Платина Pt,"2 192,95"
4,Палладий Pd,"5 853,59"


Если этого не происходит, но вы уверены в том, что порядок таблиц на странице неизменен, то можно вручную найти нужную таблицу на странице. Этому случаю посвящены следующие шаги.

### Задание 1 - Курсы валют через read_html
Попробуйте запустить pandas для заданного выше url. Какая строчка вернёт таблицу с курсами валют?

In [119]:
pd.read_html(url)[0] 

Unnamed: 0,0,1,2
0,валюта,23.10.2020,24.10.2020
1,Доллар США USD,770809,764667
2,Евро EUR,913563,904142


## Поиск таблицы с помощью BeautifulSoup
Более надёжным решением является сначала получить только текст таблицы и передавать в `pandas` только её. Так же, как и в предыдущем разделе, используем `requests` и `BeautifulSoup`, чтобы получить данные со страницы.

А теперь — внимание! В случае работы с сайтом Центробанка нам нужно будет учесть ещё один нюанс. С недавнего времени администраторы стали блокировать обращения к сайту, поступающие не от «живых» пользователей, а от компьютерных программ (в том числе от той, которую мы собираемся написать прямо сейчас). Есть ли шанс в таких условиях всё-таки получить данные, не открывая страницу в браузере?

Безусловно, это возможно. Безвыходных положений вообще не бывает, особенно в программировании! Один из способов справиться с ситуацией — «притвориться» браузером :).

Каждый запрос, отправляемый с помощью команды get, имеет заголовок. Если заголовок не задан явно, то он создаётся автоматически, и туда добавляется информация в том числе о том, кто является субъектом (или источником) запроса — человек или программа. Чтобы «притвориться» браузером, нам просто нужно вручную дописать нужные сведения в этот заголовок. Подробнее о таком подходе можно почитать в [этой статье](https://habr.com/ru/company/ods/blog/346632/).

Итоговый вариант кода после добавления заголовка должен выглядеть так:
```python
from bs4 import BeautifulSoup  
import pandas as pd  
import requests  
  
url = 'https://www.cbr.ru/key-indicators/'
soup = BeautifulSoup(requests.get(url, headers={'User-Agent': 'Mozilla/5.0'}).text, 'html.parser')  
```

In [120]:
from bs4 import BeautifulSoup  
import pandas as pd  
import requests  

url = 'https://www.cbr.ru/key-indicators/'
soup = BeautifulSoup(requests.get(url, headers={'User-Agent': 'Mozilla/5.0'}).text, 'html.parser')

Далее нажимаем 'Исследовать элемент' в меню браузера на виджете с драгоценными металлами:

![](https://lms.skillfactory.ru/assets/courseware/v1/a2e35fa184cf7d6bbf2aac9a70f5fa71/asset-v1:Skillfactory+DST-12+11MAR2020+type@asset+block/metals_2.png)

Видим, что виджету соответствует следующая разметка:

![](https://lms.skillfactory.ru/assets/courseware/v1/1ed8cdbe78a85aa99b12651bf3044a89/asset-v1:Skillfactory+DST-12+11MAR2020+type@asset+block/metals_3.png)

Нам необходимо добраться до кода таблицы, который начинается с тэга <table>. Таблиц на странице много, поэтому указываем путь к таблице виджета драгоценных металлов применяя знания полученные ранее:

In [122]:
all_blocks = soup.find_all('div', class_='key-indicator_content offset-md-2')
# Данные таблицы с драгметаллами находятся во втором блоке
data = all_blocks[1].find('table') 

In [128]:
pd.read_html(str(data))[0]

Unnamed: 0,0,1
0,рублей за грамм,24.10.2020
1,Золото Au,"4 697,13"
2,Серебро Ag,6087
3,Платина Pt,"2 192,95"
4,Палладий Pd,"5 853,59"


### Задание 2 - Рейтинг банков
Напишите программу, которая забирает данные из таблицы рейтинга банков с https://www.banki.ru/banks/ratings/, делает из него датафрейм и сохраняет его в переменую df.

In [None]:
url = 'https://www.banki.ru/banks/ratings/'

In [None]:
# response = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'}).text
# page = BeautifulSoup(response, 'html.parser')

# page

In [135]:
df = pd.read_html('https://www.banki.ru/banks/ratings/')[0]

## 9.12 Введение в API
В предыдущих разделах мы собирали полезную информацию с различных сайтов с выделением правильных тэгов – это довольно трудоёмкая задача. Кроме того, подобные программы могут ломаться в случаях, когда меняется дизайн сайта, его разметка, или владельцы сайтов защищаются от ботов капчей. 

К счастью, многие крупные сайты предоставляют доступ к так называемым API (application programming interface, программный интерфейс приложения). Это специальные разделы сайта, где информацию можно получать без разметки, формат запросов – ответов зафиксирован, и они созданы специально, чтобы облегчить жизнь сторонним разработчикам.

Мы уже видели, как https://www.cbr-xml-daily.ru возвращает данные о валютах в json-формате, и это может считаться API. В этом разделе мы на примере ВКонтакте посмотрим особенности API, характерные для более крупных сайтов.

### Сервисный токен
Для того чтобы начать работать с API ВКонтакте, необходимо получить сервисный токен (ключ) авторизации. 

Авторизация применяется практически во всех API, чтобы отдавать данные только их владельцу или контролировать количество запросов в единицу времени. Сервисный токен для нашей задачи создается вместе с новым приложением. Приложение мы делать, конечно, не будем. Оно нужно только для получения токена, чтобы сделать необходимые выгрузки.

Зайдите на страницу https://vk.com/editapp?act=create, чтобы создать приложение (вы должны быть авторизованы ВКонтакте). Дайте приложению любое название и оставьте значение платформы "Standalone-приложение":

После подтверждения создания приложения в приложении ВК или по СМС зайдите в настройки:



### Задание 1 - Создание токена
Создайте свой токен для доступа к API вконтакте. Для ответа в этом задании введите первые его 10 символов.

In [10]:
token = '63fbecbb63fbecbb63fbecbb33638f7e1d663fb63fbecbb3c6f9fb9664c2428f44fef5e'
token[:10]

'63fbecbb63'

## 9.13 Запрос к API
Для примера работы с API мы будем получать данные для статистических отчетов произвольной группы, например:

- соотношение мужчин и женщин в группе;
- статистика географии пользователей;
- другие данные для аналитики групп конкурентов.
Сначала рассмотрим работу API на простом примере, на основе которого работают многие системы. 

Перейдите по следующей ссылке в браузере, подставив вместо слова "TOKEN" сервисный токен из прошлого шага:

https://api.vk.com/method/users.get?user_id=1&v=5.95&access_token=TOKEN

Результат:

[запрос 1](https://api.vk.com/method/users.get?user_id=1&v=5.95&access_token=63fbecbb63fbecbb63fbecbb33638f7e1d663fb63fbecbb3c6f9fb9664c2428f44fef5e)

{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","is_closed":false,"can_access_closed":true}]}

Сейчас мы сделали GET-запрос к API ВКонтакте, который состоит из следующих частей:

- `https://api.vk.com/method` — домен и URL запроса API: обычно не меняется; 
- `users.get` — название метода, который отдает определенный отчет; нашем случае это метод для получения информации о пользователе; 
- `user_id` и `v` — параметры запроса: идентификатор пользователя, о котором хотим получить информацию, и номер версии API; 
- `token`, который выдается только пользователям, имеющим право просматривать определенные данные, например, показания счетчиков Яндекс, метрики вашего проекта: на все остальные запросы без корректного токена система отвечает отказом.

Если мы посмотрим [документацию метода users.get](https://vk.com/dev/users.get), то увидим, что в ней описано множество других параметров, которые можно получить о пользователе: дата рождения, пол, родной город и другие.

Словом, всё то, что мы видим на странице пользователя в интерфейсе или приложении ВКонтакте (конечно, если пользователь их указал). Добавим к запросу дату рождения и пол (согласно документации, эти параметры надо перечислять в поле fields):

`https://api.vk.com/method/users.get?user_id=1&v=5.95&fields=sex,bdate&access_token=TOKEN`
Результат:

[запрос 2](https://api.vk.com/method/users.get?user_id=1&v=5.95&fields=sex,bdate&access_token=63fbecbb63fbecbb63fbecbb33638f7e1d663fb63fbecbb3c6f9fb9664c2428f44fef5e)

{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","is_closed":false,"can_access_closed":true,"sex":2,"bdate":"10.10.1984"}]}

### Задание 1 - ID страны
Какое значение ID у страны, указанной в профиле Павла Дурова (ID отдается вместе с названием страны)? Укажите ответ в виде целого числа.

[запрос 3](https://api.vk.com/method/users.get?user_id=1&v=5.95&fields=country&access_token=63fbecbb63fbecbb63fbecbb33638f7e1d663fb63fbecbb3c6f9fb9664c2428f44fef5e)

{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","is_closed":false,"can_access_closed":true,"country":{"id":1,"title":"Россия"}}]}

## 9.14 Запрос к API из кода
### Запрос из кода
Мы делали запрос в браузере, теперь давайте сделаем запрос из кода. Будем пользоваться всё той же библиотекой requests.
```python
import requests  
  
url = 'https://api.vk.com/method/users.get'   
params = {'user_id': 1, 'v': 5.95, 'fields': 'sex,bdate', 'access_token': token, 'lang': 'ru'}  
  
# Мы можем выставить параметры запроса через аргумент params  
response = requests.get(url, params=params)  
response.text  
```

In [11]:
import requests  

url = 'https://api.vk.com/method/users.get'   
params = {'user_id': 1, 'v': 5.95, 'fields': 'sex,bdate', 'access_token': token, 'lang': 'ru'}  

# Мы можем выставить параметры запроса через аргумент params  
response = requests.get(url, params=params)  
response.text  

'{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","is_closed":false,"can_access_closed":true,"sex":2,"bdate":"10.10.1984"}]}'

Мы получили строку в формате JSON. Как мы помним по первому разделу, её можно преобразовать в словарь методом json и после этого обращаться к различным полям. Кроме того, такие большие вложенные словари нагляднее выводить с помощью функции pprint (~pretty print, красивый вывод), которым мы и воспользуемся

```python
from pprint import pprint  
  
pprint(response.json())  
```

In [12]:
from pprint import pprint  

pprint(response.json()) 

{'response': [{'bdate': '10.10.1984',
               'can_access_closed': True,
               'first_name': 'Павел',
               'id': 1,
               'is_closed': False,
               'last_name': 'Дуров',
               'sex': 2}]}


In [13]:
user = response.json()['response'][0]  
  
# Выведем дату рождения  
print(user['bdate'])  

10.10.1984


In [14]:
# Выведем имя  
print(user['first_name'])  

Павел


Данный метод позволяет запрашивать сразу много пользователей (до 1000).  Для этого нужно использовать параметр user_ids и передавать id через запятую в строковом формате, например: '1,2,3'.
```python
ids = ",".join(map(str, range(1, 4)))  
print(ids)  
```

In [23]:
ids = ",".join(map(str, range(1, 4)))  
print(ids)  

1,2,3


In [24]:
params = {'user_ids': ids, 'v': 5.95, 'fields': 'bday', 'access_token': token, 'lang': 'ru'} 
params = {'user_ids': ids, 'v': 5.95, 'fields': 'bday', 'access_token': token} 

# params = {'user_ids': ids, 'v': 5.95, 'fields': 'sex', 'access_token': token, 'lang': 'ru'} 
pprint(requests.get(url, params=params).json()) 

{'response': [{'can_access_closed': True,
               'first_name': 'Pavel',
               'id': 1,
               'is_closed': False,
               'last_name': 'Durov'},
              {'can_access_closed': False,
               'first_name': 'Alexandra',
               'id': 2,
               'is_closed': True,
               'last_name': 'Vladimirova'},
              {'deactivated': 'deleted',
               'first_name': 'DELETED',
               'id': 3,
               'last_name': ''}]}


### Задание 1 - Гендерный баланс
Используя API, определите долю женщин(sex=1) среди пользователей с id от 1 до 500. Иногда вам будут попадать пользователи, у которых пол не указан (sex=0), их не нужно учитывать в общем числе.

В ответе укажите число, округлив до двух знаков после запятой, например, 0.55

Пример: если у нас будет 300 пользователей sex=1, 100 пользователей с sex=2 и 100 пользователей с sex=0, то в ответе должно быть 0.75

In [26]:
ids = ",".join(map(str, range(1, 501)))
params = {'user_ids': ids, 'v': 5.95, 'fields': 'sex', 'access_token': token} 

response = requests.get(url, params=params).json()

In [44]:
users_data = response['response']

from collections import Counter
counter = Counter()

for user in users_data:
    counter[(user['sex'])] += 1

round(counter[1]/(counter[1]+counter[2]),2)

0.48

## 9.15 Ограничения API
В прошлом блоке мы собрали информацию о небольшом наборе пользователей. Теперь перейдем к более реальной задаче — сбору данных о пользователях группы ВКонтакте. 

Стоит отметить, что есть много сервисов, которые выгружают похожую статистику из соцсетей. Однако им свойственны недостатки универсальных решений:

- не могут учитывать всех особенностей вашего проекта;
- считают фиксированный набор метрик, дополнительную обработку данных приходится делать вам;
- не всегда бесплатны и вряд ли позволят работать с большими объемами данных.

### В этом разделе мы научимся считать произвольные метрики групп, собирая данные из API. 

В текущем шаге мы научимся работать с двумя ограничениями, которые свойственны практически всем системам:

- ограничение на количество вызовов в единицу времени;
- ограничение на количество выгружаемых строк за один запрос.

Ограничение на количество запросов в секунду сделано для того, чтобы избежать чрезмерной нагрузки на серверы системы. В ряде случаев небольшое количество отчетов можно выгрузить, уложившись в этот лимит (например, как мы получили информацию о 500 пользователях в прошлом упражнении). Однако второе ограничение не удастся «обойти» в случае выгрузки больших отчетов. Например, чтобы получить список всех пользователей очень популярной группы, серверу, возможно, придется отправить вам разом лист из миллионов записей.

***Давайте рассмотрим, как работать с этими ограничениями на примере выгрузки списка пользователей группы*** https://vk.com/mountelbrus.

Посмотрим в документации, [какие методы нам доступны для групп](https://vk.com/dev/groups). Для получения списка пользователей группы видим метод [groups.getMembers](https://vk.com/dev/groups.getMembers).

Согласно документации, обязательным параметром является ID или короткое имя группы. В нашем случае это `mountelbrus: https://vk.com/mountelbrus`. Тестируем, как работает метод в самом простом случае:
```python
import requests  
url = 'https://api.vk.com/method/groups.getMembers'  
params = {  
    'group_id': 'mountelbrus',  
    'v': 5.95,  
    'access_token': token  
}  
response = requests.get(url, params = params)  
data = response.json()  
print(data) 
```

In [45]:
import requests  
url = 'https://api.vk.com/method/groups.getMembers'  
params = {  
    'group_id': 'mountelbrus',  
    'v': 5.95,  
    'access_token': token  
}  
response = requests.get(url, params = params)  
data = response.json()  
print(data) 

{'response': {'count': 67379, 'items': [161, 273, 710, 1157, 1364, 1858, 2306, 3516, 3857, 4316, 4592, 4646, 4765, 4901, 4969, 4992, 5118, 5121, 5438, 5678, 5818, 5970, 6172, 6528, 6706, 7224, 7303, 7638, 8212, 8376, 8422, 9006, 9322, 9640, 9808, 10133, 10361, 10531, 11246, 12541, 12757, 12915, 12976, 12990, 13188, 13549, 13695, 14033, 14644, 14742, 15018, 15140, 15421, 16328, 16608, 17522, 17656, 17670, 18226, 18248, 18423, 18958, 19072, 19232, 19405, 19483, 19568, 19691, 19720, 20417, 20598, 20866, 20934, 20980, 21179, 21386, 21760, 22123, 22135, 22726, 23011, 23217, 23256, 23360, 23932, 24275, 24985, 25018, 25096, 25166, 25310, 25394, 25814, 25930, 25975, 26034, 26205, 26543, 26828, 27023, 27513, 27536, 27659, 27670, 28879, 29132, 29166, 29450, 29677, 29805, 30168, 30518, 30760, 31012, 31926, 32019, 32528, 33259, 33299, 33795, 34777, 34811, 35170, 35244, 35300, 35868, 36811, 37082, 37311, 37455, 37496, 38193, 38258, 39030, 39286, 39538, 39702, 39737, 39738, 40089, 40933, 40984, 4119

In [46]:
len(data['response']['items'])      

1000

### Получаем всех пользователей
Мы видим, что всего пользователей в группе больше 65 000, а получили мы только первую тысячу пользователей группы. Судя по описанию параметра count в документации, это максимум, который может отдать API за один раз.

Для получения следующей тысячи пользователей воспользуемся параметрами `count` и `offset`: будем в цикле выгружать по 1000 пользователей (`count` будет всегда равен 1000), а в каждом следующем шаге цикла увеличим смещение `offset` на величину count.

Сначала напишем цикл выгрузки первых 20 пользователей со значением `count` = 5. Т.е. цикл будет выгружать за 1 запрос по 5 пользователей, пока не выгрузит первые 20. Это позволит нам проверить корректность работы цикла перед тем, как делать большие и долгие выгрузки.

Давайте выведем на экран первые 20 пользователей из нашей первой попытки с 1000 пользователей, чтобы было с чем сверить результат выгрузки из 20 пользователей:
```python
users_for_checking = data['response']['items'][:20]  
print(users_for_checking)  
```

In [47]:
users_for_checking = data['response']['items'][:20]  
print(users_for_checking)  

[161, 273, 710, 1157, 1364, 1858, 2306, 3516, 3857, 4316, 4592, 4646, 4765, 4901, 4969, 4992, 5118, 5121, 5438, 5678]


Теперь используем `count` и `offset`, чтобы получить те же id по 5 за раз
```python
count = 5  
offset = 0  
user_ids = []
max_count = 20  
while offset < max_count:  
    print('Выгружаю {} пользователей с offset = {}'.format(count, offset))     
    params = {  
        'group_id': 'mountelbrus',  
        'v': 5.95,  
        'count': count,  
        'offset': offset,  
        'access_token': token  
    }     
    # такой же запрос как в прошлый раз  
    r = requests.get(url, params = params)  
    data = r.json()     
    user_ids += data['response']['items']   
  
    # увеличиваем смещение на количество строк выгрузки  
    offset += count  
```

In [48]:
count = 5  
offset = 0  
user_ids = []
max_count = 20  
while offset < max_count:  
    print('Выгружаю {} пользователей с offset = {}'.format(count, offset))     
    params = {  
        'group_id': 'mountelbrus',  
        'v': 5.95,  
        'count': count,  
        'offset': offset,  
        'access_token': token  
    }     
    # такой же запрос как в прошлый раз  
    r = requests.get(url, params = params)  
    data = r.json()     
    user_ids += data['response']['items']   

    # увеличиваем смещение на количество строк выгрузки  
    offset += count

Выгружаю 5 пользователей с offset = 0
Выгружаю 5 пользователей с offset = 5
Выгружаю 5 пользователей с offset = 10
Выгружаю 5 пользователей с offset = 15


In [49]:
print(user_ids)  
user_ids == users_for_checking    

[161, 273, 710, 1157, 1364, 1858, 2306, 3516, 3857, 4316, 4592, 4646, 4765, 4901, 4969, 4992, 5118, 5121, 5438, 5678]


True

Видим, что подход корректно работает. Теперь мы можем получить всех пользователей, выставив `count = 1000` и `max_count = data['response']['count']`.

### Задание 1 - Юбилейный пользователь
Используя API, определите id пятидесятитысячного пользователя в группе `mountelbrus` . Т.е. если бы у нас не было ограничения на размер запроса, то мы бы запросили `data['response']['items'][49999]` .

In [51]:
    params = {  
        'group_id': 'mountelbrus',  
        'v': 5.95,  
        'count': 1,  
        'offset': 49999,  
        'access_token': token}

In [63]:
response = requests.get(url, params = params)  
anniv_user_data = response.json()

In [64]:
anniv_user_id = anniv_user_data['response']['items'][0]
anniv_user_id

218755957

### 9.16 Ограничение по частоте запросов
В API частот добавляют ограничение по частоте запросов, чтобы отдельно взятые пользователи слишком сильно не перегружали  сервер. Подобное ограничение есть и у ВКонтакте, в документации которой указано, что можно делать не более 3-х запросов в секунду. 

Чтобы не следить за частотой отправки запросов с секундомером в руках, мы можем после каждого запроса делать паузу. В этом случае, даже если код будет выполняться на самом быстром компьютере, мы не нарушим установленное ограничение, т.к. периодичность отправки запросов будет искусственно замедлена. Воспользуемся библиотекой `time` и методом `sleep` (пауза в 0.5 секунды добавлена в конце цикла):
```python
import time  
  
count = 1000  
offset = 0  
user_ids = []  
while offset < 10000:  
    print('Выгружаю {} пользователей с offset = {}'.format(count, offset))     
    params = {  
        'group_id': 'mountelbrus',  
        'v': 5.95,  
        'count': count,  
        'offset': offset,  
        'access_token': token  
    }    
    # такой же запрос, как в прошлый раз  
    r = requests.get(url, params = params)  
    data = r.json()     
    user_ids += data['response']['items']    
  
    # увеличиваем смещение на количество строк выгрузки  
    offset += count  
    
    print('Ожидаю 0.5 секунды...')  
    time.sleep(0.5)  
```

In [65]:
import time  

count = 1000  
offset = 0  
user_ids = []  
while offset < 10000:  
    print('Выгружаю {} пользователей с offset = {}'.format(count, offset))     
    params = {  
        'group_id': 'mountelbrus',  
        'v': 5.95,  
        'count': count,  
        'offset': offset,  
        'access_token': token  
    }    
    # такой же запрос, как в прошлый раз  
    r = requests.get(url, params = params)  
    data = r.json()     
    user_ids += data['response']['items']    

    # увеличиваем смещение на количество строк выгрузки  
    offset += count  

    print('Ожидаю 0.5 секунды...')  
    time.sleep(0.5)  

Выгружаю 1000 пользователей с offset = 0
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 1000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 2000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 3000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 4000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 5000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 6000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 7000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 8000
Ожидаю 0.5 секунды...
Выгружаю 1000 пользователей с offset = 9000
Ожидаю 0.5 секунды...


In [66]:
len(user_ids)

10000

### 9.17 Лайки, репосты и комментарии
Лайки, репосты и комментарии
Ещё одна полезная вещь, которую можно получить,  —  это количество взаимодействий с постами через **API новостной ленты**. На данном этапе будем использовать самый простой вариант: берем последние 10 постов группы. Мы продолжаем работать с группой `https://vk.com/mountelbrus`.

Начнем с  формирования запроса к **API ВКонтакте** методом `wall.get()`:
```python
import requests  
from pprint import pprint  
  
url = 'https://api.vk.com/method/wall.get'  
params = {  
    'domain': 'mountelbrus',  
    'filter': 'owner',  
    'count': 10,  
    'offset': 0,  
    'access_token': token,  
    'v': 5.95  
}  
response = requests.get(url, params = params)  
response.json()
```

In [67]:
import requests  
from pprint import pprint  

url = 'https://api.vk.com/method/wall.get'  
params = {  
    'domain': 'mountelbrus',  
    'filter': 'owner',  
    'count': 10,  
    'offset': 0,  
    'access_token': token,  
    'v': 5.95  
}  
response = requests.get(url, params = params)  
response.json()

{'response': {'count': 718,
  'items': [{'id': 13830,
    'from_id': -9690799,
    'owner_id': -9690799,
    'date': 1602330529,
    'marked_as_ads': 0,
    'post_type': 'post',
    'text': 'ТУРЫ НА ЭЛЬБРУС, КАЗБЕК, ДЫХТАУ 2021\n(три Российских пятитысячника)\n\n1. Программы 2021:\nЭльбрус с юга (треккинг)\nЭльбрус с юга (комфорт)\nЗимний Эльбрус\nЭльбрус с востока \nЭльбрус с севера (короткий стандартный)\nЭльбрус с севера (треккинг)\nЭльбрус с запада\nЭльбрус с кислородом за 1 день\nКазбек с севера\nКазбек с юга\nДыхтау\n\n2. Гиды - инструкторы альпинизма, чемпионы России по альпинизму, КМС и Мастера Спорта.\n\n3. Офис в Пятигорске и собственный прокат всего снаряжения и одежды.\n\n4. Самый полный набор средств и мер безопасности, включая спутниковую связь и кислородное оборудование для экстренных случаев (для случаев острой горной болезни)\n\n5. Поддержка и помощь на всех этапах: выбор маршрута, физическая подготовка, выбор снаряжения - наши менеджеры всегда на связи с вами.\n\n6. Р

Видим, что сначала идёт общее количество постов, а по ключу `'items'`  —  сами посты. Посмотрим на отдельный пост:

```python
response.json()['response']['items'][0]  
```

In [68]:
response.json()['response']['items'][0] 

{'id': 13830,
 'from_id': -9690799,
 'owner_id': -9690799,
 'date': 1602330529,
 'marked_as_ads': 0,
 'post_type': 'post',
 'text': 'ТУРЫ НА ЭЛЬБРУС, КАЗБЕК, ДЫХТАУ 2021\n(три Российских пятитысячника)\n\n1. Программы 2021:\nЭльбрус с юга (треккинг)\nЭльбрус с юга (комфорт)\nЗимний Эльбрус\nЭльбрус с востока \nЭльбрус с севера (короткий стандартный)\nЭльбрус с севера (треккинг)\nЭльбрус с запада\nЭльбрус с кислородом за 1 день\nКазбек с севера\nКазбек с юга\nДыхтау\n\n2. Гиды - инструкторы альпинизма, чемпионы России по альпинизму, КМС и Мастера Спорта.\n\n3. Офис в Пятигорске и собственный прокат всего снаряжения и одежды.\n\n4. Самый полный набор средств и мер безопасности, включая спутниковую связь и кислородное оборудование для экстренных случаев (для случаев острой горной болезни)\n\n5. Поддержка и помощь на всех этапах: выбор маршрута, физическая подготовка, выбор снаряжения - наши менеджеры всегда на связи с вами.\n\n6. Распродажа при раннем бронировании. Цены на туры в 2021 год

Нужная нам статистика находится в полях `'comments'`, `'likes'` и `'reposts'`. Соберем итоговую статистику для каждого поста в словарь `stats`.  
В качестве ключа будем использовать начало статьи, в качестве значения — список с тремя интересующими нас метриками и временем публикации: `[комментарии, лайки, репосты, дата публикации]`
```python
stats = {}  
              
for record in response.json()['response']['items'][:]:  
    title = record['text'][:30]  
    if title:  
        stats[title] = [record['comments']['count'], record['likes']['count'], record['reposts']['count'], record['date'] ]  
pprint(stats)  
```

In [69]:
stats = {}  
              
for record in response.json()['response']['items'][:]:  
    title = record['text'][:30]  
    if title:  
        stats[title] = [record['comments']['count'], record['likes']['count'], record['reposts']['count'], record['date'] ]  
pprint(stats)  

{'ВОСХОЖДЕНИЕ НА ДЫХТАУ 2021\nПре': [12, 86, 4, 1601661543],
 'Восхождение на Эльбрус - это "': [22, 450, 11, 1600677360],
 'Восхождение на Эльбрус с восто': [18, 1081, 27, 1601543773],
 'ЗИМНЕЕ ВОСХОЖДЕНИЕ НА ЭЛЬБРУС.': [1, 406, 11, 1602159033],
 'За первые несколько дней экоту': [31, 492, 13, 1600629516],
 'Потерявший ноги 28-летний уфим': [75, 2272, 64, 1600164189],
 'Прямой эфир 27.09.2020 \nИннстр': [5, 43, 2, 1601190530],
 'Свежие фотографии из нашего по': [13, 288, 4, 1601977706],
 'ТУРЫ НА ЭЛЬБРУС 2021\nНабираем ': [0, 452, 11, 1600166973],
 'ТУРЫ НА ЭЛЬБРУС, КАЗБЕК, ДЫХТА': [11, 116, 7, 1602330529]}


### Задание 1 - SMM index
Напишите функцию `get_smm_index(group_name, token)`, которая по имени группы и авторизационному токену API возвращает `smm_index` группы - ***сумму лайков, комментариев и репостов для последних 10 постов, поделённую на количество участников в группе***.

In [98]:
def get_smm_index(group_name, token):
    # определеям параметры запросов
    url_getMembers = 'https://api.vk.com/method/groups.getMembers'  
    url_wall_get = 'https://api.vk.com/method/wall.get'
    params_getMembers = {  
        'group_id': group_name,  
        'v': 5.95,  
        'access_token': token  
    }
    params_wall_get = {  
        'domain': group_name,  
        'filter': 'owner',  
        'count': 10,  
        'offset': 0,  
        'access_token': token,  
        'v': 5.95  
    }
    
    # плучаем количество участников группы
    response_getMembers = requests.get(url_getMembers, params = params_getMembers)  
    data_getMembers = response_getMembers.json()  
    
    members_count = data_getMembers['response']['count']
    
    # получаем сумму лайков, комментариев и репостов для последних 10 постов
    response_wall_get = requests.get(url_wall_get, params = params_wall_get)  
    data_wall_get = response_wall_get.json()
    
    reaction_sum = 0 
    for i in range(10):
        reaction_sum += (data_wall_get['response']['items'][i]['comments']['count'] +
                         data_wall_get['response']['items'][i]['likes']['count'] +
                         data_wall_get['response']['items'][i]['reposts']['count'])
    
    # вычисляем smm_index
    smm_index = reaction_sum / members_count
    
    return smm_index

In [100]:
get_smm_index('mountelbrus', token)

0.08946540413784915

## 9.18 Возможности API
Мы рассмотрели базовое взаимодействие с пользователями и группами. ВКонтакте предоставляет достаточно широкие возможности в своём API: по сути, всё, что можно делать руками через браузер, доступно и в API. Обратим внимание: если вы размещаете рекламу в Вконтакте, то можно выгружать всю статистику через [ads API](https://vk.com/dev/ads).

Полный список методов можно посмотреть в документации - https://vk.com/dev/methods

## ПОДВАЛ