# **Веб-запросы**

Процесс получения/извлечения информации с веб-ресурсов в интернете называется **web-scraping** (рус. веб-скрейпинг/веб-скрапинг). Веб-скрапинг может быть проделан вручную пользователем компьютера, однако этот термин обычно связывают с автоматизированными процессами, реализованными с помощью кода.

##### **МЕТОДЫ ЗАПРОСОВ В ПРОТОКОЛЕ HTTP**
***
Для того чтобы указать серверу на то, какое действие мы хотим произвести с ресурсом, в протоколе HTTP используются так называемые методы. В HTTP существует несколько методов, которые описывают действия с ресурсами. Чаще всего используются **GET** и **POST**.

GET — ПОЛУЧЕНИЕ РЕСУРСА

POST — СОЗДАНИЕ РЕСУРСА

[Подробнее](https://developer.mozilla.org/ru/docs/Web/HTTP/Methods)

# **Библиотека requests**

In [18]:
import pandas as pd
from IPython.display import display
# Импортируем библиотеку requests
import requests
# Импортируем функцию pprint()
from pprint import pprint

Познакомимся с библиотекой ***requests***, решив простую задачу — получить значения курсов валют. Курс валют — полезная и регулярно обновляемая информация, но каждый раз в ручном режиме получать информацию о курсе интересующей валюты трудоёмко.

Разработаем код, так называемый **скрипт** (англ. script, рус. сценарий), — небольшую программу, которая содержит последовательность действий для автоматического выполнения задачи.

С помощью скрипта мы будем в удобном виде выгружать информацию по курсам валют с заранее выбранного сайта.

Один из сайтов в интернете, на котором информация о курсах валют дублирует информацию с сайта [Центрального Банка России](https://www.cbr.ru/), — ресурс [Курсы валют ЦБ РФ в XML и JSON](https://www.cbr-xml-daily.ru/). На данном ресурсе информация о курсах валют представлена в разных форматах, в том числе и в структурированном JSON-формате, методы работы с которым мы изучили в одном из предыдущих модулей.

Перед началом работы библиотеку requests потребуется установить:

**pip install requests** 

In [4]:
# Определяем значение URL страницы для запроса
url = 'https://www.cbr-xml-daily.ru/daily_json.js'
# Делаем GET-запрос к ресурсу и результат ответа сохраняем в переменной response
response = requests.get(url)
# Выводим значение response на экран как объект
print(response)

<Response [200]>


Мы получили объект ответа Response, который содержит всю нужную нам информацию. По умолчанию в квадратных скобках на экран выводится код статуса ответа. В данном случае он равен **200** — то есть запрос был корректным и сервер отдал нам нужную информацию. Значение кода статуса **404** означало бы, что страница по указанному адресу не найдена, а значение **403** — что синтаксис GET-запроса неверный.

Код ответа в виде числовой переменной можно получить с помощью метода **status_code**:

In [5]:
print(response.status_code) # Выводим числовое значение response на экран

200


In [8]:
response=requests.get('https://www.cbr-xml-daily.ru/daily.xml')
print(response.status_code)

200


Текст ответа хранится в **атрибуте text**. Выведем значение атрибута на экран и посмотрим на его содержимое:

In [20]:
response=requests.get('https://www.cbr-xml-daily.ru/daily_json.js')
# Выводим содержимое атрибута text переменной response на экран
print(response.text)

{
    "Date": "2022-04-22T11:30:00+03:00",
    "PreviousDate": "2022-04-21T11:30:00+03:00",
    "PreviousURL": "\/\/www.cbr-xml-daily.ru\/archive\/2022\/04\/21\/daily_json.js",
    "Timestamp": "2022-04-21T19:00:00+03:00",
    "Valute": {
        "AUD": {
            "ID": "R01010",
            "NumCode": "036",
            "CharCode": "AUD",
            "Nominal": 1,
            "Name": "Австралийский доллар",
            "Value": 55.8293,
            "Previous": 57.2403
        },
        "AZN": {
            "ID": "R01020A",
            "NumCode": "944",
            "CharCode": "AZN",
            "Nominal": 1,
            "Name": "Азербайджанский манат",
            "Value": 44.1171,
            "Previous": 45.3417
        },
        "GBP": {
            "ID": "R01035",
            "NumCode": "826",
            "CharCode": "GBP",
            "Nominal": 1,
            "Name": "Фунт стерлингов Соединенного королевства",
            "Value": 97.8587,
            "Previous": 100.1281
  

Проверить тип данных полученного ответа можно, воспользовавшись функцией **type()**.

In [17]:
print(type(response.text))

<class 'str'>


Для того чтобы удобно было работать с полученной информацией, нам необходимо преобразовать строку в словарь. В объект ответа Response  из библиотеки requests уже встроен метод **json()**.

Импортируем функцию pprint(), применим к полученному ответу метод json() и выведем полученный результат на экран:

In [19]:
currencies = response.json() # Применяем метод json()
pprint(currencies) # Выводим результат на экран)

{'Date': '2022-04-22T11:30:00+03:00',
 'PreviousDate': '2022-04-21T11:30:00+03:00',
 'PreviousURL': '//www.cbr-xml-daily.ru/archive/2022/04/21/daily_json.js',
 'Timestamp': '2022-04-21T19:00:00+03:00',
 'Valute': {'AMD': {'CharCode': 'AMD',
                    'ID': 'R01060',
                    'Name': 'Армянских драмов',
                    'Nominal': 100,
                    'NumCode': '051',
                    'Previous': 16.4278,
                    'Value': 16.0333},
            'AUD': {'CharCode': 'AUD',
                    'ID': 'R01010',
                    'Name': 'Австралийский доллар',
                    'Nominal': 1,
                    'NumCode': '036',
                    'Previous': 57.2403,
                    'Value': 55.8293},
            'AZN': {'CharCode': 'AZN',
                    'ID': 'R01020A',
                    'Name': 'Азербайджанский манат',
                    'Nominal': 1,
                    'NumCode': '944',
                    'Previous': 45.3417,


In [28]:
# Выводим на экран информацию о валюте евро
pprint(currencies['Valute']['EUR'])
pprint(currencies['Valute']['USD']['Name'])

{'CharCode': 'EUR',
 'ID': 'R01239',
 'Name': 'Евро',
 'Nominal': 1,
 'NumCode': '978',
 'Previous': 83.2705,
 'Value': 81.2239}
'Доллар США'
