### Методы запросов в протоколе HTTP

***Метод GET*** запрашивает информацию из указанного источника и не может влиять на его содержимое. Запрос доступен для кэширования данных (то есть для сохранения, восстановления и дальнейшего использования) и добавления в закладки. Длина запроса ограничена (максимальная длина — 2048 символов).

Пример GET-запроса, отправляемого через адресную строку браузера:
http://site.ru/page.php?name=dima&age=27

***Метод POST*** используется для отправки данных, которые могут оказывать влияние на содержимое ресурса. В отличие от метода GET, запросы POST не могут быть кэшированы, они не остаются в истории браузера и их нельзя добавить в закладки. Длина запроса POST не ограничивается.

Пример POST-запроса, отправляемого через форму запроса:

    POST / HTTP/1.0\r\n
    Host: www.site.ru\r\n
    Referer: http://www.site.ru/index.html\r\n
    Cookie: income=1\r\n
    Content-Type: application/x-www-form-urlencoded\r\n
    Content-Length: 35\r\n
    \r\n
    login=Dima&password=12345

In [19]:
# Как только библиотека установлена, импортируем её и отправим наш первый запрос 
# к ресурсу Курсы валют ЦБ РФ в XML и JSON. Используем метод get() из библиотеки requests, 
# передав ему соответствующий URL —  https://www.cbr-xml-daily.ru/daily_json.js:

import requests # Импортируем библиотеку requests
from pprint import pprint # Импортируем функцию pprint()
import json

url = 'https://www.cbr-xml-daily.ru/daily_json.js' # Определяем значение URL страницы для запроса
response = requests.get(url) # Делаем GET-запрос к ресурсу и результат ответа сохраняем в переменной response
print(response) # Выводим значение response на экран как объект
print(response.status_code) # Выводим числовое значение response на экран

<Response [200]>
200


Мы получили объект ответа Response, который содержит всю нужную нам информацию. По умолчанию в квадратных скобках на экран выводится код статуса ответа. В данном случае он равен 200 — то есть запрос был корректным и сервер отдал нам нужную информацию. Значение кода статуса 404 означало бы, что страница по указанному адресу не найдена, а значение 403 — что синтаксис GET-запроса неверный.

### Задание 3.1
Вы уже импортировали модуль requests в ваш код. Напишите строку кода, при выполнении которой будет сделан GET-запрос к ресурсу https://www.cbr-xml-daily.ru/daily.xml, а результат ответа будет сохранён в переменной response

In [20]:
response3 = requests.get('https://www.cbr-xml-daily.ru/daily.xml')

print(response3) # Выводим значение response на экран как объект
print(response3.status_code) # Выводим числовое значение response на экран

<Response [200]>
200


### Работаем с ответом

In [25]:
pprint(response.text) # Выводим содержимое атрибута text переменной response на экран

('{\n'
 '    "Date": "2022-03-15T11:30:00+03:00",\n'
 '    "PreviousDate": "2022-03-12T11:30:00+03:00",\n'
 '    "PreviousURL": '
 '"\\/\\/www.cbr-xml-daily.ru\\/archive\\/2022\\/03\\/12\\/daily_json.js",\n'
 '    "Timestamp": "2022-03-14T14:00:00+03:00",\n'
 '    "Valute": {\n'
 '        "AUD": {\n'
 '            "ID": "R01010",\n'
 '            "NumCode": "036",\n'
 '            "CharCode": "AUD",\n'
 '            "Nominal": 1,\n'
 '            "Name": "Австралийский доллар",\n'
 '            "Value": 83.5173,\n'
 '            "Previous": 85.6374\n'
 '        },\n'
 '        "AZN": {\n'
 '            "ID": "R01020A",\n'
 '            "NumCode": "944",\n'
 '            "CharCode": "AZN",\n'
 '            "Nominal": 1,\n'
 '            "Name": "Азербайджанский манат",\n'
 '            "Value": 67.9384,\n'
 '            "Previous": 68.8557\n'
 '        },\n'
 '        "GBP": {\n'
 '            "ID": "R01035",\n'
 '            "NumCode": "826",\n'
 '            "CharCode": "GBP",\n'
 '  

In [22]:
currencies = response.json() # Применяем метод json()
pprint(currencies) # Выводим результат на экран)

{'Date': '2022-03-15T11:30:00+03:00',
 'PreviousDate': '2022-03-12T11:30:00+03:00',
 'PreviousURL': '//www.cbr-xml-daily.ru/archive/2022/03/12/daily_json.js',
 'Timestamp': '2022-03-14T14:00:00+03:00',
 'Valute': {'AMD': {'CharCode': 'AMD',
                    'ID': 'R01060',
                    'Name': 'Армянских драмов',
                    'Nominal': 100,
                    'NumCode': '051',
                    'Previous': 22.5229,
                    'Value': 22.3221},
            'AUD': {'CharCode': 'AUD',
                    'ID': 'R01010',
                    'Name': 'Австралийский доллар',
                    'Nominal': 1,
                    'NumCode': '036',
                    'Previous': 85.6374,
                    'Value': 83.5173},
            'AZN': {'CharCode': 'AZN',
                    'ID': 'R01020A',
                    'Name': 'Азербайджанский манат',
                    'Nominal': 1,
                    'NumCode': '944',
                    'Previous': 68.8557,


In [27]:
# Выведем на экран, например, информацию о евро (EUR):
pprint(currencies['Valute']['EUR']) # Выводим на экран информацию о валюте евро

{'CharCode': 'EUR',
 'ID': 'R01239',
 'Name': 'Евро',
 'Nominal': 1,
 'NumCode': '978',
 'Previous': 128.9523,
 'Value': 127.2343}


In [28]:
print(currencies['Valute']['CZK']['Name'])

Чешских крон


### Парсинг сайтов / содержимое веб-страницы / HTML

In [29]:
import requests # Импортируем библиотеку requests
url = 'https://nplus1.ru/news/2021/10/11/econobel2021' # Определяем адрес страницы
response = requests.get(url)  # Выполняем GET-запрос
print(response.text)  # Выводим содержимое атрибута text

<!doctype html>
<html class="no-js bg-fixed _no-bg" style="background-image:url(https://nplus1.ru/images/2021/10/11/9c6bcb5f7c01c6d88d49410e16ebc003.jpg)" lang="">
<head>
    
    <meta charset="utf-8">
    <meta http-equiv="x-ua-compatible" content="ie=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
        <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">
                <meta name='wmail-verification' content='7991d7eb02d759f05b9050e111a7e3eb' />

    <link rel="canonical" href="https://nplus1.ru/news/2021/10/11/econobel2021" />

    <link rel="icon" href="/i/favicon-bw.png" />


        <title>Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей</title>

    	    <meta itemprop="datePublished" content="2021-10-11"/>
	
	    <meta name="mediator_author" content="Илья Ферапонтов"/> 
	
        <!-- amp page -->
    <link rel="amph

### Библиотека BeautifulSoup

In [30]:
# Устанавливаем библиотеку BeautifulSoup
!pip install beautifulsoup4 



In [31]:
from bs4 import BeautifulSoup # Импортируем библиотеку BeautifulSoup

In [32]:
import requests # Импортируем библиотеку requests
from bs4 import BeautifulSoup # Импортируем библиотеку BeautifulSoup
url = 'https://nplus1.ru/news/2021/10/11/econobel2021' # Определяем адрес страницы
response = requests.get(url) # Выполняем GET-запрос, содержимое ответа присваивается переменной response
page = BeautifulSoup(response.text, 'html.parser') # Создаём объект BeautifulSoup, указывая html-парсер
print(page.title) # Получаем тег title, отображающийся на вкладке браузера
print(page.title.text) # Выводим текст из полученного тега, который содержится в атрибуте text

<title>Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей</title>
Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей


In [34]:
# Извлечем заголовок статьи, опубликованной на этой странице, дату публикации, а также текст статьи.
# Предположим, что мы знаем, что в HTML-коде рассматриваемой нами страницы заголовок статьи заключён 
# в тег <h1> … </h1> (заголовок первого уровня). Тогда мы можем получить его текст с помощью 
# метода find() (с англ. найти) объекта BeautifulSoup, передав ему название интересующего нас тега:

print(page.find('h1').text) # Применяем метод find() к объекту и выводим результат на экран
print(page.find('time').text) # Выводим на экран содержимое атрибута text тега time

Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей

13:04
11 Окт. 2021



###  Задание 5.4
Напишите функцию wiki_header, которая по адресу страницы возвращает заголовок для статей на Wikipedia.

In [35]:
import requests
from bs4 import BeautifulSoup

def wiki_header(url):
    response5 = requests.get(url)
    page5 = BeautifulSoup(response5.text, 'html.parser')
    return page5.find('h1').text

wiki_header('https://en.wikipedia.org/wiki/Operating_system')
# 'Operating system'

'Operating system'

### Неуникальные теги: извлекаем текст статьи

In [36]:
#  текст заключён в тег  <div> … </div> . Попробуем извлечь его уже известным нам способом — 
# с помощью метода find() — и выведем его на экран.
print(page.find('div').text) # Выводим содержимое атрибута text тега div




In [37]:
# Посмотрим на нашу страницу, используя инструмент разработчика, ещё раз. Можем заметить, 
# что у искомого текста есть свой класс — body js-mediator-article
print(page.find('div', class_='body').text) # Выводим содержимое атрибута text тега div класса body js-mediator-article









Премия Шведского национального банка по экономическим наукам памяти Альфреда Нобеля за 2021 год присуждена Дэвиду Карду (David Card) за его вклад в эмпирические исследования экономики рынка труда, а также Джошуа Энгристу (Joshua Angrist) и Гвидо Имбенсу (Guido Imbens) за их вклад в методологию анализа причинно-следственных связей. Прямая трансляция церемонии объявления лауреатов шла на официальном сайте Нобелевской премии.









Слева направо: Дэвид Карт, Джошуа Энгрист и Гвидо Имбенс.
Niklas Elmehed © Nobel Prize Outreach



Поделиться

















Премия по экономике, в отличие от Нобелевских премий по физиологии и медицине, физике, химии и литературе, а также премии мира, была учреждена не самим Альфредом Нобелем, а Банком Швеции в 1968 году. Ее размер равен размеру остальных премий.Лауреаты этого года награждены за их исследования причинно-следственных связей в области социальных наук. В частности, Дэвид Кард из университета Калифорнии в Беркли начиная с 1990-х годов

### Сбор нескольких элементов: собираем все ссылки на странице
Рассмотрим ещё один сценарий: вы хотите собрать сразу несколько элементов со страницы. Например, представьте, что вы хотите получить названия всех языков программирования, упомянутых на странице в Wikipedia в статье про языки программирования.

Можно заметить, что все названия языков программирования на этой странице связаны ссылками c соответствующими статьями о них. Таким образом, нам необходимо собрать все ссылки на странице. Для ссылок в HTML предусмотрен тег <a> … </a>.

In [38]:
url = 'https://en.wikipedia.org/wiki/List_of_programming_languages' # Задаём адрес ресурса
response = requests.get(url) # Делаем GET-запрос к ресурсу
page = BeautifulSoup(response.text, 'html.parser') # Создаём объект BeautifulSoup
print(page.find('a')) # Ищем ссылку по тегу <a> и выводим её на экран

<a id="top"></a>


In [39]:
# Мы получили только одну ссылку, хотя на странице их явно больше.
# Это происходит, потому что метод find() возвращает только первый подходящий элемент. 
# Если требуется получить больше элементов, необходимо воспользоваться методом find_all() (с англ. найти все):

links = page.find_all('a') # Ищем все ссылки на странице и сохраняем в переменной links в виде списка
print(len(links)) # Выводим количество найденных ссылок

936


In [41]:
print([link.text for link in links[500:510]]) # Выводим ссылки с 500 по 509 включительно
print([link.text for link in links[0:10]]) # Выводим ссылки с 1 по 9 включительно

['Opal', 'Open Programming Language', 'OpenCL', 'OpenEdge Advanced Business Language', 'OpenVera', 'OPS5', 'OptimJ', 'Orc', 'ORCA/Modula-2', 'Oriel']
['', 'Jump to navigation', 'Jump to search', 'Programming languagelists', 'Alphabetical', 'Categorical', 'Chronological', 'Generational', 'v', 't']


### Работа с API