# Занятие 1: HTTP-запросы, JSON, API.

## HTTP запросы

### Что такое HTTP запросы?

Протокол HTTP предназначен для передачи данных. Именно он используется браузером, если нужно посмотреть мемы, видосики и все такое. Мы же можем его использовать чтобы получить или отправить какие-то данные с или на сервер.

Обмен сообщениями между сервером и клиентом проиходит по принципу "запрос-ответ". Клиент совершает некий запрос и получает на него ответ сервера.

Структура HTTP запроса:

Строка запроса – указывает метод передачи, URL-адрес, к которому нужно обратиться и версию протокола HTTP

Заголовки – описывают тело сообщений, передают различные параметры и др. сведения и информацию

Тут пустая строка в качестве разделителя.

Тело сообщения  — это сами данные, которые передаются в запросе.  Тело сообщения – это необязательный параметр и может отсутствовать

Например, если мы хотим получить статью википеди про http, то наш браузер сделает следующий запрос:
    
    GET /wiki/HTTP HTTP/1.1
    Host: ru.wikipedia.org
    User-Agent: Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9b5) Gecko/2008050509 Firefox/3.0b5
    Accept: text/html
    Connection: close
    (пустая строка)  
        
Первые 2 строки это строка запроса, все оставшиеся - заголовки. В этом запросе отсутствует тело.
Ответ на этот запрос будет следующий:

    HTTP/1.1 200 OK
    Date: Wed, 11 Feb 2009 11:20:59 GMT
    Server: Apache
    X-Powered-By: PHP/5.2.4-2ubuntu5wm1
    Last-Modified: Wed, 11 Feb 2009 11:20:59 GMT
    Content-Language: ru
    Content-Type: text/html; charset=utf-8
    Content-Length: 1234
    Connection: close
    (пустая строка)
    (запрошенная страница в HTML)

### На питоне

На мой взгляд, все, что сверху, выглядит, мягко говоря, сложновато.

Во-первых, вместо всего этого можно писать только URL.

Во-вторых, на питоне такие запросы будут выглядеть гораздо более удобно.

In [None]:
# импортируем библиотеку, с помощью которой будем делать запросы
# если у вас нет библиотеки, установите её вот этой строчкой:
# !pip install requests
import requests 

In [None]:
# GET-запрос просто получает html-код странички

responce = requests.get(url="http://sereja.me")
print(responce.text)

In [None]:
print(responce.status_code)

Код 200 - это редкий случай, когда запрос произошел успешно. Этот код может быть равен [разным](https://http.cat/) значениям. Например, 404 - это когда запрос не успешен из-за отсутствия запрашиваемого ресурса.

### Еще примеры
Напишем функцию, которая принимает дату, и скачивает сырую страницу, на которой есть все футбольные матчи в этот день.

In [None]:
def extract_footbal_matches_html(year, month, day):
    url = 'https://www.sports.ru/football/match/{}-{}-{}/'.format(year, month, day)
    response = requests.get(url)
    return response.text

extract_footbal_matches_html(2009, 4, 21)

Напишем функцию, которая получает страничку с информацией про место, к которому привязано IP.

In [None]:
def extract_by_IP_html(IP):
    url = 'https://ipapi.co/{}/'.format(IP)
    response = requests.get(url)
    return response.text

extract_by_IP_html('91.134.227.240')

### Попробуйте сами
Выберите сайт и посмотрите как он выглядит в виде html-кода

### HTTP методы

![get vs post](https://i.ibb.co/mvPrFPs/getpost.jpg)

Чаще всего запрос - это метод GET или метод POST. Обычно GET - это запрос без изменения данных, а POST - это запрос с изменениями.

Мы пока делали только GET-запросы, именно они скачивают код страницы (на самом деле просто ваш браузер как код страницы воспринимает ровно то, что вернул GET-запрос).


### POST
Применяется для передачи пользовательских данных заданному ресурсу. Например, в блогах посетители обычно могут вводить свои комментарии к записям в HTML-форму, после чего они передаются серверу методом POST и он помещает их на страницу. При этом передаваемые данные (в примере с блогами — текст комментария) включаются в тело запроса. Аналогично с помощью метода POST обычно загружаются файлы на сервер.

Часто пост-запрос просто заполняет форму на сайте. Посмотрим на пример пост-запроса, который заполняют форму авторизации на сайте informatics, например.

In [None]:
# сделать POST запрос с помощью библиотеки requests тоже просто

# вставьте сюда свои логин и пароль
DATA = {'username' : '...',
        'password' : '...'}

url = "https://informatics.mccme.ru/login/index.php"
r = requests.post(url, DATA)
html = r.text

print(html)

## JSON вместо HTML

![JSON Statham](https://pics.me.me/json-statha-meanwhile-43613192.png)

Заметьте, что если бы вы хотели извлечь все матчи из sports.ru за какой-то день, то вам пришлось бы сидеть и парсить огромный HTML-код, то есть научиться извлекать полезную и нужную вам информацию (список матчей, их времени, участников и итогог счета, например). Иногда приходится так делать, и этим мы скорее всего и займемся на следующем занятии.

Но многие сервисы знают, что ими пользуются не только пользователи через интерфейс, но и скрипты. И упрощают для них работу. А именно, создают специальный формат URL, на запрос по которому вместо html-кода выдается строка с данными в удобном формате, которую не надо сложно парсить.

Например, сайт ipapi.co называется так не случайно. Он умеет не только красиво показывать данные в интерфейсе по адресу [ipapi.co/91.134.227.240/](http://ipapi.co/91.134.227.240/), но и возвращать только полезную информацию в формате JSON по адресу [ipapi.co/91.134.227.240/json](https://ipapi.co/91.134.227.240/json)

In [None]:
def extract_by_ip_json(ip):
    url = 'https://ipapi.co/{}/json'.format(ip)
    response = requests.get(url)
    return response.text

print(extract_by_ip_json('91.134.227.240'))

Согласитесь, что это гораздо более легко обрабатываемая строчка, чем огромный html-код :) Этот формат называется и называется JSON.

### Более подробно про JSON
[JSON](https://ru.wikipedia.org/wiki/JSON) - это очень удобный универсальный формат данных, состоящий из списков, словарей, строчек, чисел, true, false и null-ов. Причем списки и словари могут быть любой вложенности: это может быть словарь, где значениями являются другие словари, в некоторых из которых значениями являются списки словарей и так далее.

Перевод питоновских словарей/списков в json и обратно умеет делать библиотека json.

In [None]:
# если у вас нет библиотеки, установите её вот этой строчкой:
# !pip install json
import json

### Функция json.loads
loads = load string, принимает на вход строку, возвращает данные

In [None]:
s = extract_by_ip_json('91.134.227.240')
data = json.loads(s)
data

In [None]:
# это обычный словарь
print(data['longitude'], data['latitude'])
print(data['country_name'])
print(data['city'])

### Функция json.dumps
dumps = dump string, принимает на вход данные, возращает строку

In [None]:
s = json.dumps(data)
print(s)

### Работа с файлами
Те же функции, но без s (то есть load и dump) - вместо превращения из/в строку считывают/записывают из файла.

In [None]:
# dump
with open('ip.json', 'w') as f:
    json.dump(data, f)

In [None]:
# load
with open('ip.json', 'r') as f:
    data = json.load(f)
print(data['region'])

### Примеры
Давайте напишем функцию, которая по IP возвращает название города.

In [None]:
# Первый способ
# Сделаем то же самое

def extract_by_ip_json(ip):
    url = 'https://ipapi.co/{}/json'.format(ip)
    response = requests.get(url)
    return json.loads(response.text)

def extract_city_by_ip_1(ip):
    data = extract_by_ip_json(ip)
    return data['city']

print(extract_city_by_ip_1('91.134.227.240'))

In [None]:
# Второй способ
# Заметим в описании сайта (https://ipapi.co/#api),
# что можно делать запросы сразу про название города

def extract_city_by_ip_2(ip):
    url = 'https://ipapi.co/{}/city'.format(ip)
    response = requests.get(url)
    return response.text

print(extract_city_by_ip_2('91.134.227.240'))

## API

![API](https://static.consolia-comic.com/comics/what-is-an-api.png)

Такой http-интерфейс для общения с сервисом называется API. Сайтов, которые их предоставляют, очень много. Как и на [ipapi.co/#api](https://ipapi.co/#api), на них всегда есть страничка с документацией, объясняющая, на какие запросы умеет отвечать сервис, и в каком формате делать такие запросы.

[Список сервисов с API 1](https://www.programmableweb.com/apis/directory)

[Список сервисов с API 2](https://github.com/public-apis/public-apis/blob/master/README.md) (тут отмечены те, в которых не нужна авторизация).

[Список сервисов с API 3](https://shkspr.mobi/blog/2016/05/easy-apis-without-authentication/) (только те, в которых не была нужна авторизация на момент публикации)

![front vs back](https://i.imgur.com/cNECvO3.png)

### Задание
* Найдите всех героев Dota 2, у которых больше двух ног.

* Выведите для каждого его имя

* А также имя того героя, против которого у этого героя самый высокий процент побед в последнее время, если учитывать только героев, против которого он сыграл хотя бы 20 матчей.

In [None]:
# Решение, надо будет удалить перед занятием
all_heroes = json.loads(requests.get('https://api.opendota.com/api/heroes').text)

heroes = [x for x in all_heroes if x['legs'] > 2]

id_to_name = {hero['id']: hero['localized_name'] for hero in all_heroes}

for hero in heroes:
    url = 'https://api.opendota.com/api/heroes/{}/matchups'.format(hero['id'])
    data = json.loads(requests.get(url).text)
    winrates = [(x['wins'] / x['games_played'], id_to_name[x['hero_id']]) for x in data if x['games_played'] >= 20]
    if winrates:
        max_winrate, max_hero = max(winrates)
        print('{} wins {} with {} rate'.format(hero['localized_name'], max_hero, max_winrate))

### API с авторизацией

![api key](https://pics.me.me/api-locksmiths-131-key-24-7-service-alarms-alarm-monitoring-37101506.png)

На самом деле API, которые мы показывали (ipapi и opendota) - очень редкий случай, когда сервис не запрашивает авторизацию. В opendata, кстати, есть авторизация, и она увеличивает лимит на число запросов в месяц по сравнению с обычными запросами.

Но практически у всех больших сервисов (типа Google, Telegram, Twitter) взаимодействие с API происходит с помощью авторизации.

Авторизация преследует много разных целей, и у нее есть много разных реализаций. Но в целом она выглядит так: тебе как пользователю сервиса (например, гугла), выдается личный **токен** по твоему запросу (обычно даже несколько токенов). Это просто длинная строка, которую ты прикладываешь к запросу, чтобы сервис знал, кто его послал.

Так можно отслеживать тех, кто злоупотребляет запросами и посылает их слишком много, а главное - с токеном ты можешь получить доступ к данным своего пользователя. Например, можно скачать всю свою переписку в VK, или даже посылать сообщения в VK через скрипты.

Давайте попробуем подключиться по API, например, к Яндекс.Переводчику.

* Получите токен [тут](https://translate.yandex.ru/developers/keys)
* Сохраните его в переменную
* Запустите код

In [None]:
YANDEX_TRANSLATE_TOKEN = ''

def get_all_langs():
    url = 'https://translate.yandex.net/api/v1.5/tr.json/getLangs?key={}&ui=ru'.format(YANDEX_TRANSLATE_TOKEN)
    return json.loads(requests.get(url).text)

langs = get_all_langs()
langs['langs']

In [None]:
def translate_sentence(sentence):
    url = 'https://translate.yandex.net/api/v1.5/tr.json/translate?key={}&lang=en-ru&text={}'.format(YANDEX_TRANSLATE_TOKEN,
                                                                                                     sentence)
    return json.loads(requests.get(url).text)['text']

translate_sentence('Somebody once told me the world is gonna roll me.')

Заметьте, какой длинный получается URL! И всё из-за параметров запроса вида key1=value1&key2=value2&... На самом деле в функцию requests.get можно передать URL без параметров, а сами параметры перечислить в отдельном аргументе-словаре, это намного красивее (и мы так делали, когда посылали POST-запрос).

In [None]:
def translate_sentence(sentence):
    url = 'https://translate.yandex.net/api/v1.5/tr.json/translate'
    params = {'key': YANDEX_TRANSLATE_TOKEN,
              'lang': 'en-ru',
              'text': sentence} 
    return json.loads(requests.get(url, params).text)['text']

translate_sentence('Somebody once told me the world is gonna roll me.')

### Задание
Напишите функцию, которая по названию города находит текущую температуру в нем.

* Зарегистрируйтесь на сайте https://home.openweathermap.org/users/sign_up
* Найдите свой токен вот здесь https://home.openweathermap.org/api_keys
* Вставьте токен в переменную
* Почитайте документацию, чтобы понять, как пользоваться API https://openweathermap.org/current
* Напишите функцию, которая выводит текущую погоду в заданном городе
* Возможно, надо подождать немного, чтобы ключ начал работать

In [None]:
OPENWEATHER_TOKEN = '...'

In [None]:
# Решение надо удалить

T = 273.15

def extract_city_temperature(city):
    data = {
        'appid': OPENWEATHER_TOKEN,
        'q': city,
    }
    city_data = json.loads(requests.get('https://api.openweathermap.org/data/2.5/weather', data).text)
    return city_data['main']['temp'] - T

In [None]:
extract_city_temperature('Moscow')

In [None]:
extract_city_temperature('Madrid')

In [None]:
extract_city_temperature('Murmansk')

In [None]:
extract_city_temperature('New York')

## API  через библиотеку

И наконец последняя стадия развития человечества: авторизация на такие сайты настолько сложная, а запросы настолько длинные и непонятные, что люди пишут целые небольшие библиотеки, в которых уже реализованы все функции, делающие http-запросы. Практически у всех крупных компаний (Гугл, Фейсбук, Телеграм) есть такие библиотеки.

In [None]:
# ...
# ...
# ... TO BE CONTINUED
# ...
# ...
# ...
# ...
# ...
# ...
# ...

### Замечание про то, как хранить токены и пароли

In [None]:
# ...
# ...
# ... TO BE CONTINUED
# ...
# ...
# ...
# ...
# ...
# ...
# ...

### Сцена после титров
![мем1](https://media.giphy.com/media/fxesWuvpUdKClpRoD4/giphy.gif)
Меня очень просили вставить сюда эту гифку, но я не знаю как она связана с занятием.