**API** (Application programming interface) — это набор публичных свойств и методов для взаимодействия с другими программами, которые могут быть написаны даже на другом языке программирования.

Нам пришло в ответ нечто, не похожее на веб-страницу, с тремя случайными текстами.

Давайте теперь попробуем прочитать эти же тексты, но не через браузер, а через наш Python-скрипт с помощью библиотеки Requests. Для этого отправим гет-запрос:

In [1]:
import requests
 
url = 'https://baconipsum.com/api/?type=all-meat&paras=3&start-with-lorem=1&format=html'
r = requests.get(url) # делаем запрос на сервер по переданному адресу
print(r.content)

b'<p>Bacon ipsum dolor amet shankle brisket beef ribs flank, filet mignon cow short loin.  Cow tail bacon pork loin, meatball pastrami t-bone sausage burgdoggen beef ribs salami.  Beef ribs ribeye turducken pork.  Ribeye leberkas bacon, turducken capicola beef ribs meatball tongue spare ribs hamburger fatback jerky chislic pig biltong.  Meatball chuck ham hock ball tip brisket flank burgdoggen drumstick pork chop boudin chislic jowl sirloin fatback.  Shoulder ribeye brisket swine filet mignon.</p>\n<p>Flank cow shank brisket short ribs biltong swine, doner kevin.  Beef ribs ham brisket meatball picanha.  Sausage sirloin filet mignon, buffalo chicken corned beef pork loin pork chop biltong pastrami kevin beef ribs burgdoggen landjaeger pancetta.  Buffalo short ribs spare ribs tenderloin pastrami fatback.  Biltong tenderloin alcatra filet mignon pork chop leberkas bacon flank ham beef ribs porchetta corned beef short loin pork belly.  Swine shankle porchetta pig rump tri-tip.</p>\n<p>Fat

Как вы заметили, чтобы получить содержание ответа, надо обратится к полю `content` объекта `response`, который возвращается, когда приходит ответ от сервера через библиотеку *Requests*. У этого объекта на самом деле есть много полей, например, `status_code`, который говорит нам о том, какой вообще ответ пришёл. Давайте поменяем наш код и посмотрим, что программа выведет теперь.

In [2]:
import requests
 
url = 'https://baconipsum.com/api/?type=all-meat&paras=3&start-with-lorem=1&format=html'
r = requests.get(url) # делаем запрос на сервер по переданному адресу
print(r.status_code) # узнаем статус полученного ответа

200


Есть несколько категорий ответов, например:

- 200, 201, 202 и т. д. — ответы, которые говорят, что с запросом всё хорошо, и ответ приходит правильный, т. е. его можно обрабатывать и как-либо взаимодействовать с ним. На самом деле почти все сервера всегда в ответ шлют именно ответ 200, а не какой-либо другой из этой же категории.
- 300, 301 и т. д. — ответы, которые говорят, что вы будете перенаправлены на другой ресурс (не обязательно на этом же сервере).
- 400, 401 и т. д. — ответы, которые говорят, что что-то неправильно с запросом. Запрашивается либо несуществующая страница (всем известная 404 ошибка), либо же недостаточно прав для просмотра страницы (403) т. д.
- 501, 502 и т. д. — ответы, которые говорят, что с запросом всё хорошо, но вот на сервере что-то сломалось, и поэтому нормальный ответ прийти не может.

Более подробно со всеми типами ответов можно ознакомиться здесь.
<hr>
Информацию с сайта мы можем получать не только в виде HTML, но и формате JSON.

*JSON* переводится как *JavaScriptObjectNotation*.

Это определённый тип ответов от сервера, который уже содержит только нужную нам информацию, без всяких *HTML*-кодов. По сути своей *JSON* очень похож на структуры данных в *Python* (словари и списки), но, на самом деле, его изначальной целью было сохранять состояние объектов языка *JavaScript* (как нетрудно было догадаться из названия). Давайте посмотрим на *JSON*-ответ, присланный нам с того же самого ресурса. Попробуем с помощью той же библиотеки Requests обращаться по [адресу](https://baconipsum.com/api/?type=meat-and-filler).

In [4]:
import requests

url = 'https://baconipsum.com/api/?type=meat-and-filler'
r = requests.get(url) # попробуем поймать json ответ
print(r.content)

b'["Elit deserunt duis, t-bone mollit boudin corned beef shoulder leberkas jerky frankfurter.  Strip steak excepteur ullamco nulla pancetta.  Bacon ham hock flank velit aliqua.  Nisi bacon occaecat chuck eiusmod in tail tri-tip chicken non frankfurter turducken swine shank leberkas.","Elit anim dolor, sed cupidatat ribeye sausage hamburger dolore pork chop porchetta ball tip ut salami duis.  Burgdoggen quis pancetta pork occaecat.  Veniam tempor ad cupidatat bacon.  Beef aute sint venison chislic aliquip.  Corned beef andouille nisi culpa, ut jowl aliquip.  Anim ullamco in, cow cupim drumstick fatback eiusmod qui landjaeger biltong voluptate prosciutto rump enim.  Tail exercitation nulla filet mignon esse kielbasa sausage shankle short ribs.","Laborum short loin ball tip deserunt veniam ex, bacon meatball.  Burgdoggen qui consectetur ham hock cupim.  Dolor hamburger consequat ut, landjaeger shankle eiusmod drumstick ex pariatur commodo beef ribs beef esse turkey.  Ground round velit te

Если приглядеться, то здесь можно увидеть нечто похожее на список в *Python*. Однако, чтобы использовать полученный ответ как *Python*-объект, надо воспользоваться дополнительной библиотекой, которая упрощает работу с *JSON*-ответами и может легко переконвертировать ответ от сервера в *Python*-объекты, с которыми удобно работать. Давайте поменяем наш код и превратим данный текст в список, на который он так сильно похож.

In [5]:
import requests
import json # импортируем необходимую библиотеку
 
url = 'https://baconipsum.com/api/?type=meat-and-filler'
r = requests.get(url)
texts = json.loads(r.content) # делаем из полученных байтов python объект для удобной работы
print(type(texts)) # проверяем тип сконвертированных данных
 
for text in texts: # выводим полученный текст. Но для того чтобы он влез в консоль оставим только первые 50 символов.
    print(text[:50], '\n')

<class 'list'>
T-bone ham hock ground round fugiat, id in salami  

Short ribs minim ham hock dolore mollit pig kielba 

Cupidatat ground round reprehenderit ribeye nulla  

In do magna duis shank, ham hock porchetta jerky f 

Alcatra kielbasa proident flank fatback biltong in 



Теперь мы сделали ответ от сервера списком — структурой данных *Python*, с которой гораздо приятнее работать, чем просто с байтами.

Давайте посмотрим теперь на ещё один тип возвращаемых значений. Он тоже будет *JSON*, но в данном случае он, скорее, будет похож на словарь.

В консоли мы увидим структуру, похожую на словарь. Дело в том, что это не совсем словарь. *JavaScriptObjectNotation* (он же *JSON*) — правило записи *js*-объектов в файл, чтобы сохранять их состояния и затем загружать обратно в программу. В модуле *JSON*, а конкретно, в функции `loads` за нас уже заранее обо всём позаботились. В зависимости от вида полученного, *JSON*-функция сама будет обрабатывать его и возвращать нужный нам объект (список или словарь). Подробнее о самой нотации можно почитать вот здесь.

Но хватит лирики. Давайте всё же теперь сделаем его настоящим словарём.

In [8]:
import requests
import json
 
url = 'https://api.github.com'
r = requests.get(url)
d = json.loads(r.content) # делаем из полученных байтов python объект для удобной работы
 
print(type(d))
print(d['following_url']) # обращаемся к полученному объекту как к словарю и попробуем напечатать одно из его значений

<class 'dict'>
https://api.github.com/user/following{/target}


Таким образом мы можем удобно превращать данные, полученные из ответа *JSON*, в объекты структур данных *Python* с помощью библиотеки *JSON*, и удобно работать с ними. В следующем юните разберём более подробно получение данных из больших *HTML* с помощью специальных библиотек для парсинга.

Как вы могли заметить, здесь мы использовали только *get*-запросы (применяли функцию `.get()` из библиотеки *requests*). Однако одним из наиболее распространённых запросов, помимо get , является post-запрос. Если же get используется, как правило, для получения данных (например, *JSON*-ответ или *HTML*-код для браузера, как мы уже увидели), то при помощи *post*-запросов отправляются данные для обработки на сервер. Например, чаще всего вместе с post-запросом используются параметры (*data*) для записи каких-либо новых данных в базу данных.

Давайте попробуем отправить post-запрос. Здесь мы видим, что запрос отправлен с помощью *Python*-requests и нашей операционной системы (*"User-Agent": "Python-requests/2.7.0 CPython/3.6.6 Windows/10"*),  а также, приглядевшись, мы можем увидеть и наши параметры (строчка: *"form": {\n "key": "value"\n }* ). Обратите внимание, что здесь тип отправляемых нами данных указан как *FORM*, но многие *API*, однако, требуют тип *JSON* в качестве отправляемых данных.

Давайте посмотрим, как с помощью уже знакомой нам библиотеки отправить данные в нужном нам формате:

In [10]:
import requests
import json

data = {'key': 'value'}
r = requests.post('https://httpbin.org/post', json=json.dumps(data)) # отправляем пост запрос
print(r.content) # содержимое ответа и его обработка происходит так же, как и с гет-запросами, разницы никакой нет

b'{\n  "args": {}, \n  "data": "\\"{\\\\\\"key\\\\\\": \\\\\\"value\\\\\\"}\\"", \n  "files": {}, \n  "form": {}, \n  "headers": {\n    "Accept": "*/*", \n    "Accept-Encoding": "gzip, deflate", \n    "Content-Length": "22", \n    "Content-Type": "application/json", \n    "Host": "httpbin.org", \n    "User-Agent": "python-requests/2.28.1", \n    "X-Amzn-Trace-Id": "Root=1-6324590e-1df1a87f7240fee964695dd4"\n  }, \n  "json": "{\\"key\\": \\"value\\"}", \n  "origin": "46.138.138.117", \n  "url": "https://httpbin.org/post"\n}\n'


Здесь нас интересует строчка: *"JSON": "{\\"key\\": \\"value\\"}"* . Из неё мы можем понять, что тип отправленных нами данных был именно *JSON*. Поле *FORM*  теперь пустое, что означает: напрямую никаких данных мы не передавали.

## Задание 18.2.3

Напишите программу, которая отправляет запрос на генерацию случайных текстов (используйте этот [сервис](https://baconipsum.com/api/?type=meat-and-filler)). Выведите первый из сгенерированных текстов.

In [11]:
import requests
import json

url = 'https://baconipsum.com/api/?type=meat-and-filler'
r = requests.get(url)
d = json.loads(r.content)

print(d[0])

Sirloin ham hock laboris cow, voluptate filet mignon quis minim cupidatat landjaeger leberkas bresaola esse pariatur shoulder.  Ut laboris spare ribs pastrami.  Kielbasa ham veniam bresaola in chicken hamburger consequat, proident shank beef ribs.  Commodo eu ea, tenderloin short ribs irure pig in sausage.  Elit flank anim cupidatat, spare ribs non ut pork belly.  Burgdoggen capicola tri-tip qui chuck consequat andouille bacon.  Meatball pork loin mollit hamburger rump.


## Парсинг сайтов на примере Python.org
В сегодняшнем юните научимся писать простенькие парсеры.

**Парсеры** — это специальные программы, которые позволяют собирать информацию с веб-сайтов, не заходя на них через браузер. Т. е., например, если вы захотели составить базу данных товара какого-либо интернет-магазина, то вам не обязательно перемещаться по нему и вручную отбирать все названия, фото товара и ссылки на сам товар. Для этого достаточно написать парсер, который по определённым отличительным признакам в HTML-коде (как правило, это классы или id) будет находить вам нужную информацию.

Конкретно в этом туториале мы будем пользоваться библиотекой lxml для парсинга данных. Но перед тем, как писать парсеры, предлагаю посмотреть вам небольшое вступление для лучшего понимания того, с чем будем иметь дело.

In [47]:
import requests # импортируем наш знакомый модуль
import lxml.html
from lxml import etree
 

# get the web page content
html = requests.get('https://www.python.org/').content

# getting elements tree
tree = lxml.html.document_fromstring(html)
title = tree.xpath('/html/head/title/text()')
# getting elements in news section
news = tree.findall('body/div/div[3]/div/section/div[2]/div[1]/div/ul/li')

print(title) # выводим полученный заголовок страницы
for li in news: # getting each news element
    if li is news[0]: # print title for the 1st element
        print('datetime\tNews header')
    d = li.find('time')
    a = li.find('a')
    print(d.get('datetime')[:10], a.text, sep='\t')

['Welcome to Python.org']
datetime	News header
2022-09-12	Python 3.11.0rc2 is now available
2022-09-07	Python releases 3.10.7, 3.9.14, 3.8.14, and 3.7.14 are now available
2022-08-08	Python 3.11.0rc1 is now available
2022-08-02	Python 3.10.6 is available
2022-07-26	Python 3.11.0b5 is now available


## Задание 18.4.4
Напишите программу, которая будет с помощью парсера lxml доставать текст из тега tag2 следующего HTML:

In [45]:
import lxml.html
from lxml import etree

s = '''<html>
 <head> <title> Some title </title> </head>
 <body>
  <tag1> some text
     <tag2> MY TEXT </tag2>
   </tag1>
 </body>
</html>'''

tree = lxml.html.document_fromstring(s)
txt = tree.xpath('/html/body/tag1/tag2/text()') 

print(*txt, sep='\n')

 MY TEXT 


## 18.5 Кэширование с помощью Redis
Теперь давайте попробуем записать данные в кэш. Для этого используется метод .get(<название переменной для кэширования>, <значение переменной в виде строки>).

In [2]:
import redis 

red = redis.Redis(
    host='localhost',
    port=6379,
    password='RdabtP22'
)

red.set('key1', 'value1') # записываем в кеш строку "value1"
print(red.get('key1')) # считываем из кэша данные

b'value1'


Давайте теперь попробуем записать в кэш что-нибудь посложнее, например, словарь.

In [8]:
import redis
import json # так-так-так, кто это тут у нас? Наш старый друг Джейсон заглянул на огонёк! Ну привет, чем ты сегодня нас порадуешь?

red = redis.Redis(
    host='localhost',
    port=6379,
    password='RdabtP22'
)
 
dict1 = {'key1': 'value1', 'key2': 'value2'} # создаём словарь для записи
red.set('dict1', json.dumps(dict1)) # с помощью функции dumps() из модуля json превратим наш словарь в строчку
converted_dict = json.loads(red.get('dict1')) # с помощью знакомой нам функции превращаем данные полученные из кэша обратно в словарь
print(type(converted_dict)) # убеждаемся, что получили действительно словарь
print(converted_dict) # ну и выводим его содержание

<class 'dict'>
{'key1': 'value1', 'key2': 'value2'}


Ну и, наконец, давайте научимся удалять данные из кэша по ключу. Это делается совсем просто.

In [9]:
import redis

red = redis.Redis(
    host='localhost',
    port=6379,
    password='RdabtP22'
)

red.delete('dict1') # удаляются ключи с помощью метода .delete()
print(red.get('dict1'))

None


Как итог мы видим, что вывелось *None*. Т. е. ключа, который мы добавили, больше нет.

## Задание 18.5.4
Напишите программу, которая будет записывать и кэшировать номера ваших друзей. Программа должна уметь воспринимать несколько команд: записать номер, показать номер друга в консоли при вводе имени или же удалить номер друга по имени. Кэширование надо производить с помощью Redis. Ввод и вывод информации должен быть реализован через консоль (с помощью функций `input()` и `print()`).

In [95]:
import json
import redis

host = 'localhost'
port = 6379
the_key = 'friends18'
pw = 'RdabtP22'
my_ver = '1.0'


def get_friends(name = None) -> dict:
    # create connection to Redis database
    red = redis.Redis(host = host, port = port, password = pw)
    # get friends from DB
    try:
        friends = json.loads(red.get(the_key))
    except (TypeError, json.JSONDecodeError):
        friends = {} # if key doesn't exist or is empty, create an empty dict
    except Exception as e:
        print(type(e), 'occured:')
        print(e)
        friends = {}

    # find friends matching name
    if name and friends:
        friends = get_correct_friend_name(name, friends)

    # print list of friends
    if friends:
        print('  Found friends:')
    elif name:
        print(f'  No friends matching {cmd} found')
    else:
        print('  No friends found')
    i = 1
    for f in friends:
        print(f'  {i}) {f} has phone {friends[f]}')
        i += 1

    return friends


def save_friends(new_friends: dict, merge = False):
    # create connection to Redis database
    red = redis.Redis(host = host, port = port, password = pw)
    if merge:
        # get friends from DB
    # get friends from DB
        try:
            friends = json.loads(red.get(the_key))
        except (TypeError, json.JSONDecodeError):
            friends = {} # if key doesn't exist or is empty, create an empty dict
        except Exception as e:
            print(type(e), 'occured:')
            print(e)
            friends = {}
#             pass # if key doesn't exist or is empty, do not merge
        else:
            new_friends = new_friends | friends
    # save friends
    red.set(the_key, json.dumps(new_friends))


def get_correct_friend_name(name: str, friends: dict) -> list:
    names = {}
    for f in friends.keys():
        if f.lower() == name.lower():
            names[f] = friends[f]
    return names


def add_friend(name, phone: None):
    save_friends({name: phone}, merge=True)


def pop_friends(names):
    friends = get_friends()
    for f in names:
        friends.pop(f)
        print(f'  - friend {f} deleted.')
    save_friends(friends)


print(f'Friends database {my_ver} at your service')
cmd = input('Please type command or friend\'s name: ')
while True:
    if not cmd:
        print('  Please type a command. Use \'help\' or \'?\' for instructions.')
    elif cmd.lower() in ['help', '?', 'рудз']:
        print('  Please type friend\'s name or one of the followind commands (without quotes):')
        print('  - \'list\' if you want to see all friends')
        print('  - \'exit\' or \'quit\' to terminate the program')
        print('  In case you need to remove a record, find friend and press \'Enter\' for the new name and phone.')
    elif cmd.lower() in ['quit', 'exit', 'stop', 'учше', 'йгше', 'ыещз']:
        print('  Goodbye.')
        break
    else:
        if cmd.lower() in ['list', 'дшые']:
            friends = get_friends()
            cmd = ''
        else:
            friends = get_friends(cmd)
        if len(friends) > 1:
            cmd = input(f'  Which user do you want to work with? (enter numbers 1..{len(friends)}): ')
            if cmd and cmd.isdigit() and 0 <= (int(cmd) - 1) < len(friends):
                friends = {list(friends.keys())[int(cmd) - 1]: friends[list(friends.keys())[int(cmd) - 1]]}
            else:
                friends = {}
        elif len(friends) > 0:
            if input(f'  Do you want to work with {list(friends.keys())[0]}? (Y / N): ').lower() not in ['y', 'yes', '1', 'да']:
                friends = {}
        if len(friends) > 0:
            name = input('  Please type new name or hit \'Enter\' to not change it: ')
            phone = input('  Please type new phone or hit \'Enter\' to not change it: ')
            if not (name or phone):
                print('  WARNING: the following friends will be completely deleted:')
                for f in friends:
                    print('  -', f, 'with phone', friends[f])
                cmd = input('  Please type \'[Y]es\' or \'1\' to confirm frend\'s deletion:')
                if cmd.lower() in ['yes', 'y', 'да', '1']:
                    pop_friends(friends.keys())
                else:
                    print('  Deletion aborted.')
            elif len(friends) == 1:
                if not name:
                    name = list(friends.keys())[0]
                if not phone:
                    phone = fiends[list(friends.keys())[0]]
                pop_friends([list(friends.keys())[0]])
                add_friend(name, phone)
            else:
                cmd = input('  Please enter the number of friend to change or remove: ')
                if cmd.isdigit() and int(cmd) <= len(friends):
                    cmd = int(cmd) - 1 # the index of friend
                    name = input('  Please type new name or hit \'Enter\' to not change it: ')
                    phone = input('  Please type new phone or hit \'Enter\' to not change it: ')
                    if phone and (not name or name == list(friends.keys())[i]):
                        friends[list(friends.keys())[cmd]] = phone
                    if name:
                        if not phone:
                            phone = friends[friend.keys()[cmd]]
                        pop_friends([list(friends.keys())[cmd]])
                        add_friend(name, phone)
                    elif not phone:
                        print('  The following friends will be completely deleted:')
                        print(f'  - {list(friends.keys())[cmd]} with phone: {friends[list(friends.keys())[cmd]]}')
                        cmd = input('  Please type \'[Y]es\' or \'1\' to confirm frend\'s deletion:')
                        if cmd.lower() in ['yes', 'y', 'да', '1']:
                            pop_friends(friends.keys())
                else:
                    print('  Operation aborted.')
            cmd = 'list' # change command to not be empty
        elif cmd:
            if input('  Do you want to add friend ' + cmd + '? - press \'1\' or \'[Y]es\': ').lower() in ['1', 'y', 'yes', 'да', 'д']:
                phone = input('  Please type new phone or hit \'Enter\' to not change it: ')
                if not phone:
                    print('  Phone is empty. Operation aborted.')
                else:
                    add_friend(cmd, phone)
                    print(f'  Friend \'{cmd}\' with phone \'{phone}\' added.')

    cmd = input('Please type command or friend\'s name: ')


Friends database 1.0 at your service
Please type command or friend's name: list
  Found friends:
  1) Марь Ивановна has phone 8 (888) 777-8888
  2) Иван Иваныч has phone +7 (999) 888-77-88
  Which user do you want to work with? (enter numbers 1..{len(friends)}): 
Please type command or friend's name: Семён Семёныч
  No friends matching Семён Семёныч found
  Do you want to add friend Семён Семёныч? - press '1' or '[Y]es': л
Please type command or friend's name: Семён Семёныч
  No friends matching Семён Семёныч found
  Do you want to add friend Семён Семёныч? - press '1' or '[Y]es': д
  Please type new phone or hit 'Enter' to not change it: 
  Phone is empty. Operation aborted.
Please type command or friend's name: учше
  Goodbye.


In [91]:
print(type(list({}.keys())))

<class 'list'>
