# Python и API: превосходное комбо для чтения общедоступных данных

Использование API — один из тех «магических» навыков, которые после освоения открывают целый мир новых возможностей, а Python — отличный инструмент, чтобы этими навыками овладеть.

Материал представляет собой сокращенный перевод публикации Педро Прегейру [Python & APIs: A Winning Combo for Reading Public Data](https://realpython.com/python-api/).

Многие ежеденвно используемые приложения и системы имеют свой API: от очень простых и обыденных вещей, таких как проверка погоды по утрам, до более захватывающих, вроде ваших лент Instagram, TikTok или Twitter. Во всех современных приложениях API-интерфейсы играют центральную роль.

В этой туториале мы детально рассмотрим:
- Что такое API
- Наиболее важные концепции, связанные с API
- Как использовать Python для чтения данных, доступных через общедоступные API

К концу этого руководства вы сможете использовать Python для большинства общедоступных API. Если вы разработчик, знание того, как использовать API-интерфейсы с Python, поможет в интеграции вашей работы со сторонними приложениями.

**Примечание**. В этом руководстве основное внимание уделяется тому, как *использовать* API-интерфейсы с помощью Python, но не их созданию. Для получения информации о создании API с помощью Python мы советуем обратиться к публикации [API REST Python с Flask, Connexion и SQLAlchemy](https://realpython.com/flask-connexion-rest-api/).


# Знакомство с API

Аббревиатура [API](https://ru.wikipedia.org/wiki/API) соответствует английскому application programming interface — программный интерфейс приложения. По сути, API действует как коммуникационный уровень или, как следует из названия, интерфейс, который позволяет различным системам взаимодействовать друг с другом без необходимости точно понимать, что делает каждая из систем.

API-интерфейсы могут иметь разные формы. Это может быть API операционной системы, используемый для таких действий, как включение камеры и аудио для присоединения к звонку Zoom. Или это могут быть веб-API, используемые для действий, ориентированных на веб, таких как лайки фотографий в Instagram или получение последних твитов.

Независимо от типа, все API-интерфейсы работают приблизительно одинаково. Обычно мы запрашиваем информацию или данные, а API возвращает ответ в соответствии с тем, что мы запросили. Например, каждый раз, когда мы открываем Twitter или прокручиваем ленту Instagram, приложение делает запрос к API и просто отображает ответ.

В этом руководстве мы подробно остановимся на высокоуровневых веб-API, которые обмениваются данными между сетями.


## SOAP vs REST vs GraphQL
В конце 1990-х и начале 2000-х годов две разные модели дизайна API стали нормой для публичного доступа к данным:
1. [SOAP](https://ru.wikipedia.org/wiki/SOAP) (Simple Object Access Protocol) обычно ассоциируется с корпоративным миром, имеет строгую систему на основе контрактов и в основном связано скорее с различными действиями, чем с данными.
2. [REST](https://ru.wikipedia.org/wiki/REST) (Representational State Transfer) обычно используется для общедоступных API и идеально подходит для получения данных из Интернета.

Сегодня распространение также получает GraphQL —  созданный Facebook гибкий язык API-запросов. Хотя GraphQL находится на подъеме и внедряется все более крупными компаниями, включая [GitHub](https://docs.github.com/en/free-pro-team@latest/graphql) и [Shopify](https://shopify.dev/docs/admin-api/graphql/reference),  большинство общедоступных API-интерфейсов это  REST API. Поэтому в рамках руководства мы ограничимся именно этим типом API и тем, как взаимодействовать с такими API с помощью Python.


## `requests` и API

При использовании API с Python вам понадобится всего одна библиотека: [`requests`](https://realpython.com/python-requests/). С её помощью вы сможете выполнять большую часть, если не все, действия, необходимые для использования любого общедоступного API.

Установить библиотеку можно любым удобным вам способом, например, с помощью pip:

In [4]:
!python3 -m pip install requests



Чтобы следовать примерам кода этого руководства, убедитесь, что вы используете Python не ниже 3.8 и версию библиотеки `requests` не ниже 2.22.0.


# Обращение к API с помощью Python

Достаточно разговоров — пора сделать первый вызов API! В первом примере мы вызовем популярный API для генерации случайных пользовательских данных. Единственное, что нужно знать для начала работы с API — по какому URL-адресу его вызывать. В этом примере мы используем URL-адрес https://randomuser.me/api/, и вот самый простой вызов API, с которого мы и начнем:

In [5]:
import requests
requests.get("https://randomuser.me/api/")

<Response [200]>

В этом небольшом примере мы импортируем библиотеку `requests`, а затем получаем данные от URL-адреса. Сейчас мы не видим никаких возвращенных данных, лишь результат запроса `Response [200]`, что в терминах API означает, что все прошло нормально.

Чтобы увидеть фактические данные, мы можем использовать для возвращенного объекта `Response` атрибут `.text`:

In [7]:
response = requests.get("https://randomuser.me/api/")
response.text

'{"results":[{"gender":"female","name":{"title":"Ms","first":"Emily","last":"Christensen"},"location":{"street":{"number":2421,"name":"Alleen"},"city":"Branderup J","state":"Hovedstaden","country":"Denmark","postcode":34325,"coordinates":{"latitude":"-29.3260","longitude":"77.7421"},"timezone":{"offset":"+11:00","description":"Magadan, Solomon Islands, New Caledonia"}},"email":"emily.christensen@example.com","login":{"uuid":"41ff3023-446e-4e53-ae16-170db361aa2f","username":"happycat505","password":"amazing","salt":"qz54voA6","md5":"202270b52b9fd79e0dc9f8bb984113f3","sha1":"97de6f059ec2b3f32fc6e200e7c529a615c18974","sha256":"50f045b7ae18fdb2b7ed733b8c8782eb4e65137bc4ac0dc3bf2fb90eed00ea66"},"dob":{"date":"1946-07-02T03:56:17.898Z","age":75},"registered":{"date":"2016-12-18T03:30:11.536Z","age":5},"phone":"24166194","cell":"45167730","id":{"name":"CPR","value":"020746-8732"},"picture":{"large":"https://randomuser.me/api/portraits/women/69.jpg","medium":"https://randomuser.me/api/portrait

## Конечные точки и ресурсы

Как вы видели выше, первое, что нужно знать для использования API, — это базовый URL-адрес API. Например, вот базовые URL-адреса для нескольких известных провайдеров API:

- https://api.twitter.com
- https://api.github.com
- https://api.stripe.com

Как видите, все перечисленные URL начинаются с `https:// api`. Не существует определенного стандарта, но чаще всего базовый URL следует этому шаблону.

Попытавшись открыть любую из приведенных ссылок, вы заметите, что большинство из них вернет ошибку или запросит учетные данные. Это связано с тем, что API-интерфейсы часто требуют аутентификации для определения прав доступа.

Сделаем запрос к интерфейсу TheDogAPI, аналогичный приведенному выше:

In [8]:
response = requests.get("https://api.thedogapi.com/")
response.text

'{"message":"The Dog API"}'

В этом случае при вызове базового URL-адреса мы получаем  сообщение, в котором говорится, что мы обратились к Dog API. Мы вызываем базовый URL, который используется для получения базовой информации об API, а не реальных данных.

Конечная точка (endpoint) — это часть URL-адреса, указывающая, какой ресурс мы хотим получить. Хорошо задокументированные API-интерфейсы обычно содержат справочник по API, описывающий определение точных конечных точек и ресурсов API, а также способов их использования.

Есть такой [справочник и у TheDogAPI](https://docs.thedogapi.com/api-reference). Попробуем обратиться к конечной точке, предоставляющей характеристики пород:

In [9]:
response = requests.get("https://api.thedogapi.com/v1/breeds")
response.text

'[{"weight":{"imperial":"6 - 13","metric":"3 - 6"},"height":{"imperial":"9 - 11.5","metric":"23 - 29"},"id":1,"name":"Affenpinscher","bred_for":"Small rodent hunting, lapdog","breed_group":"Toy","life_span":"10 - 12 years","temperament":"Stubborn, Curious, Playful, Adventurous, Active, Fun-loving","origin":"Germany, France","reference_image_id":"BJa4kxc4X","image":{"id":"BJa4kxc4X","width":1600,"height":1199,"url":"https://cdn2.thedogapi.com/images/BJa4kxc4X.jpg"}},{"weight":{"imperial":"50 - 60","metric":"23 - 27"},"height":{"imperial":"25 - 27","metric":"64 - 69"},"id":2,"name":"Afghan Hound","country_code":"AG","bred_for":"Coursing and hunting","breed_group":"Hound","life_span":"10 - 13 years","temperament":"Aloof, Clownish, Dignified, Independent, Happy","origin":"Afghanistan, Iran, Pakistan","reference_image_id":"hMyT4CDXR","image":{"id":"hMyT4CDXR","width":606,"height":380,"url":"https://cdn2.thedogapi.com/images/hMyT4CDXR.jpg"}},{"weight":{"imperial":"44 - 66","metric":"20 - 30"

Вуаля, мы получили список пород!

Если вы боьше любите кошек, аналогичный API есть и для мурлыкающих питомцев:

In [10]:
response = requests.get("https://api.thecatapi.com/v1/breeds")
response.text

'[{"weight":{"imperial":"7  -  10","metric":"3 - 5"},"id":"abys","name":"Abyssinian","cfa_url":"http://cfa.org/Breeds/BreedsAB/Abyssinian.aspx","vetstreet_url":"http://www.vetstreet.com/cats/abyssinian","vcahospitals_url":"https://vcahospitals.com/know-your-pet/cat-breeds/abyssinian","temperament":"Active, Energetic, Independent, Intelligent, Gentle","origin":"Egypt","country_codes":"EG","country_code":"EG","description":"The Abyssinian is easy to care for, and a joy to have in your home. They’re affectionate cats and love both people and other animals.","life_span":"14 - 15","indoor":0,"lap":1,"alt_names":"","adaptability":5,"affection_level":5,"child_friendly":3,"dog_friendly":4,"energy_level":5,"grooming":1,"health_issues":2,"intelligence":5,"shedding_level":2,"social_needs":5,"stranger_friendly":5,"vocalisation":1,"experimental":0,"hairless":0,"natural":1,"rare":0,"rex":0,"suppressed_tail":0,"short_legs":0,"wikipedia_url":"https://en.wikipedia.org/wiki/Abyssinian_(cat)","hypoallerg

Бьюсь об заклад, вы уже думаете о различных способах использования этих API для создания какого-нибудь симпатичного побочного проекта, и это самое замечательное в API. Когда вы начнете ими пользоваться, ничто не мешает вам превратить хобби или увлечение в небольшой веселый проект.


## Request и Response

Все взаимодействия между клиентом — в данном случае консолью Python и API — разделены на запрос (request) и ответ (response):

- `request` содержит данные запроса API, такие как базовый URL, конечную точку, используемый метод, заголовки и т. д.
- `response` содержит соответствующие данные, возвращаемые сервером, в том числе контент, код состояния и заголовки.

Снова используя TheDogAPI, мы можем немного подробнее рассмотреть, что именно находится внутри объектов `request` и `response`:

In [11]:
response = requests.get("https://api.thedogapi.com/v1/breeds")
response

<Response [200]>

In [14]:
request = response.request
request

<PreparedRequest [GET]>

In [15]:
request.url

'https://api.thedogapi.com/v1/breeds'

In [16]:
request.path_url

'/v1/breeds'

In [17]:
request.method

'GET'

In [18]:
request.headers

{'User-Agent': 'python-requests/2.22.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

In [19]:
response

<Response [200]>

In [20]:
response.text

'[{"weight":{"imperial":"6 - 13","metric":"3 - 6"},"height":{"imperial":"9 - 11.5","metric":"23 - 29"},"id":1,"name":"Affenpinscher","bred_for":"Small rodent hunting, lapdog","breed_group":"Toy","life_span":"10 - 12 years","temperament":"Stubborn, Curious, Playful, Adventurous, Active, Fun-loving","origin":"Germany, France","reference_image_id":"BJa4kxc4X","image":{"id":"BJa4kxc4X","width":1600,"height":1199,"url":"https://cdn2.thedogapi.com/images/BJa4kxc4X.jpg"}},{"weight":{"imperial":"50 - 60","metric":"23 - 27"},"height":{"imperial":"25 - 27","metric":"64 - 69"},"id":2,"name":"Afghan Hound","country_code":"AG","bred_for":"Coursing and hunting","breed_group":"Hound","life_span":"10 - 13 years","temperament":"Aloof, Clownish, Dignified, Independent, Happy","origin":"Afghanistan, Iran, Pakistan","reference_image_id":"hMyT4CDXR","image":{"id":"hMyT4CDXR","width":606,"height":380,"url":"https://cdn2.thedogapi.com/images/hMyT4CDXR.jpg"}},{"weight":{"imperial":"44 - 66","metric":"20 - 30"

In [21]:
response.status_code

200

In [22]:
response.headers

{'Access-Control-Expose-Headers': 'Pagination-Count, Pagination-Page, Pagination-Limit', 'Content-Encoding': 'gzip', 'Content-Type': 'application/json; charset=utf-8', 'Date': 'Wed, 24 Feb 2021 15:27:03 GMT', 'Pagination-Count': '172', 'Pagination-Limit': '1000', 'Pagination-Page': '0', 'Server': 'Apache/2.4.43 (Amazon)', 'Strict-Transport-Security': 'max-age=15552000; includeSubDomains', 'Vary': 'Origin,Accept-Encoding', 'X-Content-Type-Options': 'nosniff', 'X-DNS-Prefetch-Control': 'off', 'X-Download-Options': 'noopen', 'X-Frame-Options': 'SAMEORIGIN', 'X-Response-Time': '11ms', 'X-XSS-Protection': '1; mode=block', 'transfer-encoding': 'chunked', 'Connection': 'keep-alive'}

В приведенном примере показаны некоторые из наиболее важных атрибутов, доступных для объектов запроса и ответа.

Мы узнаем больше о некоторых из этих атрибутов в этом руководстве, но если вы хотите копнуть еще глубже, посмотрите документацию Mozilla по [HTTP-сообщениям](https://developer.mozilla.org/en-US/docs/Web/HTTP/Messages).


## Коды состояний HTTP

[Код состояния](https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D0%BA%D0%BE%D0%B4%D0%BE%D0%B2_%D1%81%D0%BE%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D1%8F_HTTP) — одна из наиболее важных частей ответа API, которая сообщает вам, закончился ли запрос успешно, были ли найдены данные, нужна ли информация об учетной записи и т. д.

Со временем вы без посторонней помощи научитесь распознавать различные коды состояний. А пока вот список наиболее распространенных:

Код состояния | Описание
--- | ---
`200 OK` | Запрос успешно выполнен.
`201 Created` | Запрос был принят и создан ресурс.
`400 Bad Request` | Запрос неверен или отсутствует некоторая информация.
`401 Unauthorized` | Запрос требует дополнительных разрешений.
`404 Not Found` | Запрошенный ресурс не существует.
`405 Method Not Allowed` | Конечная точка не поддерживает этот конкретный метод HTTP.
`500 Internal Server Error` | Ошибка на стороне сервера.

Статус ответа можно проверить, используя `.status_code` и `.reason`. Библиотека `requests` также выводит код состояния в представлении `Response`-объекта:

In [23]:
response = requests.get("https://api.thedogapi.com/v1/breeds")
response

<Response [200]>

In [24]:
response.status_code

200

In [25]:
response.reason

'OK'

Теперь взглянем на запрос, содержащий опечатку в пути запрашиваемой конечной точки:

In [27]:
response = requests.get("https://api.thedogapi.com/v1/breedz")
response

<Response [404]>

In [28]:
response.status_code

404

In [29]:
response.reason

'Not Found'

Очевидно, конечной точки `/breedz` не существует, поэтому API возвращает код состояния `404 Not Found`.


## Заголовки HTTP

HTTP-заголовки (headers) используются для определения нескольких параметров, управляющих запросами и ответами:

HTTP Header | Описание
--- | ---
Accept | Какой тип контента может принять клиент
Content-Type | Каков тип контента в ответе сервера 
User-Agent | Какое программное обеспечение клиент использует для связи с сервером
Server | Какое программное обеспечение сервер использует для связи с клиентом
Authentication | Кто вызывает API и с какими учетными данными

Чтобы проверить заголовки ответа, можно использовать `response.headers`:

In [30]:
response = requests.get("https://api.thedogapi.com/v1/breeds/1")
response.headers

{'Content-Encoding': 'gzip', 'Content-Type': 'application/json; charset=utf-8', 'Date': 'Wed, 24 Feb 2021 18:37:56 GMT', 'Server': 'Apache/2.4.43 (Amazon)', 'Strict-Transport-Security': 'max-age=15552000; includeSubDomains', 'Vary': 'Origin,Accept-Encoding', 'X-Content-Type-Options': 'nosniff', 'X-DNS-Prefetch-Control': 'off', 'X-Download-Options': 'noopen', 'X-Frame-Options': 'SAMEORIGIN', 'X-Response-Time': '2ms', 'X-XSS-Protection': '1; mode=block', 'Content-Length': '265', 'Connection': 'keep-alive'}

Чтобы сделать то же самое с заголовками запроса, вы можно использовать `response.request.headers`, поскольку запрос является атрибутом объекта `Response`:

In [31]:
response = requests.get("https://api.thedogapi.com/v1/breeds/1")
response.request.headers

{'User-Agent': 'python-requests/2.22.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

В этом случае мы не определяем какие-либо конкретные заголовки при отправке запроса, поэтому возвращаются заголовки по умолчанию.


## Пользовательские заголовки

Еще один стандарт, с которым вы можете столкнуться при использовании API,— использование настраиваемых заголовков. Обычно они начинаются с префикса `X-`. Разработчики API обычно используют настраиваемые заголовки для отправки или запроса дополнительной информации от клиентов.

Для определения заголовков можно использовать словарь, передаваемый в метод `requests.get()`. Например, предположим, что вы хотите отправить некоторый идентификатор запроса на сервер API и знаете, что можете сделать это с помощью `X-Request-Id`:

In [32]:
headers = {"X-Request-Id": "<my-request-id>"}
response = requests.get("https://example.org", headers=headers)
response.request.headers

{'User-Agent': 'python-requests/2.22.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive', 'X-Request-Id': '<my-request-id>'}

`X-Request-Id` находится среди других заголовков, которые по умолчанию идут с любым запросом API.

Ответ обычно содержит множество заголовков, но один из наиболее важных — `Content-Type`. Этот заголовок определяет тип содержимого, возвращаемого в ответе.


## Content-Type

В наши дни большинство API-интерфейсов используют  в качестве типа контента по умолчанию JSON.

Вернувшись к одному из предыдущих примеров использования TheDogAPI, мы заметим, что заголовок `Content-Type` определен как `application/json`:

In [33]:
response = requests.get("https://api.thedogapi.com/v1/breeds/1")
response.headers.get("Content-Type")


'application/json; charset=utf-8'

Помимо типа содержимого (в данном случае `application/json`), заголовок может возвращать кодировку контента.

Вы можете столкнуться и c API, возвращающими XML или мультимедиа, например, изображения или видео.

Заголовок `Content-Type` позволяет узнать, как обрабатывать ответ и что делать с его содержимым.


## Содержание ответа

Как мы только что узнали, тип контента указан в заголовке `Content-Type` ответа API. Чтобы правильно прочитать содержимое ответа в соответствии с различными заголовками `Content-Type`, объект `Response` поддерживает пару полезных атрибутов:

- `.text` возвращает содержание ответа в формате юникод.
- `.content` возвращает содержание ответа в виде байтовой строки.

Мы уже использовали выше атрибут `.text`. Но для некоторых типов данных, таких как изображения и другие нетекстовые данные, обычно лучшим подходом использование `.content`.

Для ответов API с типом содержимого `application/json` библиотека `requests` поддерживает специальный метод `.json()`, позволяющий получить представление данных в виде объекта Python:

In [36]:
response = requests.get("https://api.thedogapi.com/v1/breeds/1")
response.headers.get("Content-Type")

'application/json; charset=utf-8'

In [37]:
response.json()

{'weight': {'imperial': '6 - 13', 'metric': '3 - 6'},
 'height': {'imperial': '9 - 11.5', 'metric': '23 - 29'},
 'id': 1,
 'name': 'Affenpinscher',
 'bred_for': 'Small rodent hunting, lapdog',
 'breed_group': 'Toy',
 'life_span': '10 - 12 years',
 'temperament': 'Stubborn, Curious, Playful, Adventurous, Active, Fun-loving',
 'origin': 'Germany, France',
 'reference_image_id': 'BJa4kxc4X'}

In [38]:
response.json()["name"]

'Affenpinscher'