## **Работа с API I**

### **Основы REST API**

**API** (Application Programming Interface) - набор правил и инструментов, позволяющих различным программам общаться между собой.

**REST API** (Representational State Transfer) - архитектурный стиль взаимодействия между клиентом и сервером через протокол HTTP. Данная технология используется для построения веб-сервисов, обеспечивающих **обмен данными** между различными системами.



**GitHub API** - REST-интерфейс, позволяющий взаимодействовать с данными и функциональностью **GitHub**. Используется как для получения общедоступной информации, так и для выполнения операций с приватными репозиториями (при наличии соответствующей аутентификации)

### **Работа с Rest API в Python**

В Python для работы с HTTP-запросами используется библиотека `requests`. Она **не входит** в стандартную библиотеку, поэтому если она еще не установлена, то следует выполнить данную команду:

Импортируем библиотеку `requests`:

При работе с API часто требуется **аутентификация**, особенно если нам нужно делать много запросов или получать доступ к закрытым данным. Без аутентификации через GitHub API можно отправлять до **60 запросов в час**. С аутентификацией, то есть при использовании специального **токена**, лимит увеличивается до 5000 запросов в час.

#### **Алгоритм создания токена в GitHub API**

1. Зайти в свой аккаунт GitHub
2. Перейти в раздел создания токена: https://github.com/settings/personal-access-tokens/new
3. В разделе **Token name** укажите название вашего токена
4. В разделе **Expiration** укажите длительность действия вашего токена (можно оставить **30 days**)
5. В разделе **Repository access** укажите **Public repositories**, для нашего занятия этого достаточно
6. Внизу нажмите зеленую кнопку **Generate token**
7. В появившемся окне **скопируйте** токен и вставьте себе в код. Обратите внимание, что вы **не сможете** больше его увидеть в своем аккаунте GitHub, поэтому убедитесь, что вы действительно скопировали токен.

Пример того, как выглядит токен GitHub API: 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0hgumlQG

#### **Задание № 1**

С помощью `GET`-запроса обратитесь к GitHub API для получения следующей информации о пользователе:
- Логин
- Публичное имя
- Количество публичных репозиториев
- Количество подписчиков

https://docs.github.com/en/rest - официальная документация GitHub API

Создадим строку, которая будет содержать `URL`-адрес для нашего API-запроса.

Создадим словарь, в котором будут храниться **заголовки** запроса. 

Отправим GET-запрос по указанному URL.

Преобразуем полученный ответ от сервера из формата JSON в **словарь**. 

Добавим предварительную проверку, что запрос выполнен успешно. После успешной проверки преобразуем полученный ответ из `JSON` в словарь и выгрузим необходимые нам данные, обращаясь к соответствующим **ключам**.

#### **Задание № 2**

Для указанного пользователя выгрузите информацию о его репозиториях в следующем формате:

`[название репозитория] (⭐ количество звезд)`

Для начала укажем **имя пользователя**, у которого будем выгружать информацию о репозиториях. В дальнейшем при желании можно указывать любое другое имя пользователя GitHub.

Составим URL, чтобы для указанного пользователя получить список репозиториев.

Составим и выполним GET-запрос, указав созданный URL и словарь с заголовками, а затем посмотрим на содержимое ответа в формате `JSON`:

Будем перебирать репозитории с помощью цикла for и выводить на экран имя репозитория, а также количество поставленных звезд.

#### **Задание № 3**

Выгрузите данные о следующих пользователях GitHub:
- **kennethreitz** - автор библиотеки requests для Python
- **microsoft** - официальные открытые репозитории компании Microsoft
- **google** - официальные открытые репозитории компании Google

Для каждого пользователя сохраните данные о репозиториях (название, количество звезд). На основании полученных данных постройте **столбчатую диаграмму**, показывающую Топ-10 репозиториев по количеству звезд среди всех пользователей.

Составьте выводу на основании полученной диаграммы.

Импортируем библиотеки для дальнейшего построения визуализации:

Создадим список с именами интересующих пользователей, а также список для сохранения полученных данных о репозиториях:

Запустим цикл `for`, внутри которого будем посылать GET-запрос по соответствующему URL для каждого отдельного пользователя, преобразовывать ответ от сервера из JSON в программную структуру и сохранять необходимые данные в список:

Список с данными о репозиториях получен, теперь создадим на его основании `DataFrame`:

Оставим Топ-10 репозиториев по количеству звезд:

Построим столбчатую диаграмму, где по оси `Х` отобразим **количество звезд**, по оси `Y` - **название репозитория**, а также **сгруппируем** данные по **имени** пользователя. Справа от горизонтальных столбцов также будем отображать числа с соответствующими **количествами звезд** для конкретного репозитория:

**Выводы по графику**:

### **Постраничный вывод (Pagination) в API**

**Постраничный вывод** (pagination) — метод разбиения большого объёма данных на несколько частей (страниц) для удобства их обработки и отображения. Вместо того чтобы загружать и передавать всё сразу, система возвращает данные **порциями**, каждая из которых представляет отдельную "страницу" результатов.

`per_page` - параметр запроса, определяющий **количество** элементов на одной странице

`page` - параметр запроса, определяющий **номер** страницы, с которой загружаются данные

Создадим словарь , в котором будут храниться параметры для будущего GET-запроса. 

Попробуем отправить GET-запрос, указав новый параметр `params`, и посмотреть результат для пользователя **google**:

Выведем на экран **количество** репозиториев на первой странице, а также список **со всеми** полученными репозиториями:

#### **Задание № 4**

Для аккаунта компании Google выгрузите данные о **всех** репозиториях и постройте **круговую** диаграмму, показывающую Топ-10 используемых технологий в открытых репозиториях Google.

Посмотрим на **количество** накопленных репозиториев:

Создадим DataFrame из списка полученного списка:

**Сгруппируем** данные по используемой технологии, считаем их **количество**, убираем **пропущенные** значения и оставляем **Топ-10**:

Построим **круговую** диаграмму для Топ-10 используемых технологий в открытых репозиториях Google: