# Методы сбора и обработки данных из Интернет

## Урок 1. Практическое задание

### Задание 1.
Посмотреть документацию к API GitHub, разобраться как вывести список репозиториев для конкретного пользователя, сохранить JSON-вывод в файле *.json.

In [3]:
import requests
from pprint import pprint
import json

Выводим список репозиториев конкретного пользователя golda-gurr

In [12]:
def get_repositories(url):
    result = []
    r = requests.get(url=url)
    if 'next' in r.links :
        result += get_repositories(r.links['next']['url'])

    for repository in r.json():
        result.append(repository.get('name'))

    return result

In [14]:
url = "https://api.github.com/users/golda-gurr/repos"
print(get_repositories(url))

['git-repo', 'git-repo2', 'git-repo3', 'python', 'python_ds', 'StartupIdeas']


Посмотрим, как сервер возвращает JSON формат

In [15]:
response = requests.get(url)

In [16]:
pprint(response.json())

[{'archive_url': 'https://api.github.com/repos/golda-gurr/git-repo/{archive_format}{/ref}',
  'archived': False,
  'assignees_url': 'https://api.github.com/repos/golda-gurr/git-repo/assignees{/user}',
  'blobs_url': 'https://api.github.com/repos/golda-gurr/git-repo/git/blobs{/sha}',
  'branches_url': 'https://api.github.com/repos/golda-gurr/git-repo/branches{/branch}',
  'clone_url': 'https://github.com/golda-gurr/git-repo.git',
  'collaborators_url': 'https://api.github.com/repos/golda-gurr/git-repo/collaborators{/collaborator}',
  'comments_url': 'https://api.github.com/repos/golda-gurr/git-repo/comments{/number}',
  'commits_url': 'https://api.github.com/repos/golda-gurr/git-repo/commits{/sha}',
  'compare_url': 'https://api.github.com/repos/golda-gurr/git-repo/compare/{base}...{head}',
  'contents_url': 'https://api.github.com/repos/golda-gurr/git-repo/contents/{+path}',
  'contributors_url': 'https://api.github.com/repos/golda-gurr/git-repo/contributors',
  'created_at': '2019-10-

В json сохраняем весь ответ от сервера

In [21]:
response = requests.get(url)
response.raise_for_status()
data = response.json()
with open('response.json', 'w', encoding='utf-8') as file:
    json.dump(data, file, indent=2, ensure_ascii=False)

### Задание 2. 
Изучить список открытых API (https://www.programmableweb.com/category/all/apis). Найти среди них любое, требующее авторизацию (любого типа). Выполнить запросы к нему, пройдя авторизацию. Ответ сервера записать в файл.

Если нет желания заморачиваться с поиском, возьмите API вконтакте (https://vk.com/dev/first_guide). Сделайте запрос, чтобы получить список всех сообществ на которые вы подписаны.

In [16]:
# Метод groups.get возвращает список сообществ указанного пользователя.
# https://api.vk.com/method/groups.get?v=5.52&access_token=

main_link = 'https://api.vk.com/method/groups.get?v=5.52'

In [10]:
access_token = '' # нужно вставить уникальный ключ пользователя vk.com

In [19]:
response_vk = requests.get(f'{main_link}&access_token={access_token}')

In [23]:
print(response_vk.json())

{'response': {'count': 2, 'items': [91453124, 153646673]}}


In [24]:
response_vk.raise_for_status()
data = response_vk.json()
with open('response_vk.json', 'w', encoding='utf-8') as file:
    json.dump(data, file, indent=2, ensure_ascii=False)