## Conhecendo a biblioteca ``requests``

### Primeira requisição

In [49]:
import requests

In [26]:
r = requests.get('https://api.github.com/events')

In [27]:
r

<Response [200]>

### Explorando a biblioteca

In [28]:
r.status_code

200

In [29]:
r.url

'https://api.github.com/events'

In [30]:
# r.text

In [31]:
# r.json()

### Utilizando outro endpoint

In [32]:
r = requests.get('https://api.github.com/versions')
r.status_code

200

In [33]:
r.json()

['2022-11-28']

## Extraindo dados

### Obtendo dados dos repositórios

In [34]:
# especificando a vesão da API
headers = {'X-Github-Api-Version': '2022-11-28'}

In [35]:
api_base_url = 'https://api.github.com'
owner = 'amzn' # username de quem vamos extrair os dados
url = f'{api_base_url}/users/{owner}/repos'

In [36]:
url

'https://api.github.com/users/amzn/repos'

In [37]:
response = requests.get(url, headers = headers)
response.status_code

200

In [38]:
# response.json()

In [39]:
len(response.json())

30

## Autenticação

In [40]:
token = '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'
headers = {'Authorization' : 'Bearer ' + token, 
           'X-Github-Api-Version': '2022-11-28'}

## Paginando os repositórios

In [41]:
api_base_url = 'https://api.github.com'
owner = 'amzn' # username de quem vamos extrair os dados
url = f'{api_base_url}/users/{owner}/repos'

url

'https://api.github.com/users/amzn/repos'

In [42]:
repos_list = []

for page_num in range(1,7):
    try:
        url_page = f'{url}?page={page_num}'
        response = requests.get(url_page, headers = headers)
        repos_list.append(response.json())
    except:
        repos_list.append(None)

In [43]:
# repos_list

In [44]:
len(repos_list)

6

In [45]:
len(repos_list[0])

3

### Exercício

Para praticar o conteúdo aprendido no decorrer dessa aula e também aprender novos, vamos realizar um desafio prático utilizando a biblioteca Requests e a API do GitHub.

Dessa vez, nossa tarefa é extrair os dados sobre os seguidores da conta da Amazon no GitHub. Para fazermos isso, vamos utilizar como referência a seguinte documentação: List followers of a user.

No entanto, ao conferir o tamanho da lista followers, utilizando a função len(followers), notamos que ela possuía apenas os dados de 30 seguidores da conta do GitHub da Amazon. A conta tem muito mais de 30 seguidores, mas eles estão separados em diferentes páginas, e justamente por isso, ao conferirmos o tamanho da lista, o retorno foi 30.

Sendo assim, para conseguirmos extrair os dados de todos os seguidores, vamos precisar melhorar o nosso código e implementar o processo de paginação.

Durante essa etapa, devemos nos atentar a alguns detalhes:

* criar uma lista vazia chamada followers_list para armazenar as informações sobre os seguidores;
* utilizar um laço para iterar e extrair os dados dos seguidores existentes em cada uma das páginas (dica: caso você não tenha conhecimento de quantas páginas com seguidores existem, pesquise como utilizar o laço While True do Python);
* acrescentar o parâmetro "page" na url, alterando o valor dele a cada iteração do laço que estiver sendo usado para paginação (lembre-se que a numeração das páginas sempre começam a partir do número 1);
* enviar o token e a versão da API para o parâmetro headers no momento de fazer a requisição GET.

In [46]:
# url_exercicio = 'https://api.github.com/users/amzn/followers'

# followers_list = []
# page = 1

# while True:
#     url_page = f'{url_exercicio}?page={page}'
#     response = requests.get(url_page, headers = headers)
#     followers = response.json()

#     if len(followers) == 0:
#         break

#     followers_list.append(followers)

#     page+=1

# followers_list

## Transformando os dados

### Nomes dos repositórios

In [47]:
# repos_list

In [48]:
repos_name = []

for page in repos_list:
    for repo in page:
        repos_name.append(repo['name'])


TypeError: string indices must be integers

In [None]:
repos_name[:10]

['.github',
 'ads-advanced-tools-docs',
 'ads-pao-amznjs-gtm-template',
 'alexa-coho',
 'alexa-skills-kit-js',
 'amazon-ads-advertiser-audience-normalization-sdk-py',
 'amazon-advertising-api-php-sdk',
 'amazon-codeguru-profiler-for-spark',
 'amazon-frustration-free-setup-certification-tool',
 'amazon-hub-counter-api-docs']

In [None]:
len(repos_name)

158

## Linguagens dos repositórios

In [None]:
repos_list[1][1]['language']

'PHP'

In [None]:
repos_languages = []

for page in repos_list:
    for repo in page:
        repos_languages.append(repo['language'])

In [None]:
# repos_languages

[None,
 'Jupyter Notebook',
 'Smarty',
 'JavaScript',
 None,
 'Python',
 'PHP',
 'Java',
 'Python',
 'CSS',
 'Java',
 'Java',
 'Java',
 'C#',
 'PHP',
 'Ruby',
 'JavaScript',
 'Python',
 'PHP',
 'Python',
 'Jupyter Notebook',
 'C#',
 'Java',
 'JavaScript',
 'PHP',
 'Ruby',
 'C#',
 'Java',
 'PHP',
 'Python',
 'Ruby',
 'PHP',
 'Kotlin',
 'PHP',
 'Python',
 'C',
 None,
 'Swift',
 'Python',
 'C++',
 'Python',
 'Go',
 'C',
 'Python',
 'Python',
 'Jupyter Notebook',
 'Python',
 'Python',
 None,
 'Java',
 'Kotlin',
 'Python',
 'Python',
 'JavaScript',
 'TypeScript',
 'Python',
 'TypeScript',
 'JavaScript',
 'TypeScript',
 'Python',
 None,
 'Jupyter Notebook',
 'Python',
 'Python',
 'Python',
 'Java',
 'Jupyter Notebook',
 'Python',
 'Python',
 'Java',
 'Objective-C',
 'JavaScript',
 'TypeScript',
 'Java',
 None,
 'Python',
 'Python',
 'Python',
 'Java',
 'Java',
 'Kotlin',
 'Java',
 'C#',
 'C#',
 'JavaScript',
 'JavaScript',
 'Go',
 'Java',
 'TypeScript',
 'Python',
 'C++',
 None,
 'Python',
 

In [None]:
len(repos_languages)

158

## Criando um DataFrame

In [None]:
import pandas as pd

In [None]:
dados_amz = pd.DataFrame()
dados_amz['repository_name'] = repos_name
dados_amz['language'] = repos_languages

In [None]:
dados_amz

Unnamed: 0,repository_name,language
0,.github,
1,ads-advanced-tools-docs,Jupyter Notebook
2,ads-pao-amznjs-gtm-template,Smarty
3,alexa-coho,JavaScript
4,alexa-skills-kit-js,
...,...,...
153,zeek-plugin-enip,Zeek
154,zeek-plugin-profinet,Zeek
155,zeek-plugin-s7comm,Zeek
156,zeek-plugin-tds,Zeek


### Salvando o DataFrame

In [None]:
dados_amz.to_csv('../data/amazon.csv')

### Exercício

Para praticar o conteúdo aprendido no decorrer dessa aula e também aprender novos, vamos realizar um desafio prático utilizando a biblioteca Pandas e os dados da API do GitHub.

No desafio da aula 2 nós extraímos os dados de todos os seguidores da conta do Github da Amazon e armazenamos eles na lista "followers_list". Considerando isso, nossa tarefa agora é aplicar as transformações necessárias nos dados armazenados na lista followers_list para selecionarmos apenas o nome de usuário de cada seguidor.

Para concluirmos essa tarefa é importante:

* entender como os dados dos seguidores estão estruturados na lista;
* armazenar o nome de usuário de cada seguidor em uma lista;
* conferir o tamanho da lista de nomes de usuário de seguidores para ter certeza que é igual ao número de seguidores apresentados no Github;
* estruturar os dados em um DataFrame e salvá-los em CSV.

In [None]:
# url_exercicio = 'https://api.github.com/users/amzn/followers'

# followers_list = []
# page = 1

# while True:
#     url_page = f'{url_exercicio}?page={page}'
#     response = requests.get(url_page, headers = headers)
#     followers = response.json()

#     if len(followers) == 0:
#         break

#     followers_list.append(followers)

#     page+=1

# followers_list

In [None]:
# followers_name = []

# for page in followers_list:
#     for follower in page:
#         followers_name.append(follower['login'])

# followers_name

In [None]:
# len(followers_name)

In [None]:
# df = pd.DataFrame()
# df['Follower Name'] = followers_name

# df

## Armazenando os dados

### Criando repositório com POST

In [None]:
# api_base_url = 'https://api.github.com'
# url = f'{api_base_url}/user/repos'

# url

'https://api.github.com/user/repos'

In [None]:
# data = {
#     'name': 'linguagens-utilizadas',
#     'description': 'Repositório com as linguagens de prog da Amazon',
#     'private': False
# }

# response = requests.post(url, json = data, headers = headers)
# response.status_code

201

### Formato do arquivo

In [None]:
# import base64

In [None]:
# with open('../data/amazon.csv', 'rb') as file:
#     file_content = file.read()

# encoded_content = base64.b64encode(file_content)

## Upload de arquivo com PUT

In [None]:
# username = 'juliana-vieira'
# repo = 'linguagens-utilizadas'
# path = 'amazon.csv'

# url = f'{api_base_url}/repos/{username}/{repo}/contents/{path}'
# url

'https://api.github.com/repos/juliana-vieira/linguagens-utilizadas/contents/amazon.csv'

In [None]:
# data = {
#     'message': 'Adicionando um novo arquivo',
#     'content': encoded_content.decode('utf-8')
# }

# response = requests.put(url, json = data, headers = headers)
# response.status_code

201