<span style="font-size: 2em;">Conhecendo a requests</span>



As requisições são pedidos que fazemos a um servidor para que ele nos forneça alguma informação ou execute alguma ação. As requisições mais comuns são:

GET: é a requisição mais utilizada na web e tem como objetivo buscar informações de um servidor. Por exemplo, ao acessar um site de notícias, é realizada uma requisição GET para buscar as informações da página que será exibida.

POST: é utilizada para enviar informações para um servidor e, geralmente, é usada para realizar ações como criar um novo usuário ou enviar dados de um formulário. Ao enviar um e-mail através de um formulário em um site, é realizada uma requisição POST para enviar as informações do formulário ao servidor.

PUT: é usada para substituir completamente um recurso no servidor. Ao enviar uma requisição PUT, você envia todas as informações necessárias para atualizar o recurso por completo, substituindo todos os campos e informações existentes. Por exemplo, ao alterar todas as informações de seu perfil em alguma rede social (nome, foto, interesses, etc), é realizada uma requisição PUT.

DELETE: como o nome sugere, é utilizada para excluir informações em um servidor. Por exemplo, ao excluir um post em uma rede social, é realizada uma requisição DELETE para remover as informações do servidor.

PATCH: é utilizada para fazer alterações parciais em um recurso existente no servidor. Ao enviar uma requisição PATCH, você envia apenas as informações específicas que deseja alterar, mantendo as demais informações do recurso intactas. Por exemplo, ao alterar apenas o status de uma tarefa em um sistema de gerenciamento, de "Em andamento" para "Concluída", é realizada uma requisição PATCH.

Primeira requisição:

In [3]:
import requests

In [4]:
r = requests.get('https://api.github.com/events')

In [5]:
r

<Response [200]>

<span style="font-size: 2em;">Explorando a biblioteca</span>

In [6]:
r.status_code

200

In [7]:
r.url

'https://api.github.com/events'

In [8]:
r.text

'[{"id":"37789056917","type":"IssueCommentEvent","actor":{"id":30114997,"login":"tszheichoi","display_login":"tszheichoi","gravatar_id":"","url":"https://api.github.com/users/tszheichoi","avatar_url":"https://avatars.githubusercontent.com/u/30114997?"},"repo":{"id":502129301,"name":"tszheichoi/awesome-sensor-logger","url":"https://api.github.com/repos/tszheichoi/awesome-sensor-logger"},"payload":{"action":"created","issue":{"url":"https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34","repository_url":"https://api.github.com/repos/tszheichoi/awesome-sensor-logger","labels_url":"https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34/labels{/name}","comments_url":"https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34/comments","events_url":"https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34/events","html_url":"https://github.com/tszheichoi/awesome-sensor-logger/issues/34","id":2257668466,"node_id":"I_kwDOHe3ilc6GkU

In [9]:
r.json()

[{'id': '37789056917',
  'type': 'IssueCommentEvent',
  'actor': {'id': 30114997,
   'login': 'tszheichoi',
   'display_login': 'tszheichoi',
   'gravatar_id': '',
   'url': 'https://api.github.com/users/tszheichoi',
   'avatar_url': 'https://avatars.githubusercontent.com/u/30114997?'},
  'repo': {'id': 502129301,
   'name': 'tszheichoi/awesome-sensor-logger',
   'url': 'https://api.github.com/repos/tszheichoi/awesome-sensor-logger'},
  'payload': {'action': 'created',
   'issue': {'url': 'https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34',
    'repository_url': 'https://api.github.com/repos/tszheichoi/awesome-sensor-logger',
    'labels_url': 'https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34/labels{/name}',
    'comments_url': 'https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34/comments',
    'events_url': 'https://api.github.com/repos/tszheichoi/awesome-sensor-logger/issues/34/events',
    'html_url': 'https://github.c

Utilizando outro endpoint

In [10]:
r = requests.get('https://api.github.com/versions')
r.status_code

200

In [11]:
#Especificando uma versão da API
headers = {'X-GitHub-Api-Version': '2022-11-28'}
r = requests.get('https://api.github.com/versions', headers=headers)
r.status_code

200

In [12]:
r.json()

['2022-11-28']

<span style="font-size: 2em;">Obtendo dados dos repositórios</span>

In [13]:
#Especificando uma versão da API
headers = {'X-GitHub-Api-Version': '2022-11-28'}


In [14]:
api_base_url = 'https://api.github.com'
owner = 'amzn' # username de quem vamos extrair os dados
url = f'{api_base_url}/users/{owner}/repos'

In [15]:
url

'https://api.github.com/users/amzn/repos'

In [16]:
response = requests.get(url, headers=headers)
response.status_code

200

In [17]:
response.json()

[{'id': 171339259,
  'node_id': 'MDEwOlJlcG9zaXRvcnkxNzEzMzkyNTk=',
  'name': '.github',
  'full_name': 'amzn/.github',
  'private': False,
  'owner': {'login': 'amzn',
   'id': 8594673,
   'node_id': 'MDEyOk9yZ2FuaXphdGlvbjg1OTQ2NzM=',
   'avatar_url': 'https://avatars.githubusercontent.com/u/8594673?v=4',
   'gravatar_id': '',
   'url': 'https://api.github.com/users/amzn',
   'html_url': 'https://github.com/amzn',
   'followers_url': 'https://api.github.com/users/amzn/followers',
   'following_url': 'https://api.github.com/users/amzn/following{/other_user}',
   'gists_url': 'https://api.github.com/users/amzn/gists{/gist_id}',
   'starred_url': 'https://api.github.com/users/amzn/starred{/owner}{/repo}',
   'subscriptions_url': 'https://api.github.com/users/amzn/subscriptions',
   'organizations_url': 'https://api.github.com/users/amzn/orgs',
   'repos_url': 'https://api.github.com/users/amzn/repos',
   'events_url': 'https://api.github.com/users/amzn/events{/privacy}',
   'received_ev

In [18]:
len(response.json())

30

<span style="font-size: 2em;">Autentificação</span>

A autenticação em APIs é um processo que permite a verificação da identidade da pessoa usuária que está acessando os dados. Existem diferentes tipos de autenticação, cada um com suas características e formas de implementação. Os principais tipos de autenticação são:

1 - Autenticação por chave de API (API Key):

Esse tipo de autenticação é o mais simples e comum. Nele, a API fornece uma chave de acesso exclusiva para cada pessoa usuária, que é usada como um "código de identificação". A chave é enviada junto com a requisição para a API e é verificada pelo servidor para permitir ou negar o acesso aos dados.

2 - Autenticação por token:

Nesse tipo de autenticação, a API fornece um token de acesso para a pessoa usuária após a autenticação bem-sucedida, geralmente usando um login e senha. O token é um código que permite que a pessoa usuária acesse os recursos da API sem precisar enviar novamente suas credenciais. Ele pode ter um tempo de validade, e a pessoa usuária pode precisar solicitar um novo token após o vencimento.

3 - Autenticação por OAuth:

O OAuth é um protocolo de autorização que permite que uma pessoa usuária conceda acesso a seus recursos em uma API, sem compartilhar suas credenciais de login com a aplicação de terceiros. Nesse tipo de autenticação, a pessoa usuária é redirecionada para a página de login da API para inserir suas credenciais. Depois, é solicitada à pessoa usuária a autorização para que a aplicação de terceiros acesse seus recursos. A autorização é concedida por meio de um token OAuth, que permite que a aplicação acesse apenas os recursos autorizados pela pessoa usuária.

Algumas APIs que utilizam esses tipos de autenticação são:

API da NASA: usa uma chave de API para autenticação e controle de acesso.

API do GitHub: usa token de acesso para autenticação e controle de acesso aos recursos.

API do Spotify: usa OAuth para autenticação e autorização de acesso aos recursos.

In [28]:


# Dados sensiveis - TOKEN -
from scripts import config

['/home/igor/Documentos/projeto_Request/scripts/notebook', '/usr/lib/python310.zip', '/usr/lib/python3.10', '/usr/lib/python3.10/lib-dynload', '', '/home/igor/Documentos/projeto_Request/venv/lib/python3.10/site-packages', '/home/igor/Documentos/projeto_Request', '/home/igor/Documentos/projeto_Request']


In [None]:

access_token = config.TOKEN
headers = {'Authorization': 'Bearer ' + access_token,
           'X-GitHub-Api-Version': '2022-11-28'}

<span style="font-size: 2em;">Paginação</span>

In [None]:
api_base_url = 'https://api.github.com'
owner = 'amzn' # username de quem vamos extrair os dados
url = f'{api_base_url}/users/{owner}/repos'
url

'https://api.github.com/users/amzn/repos'

In [None]:
repos_list = []
for page_num in range(1, 6):
    try:
        url_page = f'{url}?page={page_num}'
        response = requests.get(url_page, headers=headers)
        repos_list.append(response.json())
    except:
        repos_list.append(None)


In [None]:
repos_list

[[{'id': 171339259,
   'node_id': 'MDEwOlJlcG9zaXRvcnkxNzEzMzkyNTk=',
   'name': '.github',
   'full_name': 'amzn/.github',
   'private': False,
   'owner': {'login': 'amzn',
    'id': 8594673,
    'node_id': 'MDEyOk9yZ2FuaXphdGlvbjg1OTQ2NzM=',
    'avatar_url': 'https://avatars.githubusercontent.com/u/8594673?v=4',
    'gravatar_id': '',
    'url': 'https://api.github.com/users/amzn',
    'html_url': 'https://github.com/amzn',
    'followers_url': 'https://api.github.com/users/amzn/followers',
    'following_url': 'https://api.github.com/users/amzn/following{/other_user}',
    'gists_url': 'https://api.github.com/users/amzn/gists{/gist_id}',
    'starred_url': 'https://api.github.com/users/amzn/starred{/owner}{/repo}',
    'subscriptions_url': 'https://api.github.com/users/amzn/subscriptions',
    'organizations_url': 'https://api.github.com/users/amzn/orgs',
    'repos_url': 'https://api.github.com/users/amzn/repos',
    'events_url': 'https://api.github.com/users/amzn/events{/privac

In [None]:
len(repos_list[3])

30

# Nome dos repositórios

In [None]:
repos_list

[[{'id': 171339259,
   'node_id': 'MDEwOlJlcG9zaXRvcnkxNzEzMzkyNTk=',
   'name': '.github',
   'full_name': 'amzn/.github',
   'private': False,
   'owner': {'login': 'amzn',
    'id': 8594673,
    'node_id': 'MDEyOk9yZ2FuaXphdGlvbjg1OTQ2NzM=',
    'avatar_url': 'https://avatars.githubusercontent.com/u/8594673?v=4',
    'gravatar_id': '',
    'url': 'https://api.github.com/users/amzn',
    'html_url': 'https://github.com/amzn',
    'followers_url': 'https://api.github.com/users/amzn/followers',
    'following_url': 'https://api.github.com/users/amzn/following{/other_user}',
    'gists_url': 'https://api.github.com/users/amzn/gists{/gist_id}',
    'starred_url': 'https://api.github.com/users/amzn/starred{/owner}{/repo}',
    'subscriptions_url': 'https://api.github.com/users/amzn/subscriptions',
    'organizations_url': 'https://api.github.com/users/amzn/orgs',
    'repos_url': 'https://api.github.com/users/amzn/repos',
    'events_url': 'https://api.github.com/users/amzn/events{/privac

In [None]:
repos_list[0][2]['name']
# fazer um laço para percorrer e guardar só o nome

'ads-pao-amznjs-gtm-template'

In [None]:
repos_names = []

for page in repos_list:
    for repo in page:
        repos_names.append(repo['name'])

print(repos_names)


['.github', 'ads-advanced-tools-docs', 'ads-pao-amznjs-gtm-template', 'alexa-coho', 'alexa-skills-kit-js', 'amazon-ads-advertiser-audience-normalization-sdk-py', 'amazon-advertising-api-php-sdk', 'amazon-codeguru-profiler-for-spark', 'amazon-frustration-free-setup-certification-tool', 'amazon-hub-counter-api-docs', 'amazon-hub-counter-api-samples', 'amazon-hub-counter-sdk-java', 'amazon-hub-support', 'amazon-instant-access-sdk-java', 'amazon-instant-access-sdk-net', 'amazon-instant-access-sdk-php', 'amazon-instant-access-sdk-ruby', 'amazon-launcher-integration-cordova-plugin', 'amazon-marketing-stream-examples', 'amazon-mcf-plugin-for-magento-1', 'amazon-multi-token-completion', 'amazon-nearest-neighbor-through-ecc', 'amazon-pay-api-sdk-dotnet', 'amazon-pay-api-sdk-java', 'amazon-pay-api-sdk-nodejs', 'amazon-pay-api-sdk-php', 'amazon-pay-sdk-csharp', 'amazon-pay-sdk-java', 'amazon-pay-sdk-php', 'amazon-pay-sdk-python', 'amazon-pay-sdk-ruby', 'amazon-pay-sdk-samples', 'amazon-payment-fi

In [None]:
len(repos_names)

150

# Linguagens dos repositórios

In [None]:
repos_list[0][2]['language']
# fazer um laço para percorrer e guardar só o linguagem

'Smarty'

In [None]:
repos_language = []

for page in repos_list:
    for repo in page:
        repos_language.append(repo['language'])

print(repos_language)

[None, None, 'Smarty', 'JavaScript', None, 'Python', 'PHP', 'Java', 'Python', 'CSS', 'Java', 'Java', 'PowerShell', 'Java', 'C#', 'PHP', 'Ruby', 'JavaScript', 'Python', 'PHP', 'Python', 'Jupyter Notebook', 'C#', 'Java', 'JavaScript', 'PHP', 'C#', 'Java', 'PHP', 'Python', 'Ruby', 'PHP', 'Kotlin', 'PHP', 'Python', 'C', None, 'Swift', 'Python', 'C++', 'Python', 'Go', 'C', 'Python', 'Jupyter Notebook', 'Python', 'Python', None, 'Java', 'Kotlin', 'Python', 'JavaScript', 'TypeScript', 'Python', 'TypeScript', 'JavaScript', 'TypeScript', 'Python', None, 'Jupyter Notebook', 'Python', 'Python', 'Python', 'Java', 'Jupyter Notebook', 'Python', 'Python', 'Java', 'Objective-C', 'JavaScript', 'TypeScript', 'Java', None, 'Python', 'Python', 'Python', 'Java', 'Java', 'Kotlin', 'Java', 'C#', 'C#', 'JavaScript', 'JavaScript', 'Go', 'Java', 'TypeScript', 'Python', 'C++', None, 'Python', 'Python', 'C#', 'HTML', None, 'PHP', 'PHP', 'JavaScript', 'Python', 'Scala', 'Python', 'Python', 'Python', 'Python', 'Pyt

In [None]:
len(repos_language)

150

# Criando um DataFrame

In [None]:
import pandas as pd

In [None]:
dados_amz = pd.DataFrame()
dados_amz['repository_name'] = repos_names
dados_amz['language'] = repos_language

In [None]:
dados_amz

Unnamed: 0,repository_name,language
0,.github,
1,ads-advanced-tools-docs,
2,ads-pao-amznjs-gtm-template,Smarty
3,alexa-coho,JavaScript
4,alexa-skills-kit-js,
...,...,...
145,ws-vae,Python
146,xfer,Python
147,zeek-plugin-bacnet,Zeek
148,zeek-plugin-enip,Zeek


# Salvando o DataFrame

In [None]:
dados_amz.to_csv('external_data/amazon.csv')


# Armazenando os dados

### Criando repositórios com POST

In [None]:
access_token = config.TOKEN
headers = {'Authorization': 'Bearer ' + access_token,
           'X-GitHub-Api-Version': '2022-11-28'}

In [None]:
api_base_url = 'https://api.github.com'

url = f'{api_base_url}/user/repos'
url

'https://api.github.com/user/repos'

In [None]:
data = {
    'name': 'linguagens-utilizadas',
    'description': 'Repositorio com as linguagens de prog da Amazon, projeto Engenharia de dados Alura',
    'private': False
}

response = requests.post(url, json=data, headers=headers)
response.status_code



422

# Formato do arquivo

In [None]:
import base64

In [None]:

with open('external_data/amazon.csv', 'rb') as file:
    file_content = file.read()

encoded_content = base64.b64encode(file_content)
#nosso arquivo foi codificado e está salvo na variável encoded_content. Agora, podemos fazer o upload dele para nosso repositório no GitHub.

# Upload de arquivo com PUT

In [None]:
api_base_url = 'https://api.github.com'
username = 'igoriafxd'
repo = 'linguagens-utilizadas'
path = 'amazon.csv'

url = f'{api_base_url}/repos/{username}/{repo}/contents/{path}'
url

'https://api.github.com/repos/igoriafxd/linguagens-utilizadas/contents/external_data/amazon.csv'

In [None]:
data = {
    'message': 'Adicionando um novo arquivo', #commit
    'content': encoded_content.decode('utf-8')
}

response = requests.put(url, json=data, headers=headers)
response.status_code

201

# Ultilizando o DELETE no repositorio

In [29]:
access_token = config.TOKEN
headers = {'Authorization': 'Bearer ' + access_token,
           'X-GitHub-Api-Version': '2022-11-28'}
owner = 'igoriafxd'
repo = 'linguagens-utilizadas'
url = f'https://api.github.com/repos/{owner}/{repo}'

response = requests.delete(url, headers=headers)
print(f"{response.status_code}")

204
