**ETL**

ETL = Extract, Transform e Load

Extração (Extract): Nesta etapa, os dados são coletados de várias fontes, como bancos de dados, arquivos, APIs da web, etc. Em um formato que possa ser manipulado e processado.

Transformação (Transform): Aqui, os dados extraídos são limpos, filtrados, agregados, ou seja, são modificados de acordo com as necessidades do usuário ou do sistema. Isso inclui a aplicação de regras de negócios, conversões de tipo de dados, normalização, etc.

Carregamento (Load): Na etapa final, os dados transformados são carregados no destino desejado, como um banco de dados, um data warehouse, um sistema de análise, etc. Onde podem ser acessados e utilizados para análise, relatórios, visualizações, etc.

**API**

"Application Programming Interface" (Interface de Programação de Aplicações). Em termos simples, uma API é um conjunto de regras, protocolos e ferramentas que permite que diferentes softwares ou sistemas se comuniquem entre si. 

API de Mídias Sociais: Plataformas como Twitter, Facebook e Instagram oferecem APIs que permitem aos desenvolvedores acessar dados como postagens, perfis de usuários e interações sociais. Isso é utilizado para desenvolver aplicativos que integram funcionalidades de mídias sociais, como compartilhamento de conteúdo, login social e análise de dados.

API de Clima: Serviços como WeatherAPI e OpenWeatherMap fornecem APIs que permitem aos desenvolvedores acessar dados meteorológicos em tempo real. Isso é utilizado para desenvolver aplicativos de previsão do tempo, planejamento de viagens e análise climática.

API de Mercado Financeiro: Plataformas como Alpha Vantage, Yahoo Finance e Bloomberg oferecem APIs que permitem aos desenvolvedores acessar dados financeiros, como cotações de ações, informações sobre índices e histórico de preços. Isso é utilizado para desenvolver aplicativos de análise de mercado, gerenciadores de portfólio e ferramentas de negociação automatizada.


GET: É usado para solicitar dados de um recurso específico. Por exemplo, se você deseja obter informações de um usuário em uma API de mídia social, você enviaria uma solicitação GET para o endpoint do usuário e receberia os dados desse usuário em resposta.

POST: É usado para enviar dados para um servidor para criar um novo recurso. Por exemplo, ao fazer uma postagem em uma rede social, você está enviando dados (o conteúdo da postagem) para o servidor. Isso cria uma nova postagem no seu perfil.

PUT: É usado para atualizar um recurso existente com novos dados. Por exemplo, se você deseja atualizar o perfil de usuário em uma aplicação, você enviaria uma solicitação PUT com os novos dados do perfil para o endpoint do usuário.

DELETE: É usado para excluir um recurso específico. Por exemplo, se você deseja excluir uma postagem em uma rede social, você enviaria uma solicitação DELETE para o endpoint da postagem e a postagem seria removida do seu perfil.

Em resumo:

GET: Obtém dados.
POST: Cria um novo recurso.
PUT: Atualiza um recurso existente.
DELETE: Exclui um recurso.

In [2]:
%pip install requests
%pip install schedule





[notice] A new release of pip is available: 23.3.2 -> 24.0
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip is available: 23.3.2 -> 24.0
[notice] To update, run: python.exe -m pip install --upgrade pip





In [3]:
import pandas as pd
import requests

url = 'https://restcountries.com/v3.1/all'
resposta = requests.get(url)

#The REST Countries API is a basic REST API that delivers information about the countries in JSON format. 
#Each country's data offers essential information, such as the capital city, population, languages, currencies, regions, 
#and country code.


Pyarrow will become a required dependency of pandas in the next major release of pandas (pandas 3.0),
(to allow more performant data types, such as the Arrow string type, and better interoperability with other libraries)
but was not found to be installed on your system.
If this would cause problems for you,
please provide us feedback at https://github.com/pandas-dev/pandas/issues/54466
        
  import pandas as pd


url = 'https://restcountries.com/v3.1/all': Define a URL que será acessada. Neste caso, é a API de países (restcountries.com) que retorna informações sobre todos os países.

resposta = requests.get(url): Faz uma requisição GET para a URL especificada utilizando a função get() da biblioteca requests. Isso significa que estamos solicitando os dados disponíveis na URL.

In [4]:
if resposta.status_code == 200 :
    data_json = resposta.json()

else :
    print("Erro ao acessar a API")



if resposta.status_code == 200:: Isso verifica se o código de status da resposta é 200, o que indica uma solicitação bem-sucedida. O código de status 200 significa "OK" e é comumente usado para indicar que a solicitação foi processada com sucesso e os dados estão sendo retornados.

data_json = resposta.json(): Se a condição acima for verdadeira (ou seja, se a solicitação for bem-sucedida), então o código converte o conteúdo da resposta para o formato JSON usando o método .json(). Isso permite que os dados sejam facilmente manipulados como um dicionário Python.

else: print("Erro ao acessar a API"): Se a condição acima não for verdadeira (ou seja, se houver algum problema com a solicitação), o código imprime uma mensagem de erro indicando que houve um erro ao acessar a API.

In [5]:
paises_df = pd.DataFrame(data_json)
paises_df.head(10)

Unnamed: 0,name,tld,cca2,ccn3,cca3,cioc,independent,status,unMember,currencies,...,fifa,car,timezones,continents,flags,coatOfArms,startOfWeek,capitalInfo,postalCode,borders
0,"{'common': 'Cyprus', 'official': 'Republic of ...",[.cy],CY,196,CYP,CYP,True,officially-assigned,True,"{'EUR': {'name': 'Euro', 'symbol': '€'}}",...,CYP,"{'signs': ['CY'], 'side': 'left'}",[UTC+02:00],[Europe],"{'png': 'https://flagcdn.com/w320/cy.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [35.17, 33.37]}","{'format': '####', 'regex': '^(\d{4})$'}",
1,"{'common': 'Eritrea', 'official': 'State of Er...",[.er],ER,232,ERI,ERI,True,officially-assigned,True,"{'ERN': {'name': 'Eritrean nakfa', 'symbol': '...",...,ERI,"{'signs': ['ER'], 'side': 'right'}",[UTC+03:00],[Africa],"{'png': 'https://flagcdn.com/w320/er.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [15.33, 38.93]}",,"[DJI, ETH, SDN]"
2,"{'common': 'Liberia', 'official': 'Republic of...",[.lr],LR,430,LBR,LBR,True,officially-assigned,True,"{'LRD': {'name': 'Liberian dollar', 'symbol': ...",...,LBR,"{'signs': ['LB'], 'side': 'right'}",[UTC],[Africa],"{'png': 'https://flagcdn.com/w320/lr.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [6.3, -10.8]}","{'format': '####', 'regex': '^(\d{4})$'}","[GIN, CIV, SLE]"
3,"{'common': 'Bermuda', 'official': 'Bermuda', '...",[.bm],BM,60,BMU,BER,False,officially-assigned,False,"{'BMD': {'name': 'Bermudian dollar', 'symbol':...",...,BER,"{'signs': ['GB'], 'side': 'left'}",[UTC-04:00],[North America],"{'png': 'https://flagcdn.com/w320/bm.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [32.28, -64.78]}","{'format': '@@ ##', 'regex': '^([A-Z]{2}\d{2})$'}",
4,"{'common': 'Vatican City', 'official': 'Vatica...",[.va],VA,336,VAT,,True,officially-assigned,True,"{'EUR': {'name': 'Euro', 'symbol': '€'}}",...,,"{'signs': ['V'], 'side': 'right'}",[UTC+01:00],[Europe],"{'png': 'https://flagcdn.com/w320/va.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [41.9, 12.45]}",,[ITA]
5,"{'common': 'Cook Islands', 'official': 'Cook I...",[.ck],CK,184,COK,COK,False,officially-assigned,False,"{'CKD': {'name': 'Cook Islands dollar', 'symbo...",...,COK,"{'signs': ['NZ'], 'side': 'left'}",[UTC-10:00],[Oceania],"{'png': 'https://flagcdn.com/w320/ck.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [-21.2, -159.77]}",,
6,"{'common': 'Somalia', 'official': 'Federal Rep...",[.so],SO,706,SOM,SOM,True,officially-assigned,True,"{'SOS': {'name': 'Somali shilling', 'symbol': ...",...,SOM,"{'signs': ['SO'], 'side': 'right'}",[UTC+03:00],[Africa],"{'png': 'https://flagcdn.com/w320/so.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [2.07, 45.33]}","{'format': '@@ #####', 'regex': '^([A-Z]{2}\d...","[DJI, ETH, KEN]"
7,"{'common': 'Zambia', 'official': 'Republic of ...",[.zm],ZM,894,ZMB,ZAM,True,officially-assigned,True,"{'ZMW': {'name': 'Zambian kwacha', 'symbol': '...",...,ZAM,"{'signs': ['RNR'], 'side': 'left'}",[UTC+02:00],[Africa],"{'png': 'https://flagcdn.com/w320/zm.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [-15.42, 28.28]}","{'format': '#####', 'regex': '^(\d{5})$'}","[AGO, BWA, COD, MWI, MOZ, NAM, TZA, ZWE]"
8,"{'common': 'Venezuela', 'official': 'Bolivaria...",[.ve],VE,862,VEN,VEN,True,officially-assigned,True,{'VES': {'name': 'Venezuelan bolívar soberano'...,...,VEN,"{'signs': ['YV'], 'side': 'right'}",[UTC-04:00],[South America],"{'png': 'https://flagcdn.com/w320/ve.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [10.48, -66.87]}","{'format': '####', 'regex': '^(\d{4})$'}","[BRA, COL, GUY]"
9,"{'common': 'Turkmenistan', 'official': 'Turkme...",[.tm],TM,795,TKM,TKM,True,officially-assigned,True,"{'TMT': {'name': 'Turkmenistan manat', 'symbol...",...,TKM,"{'signs': ['TM'], 'side': 'right'}",[UTC+05:00],[Asia],"{'png': 'https://flagcdn.com/w320/tm.png', 'sv...",{'png': 'https://mainfacts.com/media/images/co...,monday,"{'latlng': [37.95, 58.38]}","{'format': '######', 'regex': '^(\d{6})$'}","[AFG, IRN, KAZ, UZB]"


In [6]:
nome = [pais['name']['common'] for pais in data_json ]
region = [pais['region'] for pais in data_json ]
populacao = [pais['population'] for pais in data_json ]

paises = pd.DataFrame({
    "Nome": nome,
    "Regiao": region,
    "Populacao": populacao
})

paises.head(3)

Unnamed: 0,Nome,Regiao,Populacao
0,Cyprus,Europe,1207361
1,Eritrea,Africa,5352000
2,Liberia,Africa,5057677


**Alertas**

Alertas ajudam a garantir que o proceso de ETL seja executado sem problemas.

Ex de Alertas:

Falhas na extração
Erros de transformação

