## Basedosdados + Big Query

- Devido à alguns erros ao tentar instalar o pacote **basedosdados**, acabei optando por instalar uma versão um pouco mais antiga do pacote
<br>pip install basedosdados==2.0.0b15
- Para que ela funcione ainda precisei atualizar os pacotes numpy e pandas
<br>pip install --upgrade pandas
<br>pip install --upgrade numpy

**API Reference:** 
- https://basedosdados.github.io/mais/api_reference_python/
- https://github.com/basedosdados/mais

In [12]:
import basedosdados as bd

### Data

In [20]:
# BigQuery Script
query_b = "SELECT * FROM datario.dados_mestres.bairro LIMIT 10"
query_c = "SELECT * FROM datario.adm_central_atendimento_1746.chamado LIMIT 10"
query_e = "SELECT * FROM datario.turismo_fluxo_visitantes.rede_hoteleira_ocupacao_eventos LIMIT 10"

# Retrieve data
bairro = bd.read_sql(query_b, billing_project_id="dados-rio-433111")
chamado = bd.read_sql(query_c, billing_project_id="dados-rio-433111")
eventos = bd.read_sql(query_e, billing_project_id="dados-rio-433111")

Downloading: 100%|[32m██████████[0m|
Downloading: 100%|[32m██████████[0m|
Downloading: 100%|[32m██████████[0m|


In [39]:
# Foi observado que o método read_sql já retorna um objeto DataFrame Pandas, e os métodos e atributos de dataframe pandas podem ser utilizados sem a necessidade de importar a biblioteca 

# Quantidade e nomes das colunas de cada dataset a ser trabalhado no desafio
datasets = {'bairro':bairro, 'chamado':chamado, 'eventos':eventos}
for ds,data in datasets.items():
    print(f'Dataset: {ds}\nQT_Columns: {data.shape[1]}\nColumns: {data.columns}\n')

Dataset: bairro
QT_Columns: 12
Columns: Index(['id_bairro', 'nome', 'id_area_planejamento', 'id_regiao_planejamento',
       'nome_regiao_planejamento', 'id_regiao_administrativa',
       'nome_regiao_administrativa', 'subprefeitura', 'area', 'perimetro',
       'geometry_wkt', 'geometry'],
      dtype='object')

Dataset: chamado
QT_Columns: 32
Columns: Index(['id_chamado', 'id_origem_ocorrencia', 'data_inicio', 'data_fim',
       'id_bairro', 'id_territorialidade', 'id_logradouro',
       'numero_logradouro', 'id_unidade_organizacional',
       'nome_unidade_organizacional', 'id_unidade_organizacional_mae',
       'unidade_organizacional_ouvidoria', 'categoria', 'id_tipo', 'tipo',
       'id_subtipo', 'subtipo', 'status', 'longitude', 'latitude',
       'data_alvo_finalizacao', 'data_alvo_diagnostico',
       'data_real_diagnostico', 'tempo_prazo', 'prazo_unidade', 'prazo_tipo',
       'dentro_prazo', 'situacao', 'tipo_situacao', 'justificativa_status',
       'reclamacoes', 'data_par

# Exploring the APIs

## Public Holidays API

- https://date.nager.at/swagger/index.html
- https://github.com/nager/Nager.Date
- https://date.nager.at/Api

In [81]:
import json
import requests
import pandas as pd

response = requests.get('https://date.nager.at/api/v3/publicholidays/2024/BR')
public_holidays = json.loads(response.content)

In [75]:
holidays = pd.DataFrame(public_holidays)
holidays.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14 entries, 0 to 13
Data columns (total 9 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   date         14 non-null     object
 1   localName    14 non-null     object
 2   name         14 non-null     object
 3   countryCode  14 non-null     object
 4   fixed        14 non-null     bool  
 5   global       14 non-null     bool  
 6   counties     1 non-null      object
 7   launchYear   0 non-null      object
 8   types        14 non-null     object
dtypes: bool(2), object(7)
memory usage: 944.0+ bytes


In [115]:
feriados_brasil = {
    "1º de Janeiro": "Confraternização Universal (Ano Novo)",
    "Carnaval": "Data móvel, geralmente em fevereiro ou março (ponto facultativo)",
    "Sexta-feira Santa": "Data móvel, geralmente em março ou abril",
    "21 de Abril": "Tiradentes",
    "1º de Maio": "Dia do Trabalho",
    "Corpus Christi": "Data móvel, geralmente em maio ou junho (feriado em muitos estados)",
    "7 de Setembro": "Independência do Brasil",
    "12 de Outubro": "Nossa Senhora Aparecida, Padroeira do Brasil",
    "2 de Novembro": "Finados",
    "15 de Novembro": "Proclamação da República",
    "20 de Novembro": "Consciência Negra (feriado em alguns estados e municípios)",
    "25 de Dezembro": "Natal"
}


In [82]:
holidays

Unnamed: 0,date,localName,name,countryCode,fixed,global,counties,launchYear,types
0,2024-01-01,Confraternização Universal,New Year's Day,BR,False,True,,,[Public]
1,2024-02-12,Carnaval,Carnival,BR,False,True,,,"[Bank, Optional]"
2,2024-02-13,Carnaval,Carnival,BR,False,True,,,"[Bank, Optional]"
3,2024-03-29,Sexta-feira Santa,Good Friday,BR,False,True,,,[Public]
4,2024-03-31,Domingo de Páscoa,Easter Sunday,BR,False,True,,,[Public]
5,2024-04-21,Dia de Tiradentes,Tiradentes,BR,False,True,,,[Public]
6,2024-05-01,Dia do Trabalhador,Labour Day,BR,False,True,,,[Public]
7,2024-05-30,Corpus Christi,Corpus Christi,BR,False,True,,,[Public]
8,2024-07-09,Revolução Constitucionalista de 1932,Constitutionalist Revolution of 1932,BR,False,False,[BR-SP],,[Public]
9,2024-09-07,Dia da Independência,Independence Day,BR,False,True,,,[Public]


## Open-Meteo Historical Weather API

- De acordo com http://www.rio.rj.gov.br, a cidade do Rio de Janeiro está situada a 22º54'23" de latitude sul e 43º10'21" de longitude oeste, no município do mesmo nome: é a capital do Estado do Rio de Janeiro, um dos componentes da Região Sudeste do Brasil.
<br>lat: 22.5423
<br>lon: 43.1021

**API Reference:** 
- https://pypi.org/project/openmeteo-requests/
- https://open-meteo.com/en/docs/historical-weather-api

Instalação:
- pip install openmeteo-requests

In [5]:
# Código de exemplo da documentação
import openmeteo_requests

import requests_cache
import pandas as pd
from retry_requests import retry

# Setup the Open-Meteo API client with cache and retry on error
cache_session = requests_cache.CachedSession('.cache', expire_after = -1)
retry_session = retry(cache_session, retries = 5, backoff_factor = 0.2)
openmeteo = openmeteo_requests.Client(session = retry_session)

# Make sure all required weather variables are listed here
# The order of variables in hourly or daily is important to assign them correctly below
url = "https://archive-api.open-meteo.com/v1/archive"
params = {
	"latitude": 22.5423,
	"longitude": 43.1021,
	"start_date": "2024-01-01",
	"end_date": "2024-08-01",
	"daily": ["weather_code", "temperature_2m_mean"],
	"timezone": "America/Sao_Paulo"
}
responses = openmeteo.weather_api(url, params=params)

# Process first location. Add a for-loop for multiple locations or weather models
response = responses[0]
print(f"Coordinates {response.Latitude()}°N {response.Longitude()}°E")
print(f"Elevation {response.Elevation()} m asl")
print(f"Timezone {response.Timezone()} {response.TimezoneAbbreviation()}")
print(f"Timezone difference to GMT+0 {response.UtcOffsetSeconds()} s")

# Process daily data. The order of variables needs to be the same as requested.
daily = response.Daily()
daily_weather_code = daily.Variables(0).ValuesAsNumpy()
daily_temperature_2m_mean = daily.Variables(1).ValuesAsNumpy()

daily_data = {"date": pd.date_range(
	start = pd.to_datetime(daily.Time(), unit = "s", utc = True),
	end = pd.to_datetime(daily.TimeEnd(), unit = "s", utc = True),
	freq = pd.Timedelta(seconds = daily.Interval()),
	inclusive = "left"
)}
daily_data["weather_code"] = daily_weather_code
daily_data["temperature_2m_mean"] = daily_temperature_2m_mean

daily_dataframe = pd.DataFrame(data = daily_data)
print(daily_dataframe)



Coordinates 22.53075408935547°N 43.132781982421875°E
Elevation 938.0 m asl
Timezone b'America/Sao_Paulo' b'-03'
Timezone difference to GMT+0 -10800 s
                         date  weather_code  temperature_2m_mean
0   2024-01-01 03:00:00+00:00           0.0            19.620335
1   2024-01-02 03:00:00+00:00           1.0            19.759918
2   2024-01-03 03:00:00+00:00           0.0            18.545332
3   2024-01-04 03:00:00+00:00           1.0            18.105749
4   2024-01-05 03:00:00+00:00           2.0            17.930750
..                        ...           ...                  ...
209 2024-07-28 03:00:00+00:00           2.0            34.861996
210 2024-07-29 03:00:00+00:00           2.0            34.305752
211 2024-07-30 03:00:00+00:00           1.0            33.680748
212 2024-07-31 03:00:00+00:00           1.0            34.005749
213 2024-08-01 03:00:00+00:00           1.0            33.739082

[214 rows x 3 columns]


In [3]:
# Testando a classe criada
from utils import Weather
wrio = Weather(22.5423, 43.1021) # Cria instância da classe Weather com as coordenadas da cidade do Rio de Janeiro
result = wrio.forecast("2024-01-01","2024-08-01") # Método para acessar a API
result

Unnamed: 0,data,clima,temperatura media
0,2024-01-01 03:00:00+00:00,Sunny,19.620335
1,2024-01-02 03:00:00+00:00,Mainly Sunny,19.759918
2,2024-01-03 03:00:00+00:00,Sunny,18.545332
3,2024-01-04 03:00:00+00:00,Mainly Sunny,18.105749
4,2024-01-05 03:00:00+00:00,Partly Cloudy,17.930750
...,...,...,...
209,2024-07-28 03:00:00+00:00,Partly Cloudy,34.861996
210,2024-07-29 03:00:00+00:00,Partly Cloudy,34.305752
211,2024-07-30 03:00:00+00:00,Mainly Sunny,33.680748
212,2024-07-31 03:00:00+00:00,Mainly Sunny,34.005749


### Testando a requisição do arquivo Json com a referência dos códigos de clima e descrição

In [7]:
import requests
import json

# URL da Raw
url = "https://gist.githubusercontent.com/stellasphere/9490c195ed2b53c707087c8c2db4ec0c/raw/76b0cb0ef0bfd8a2ec988aa54e30ecd1b483495d/descriptions.json"
resposta = requests.get(url)
data = json.loads(resposta.text)
data

{'0': {'day': {'description': 'Sunny',
   'image': 'http://openweathermap.org/img/wn/01d@2x.png'},
  'night': {'description': 'Clear',
   'image': 'http://openweathermap.org/img/wn/01n@2x.png'}},
 '1': {'day': {'description': 'Mainly Sunny',
   'image': 'http://openweathermap.org/img/wn/01d@2x.png'},
  'night': {'description': 'Mainly Clear',
   'image': 'http://openweathermap.org/img/wn/01n@2x.png'}},
 '2': {'day': {'description': 'Partly Cloudy',
   'image': 'http://openweathermap.org/img/wn/02d@2x.png'},
  'night': {'description': 'Partly Cloudy',
   'image': 'http://openweathermap.org/img/wn/02n@2x.png'}},
 '3': {'day': {'description': 'Cloudy',
   'image': 'http://openweathermap.org/img/wn/03d@2x.png'},
  'night': {'description': 'Cloudy',
   'image': 'http://openweathermap.org/img/wn/03n@2x.png'}},
 '45': {'day': {'description': 'Foggy',
   'image': 'http://openweathermap.org/img/wn/50d@2x.png'},
  'night': {'description': 'Foggy',
   'image': 'http://openweathermap.org/img/wn/50

In [6]:
data['0']['day']['description']

'Sunny'