In [45]:
#Importando pacotes
import requests
import pandas as pd

#Realizando consultas via API
# --- Feriados ---
url = 'https://date.nager.at/api/v3/publicholidays/2024/BR'
feriados_api = requests.get(url).json() #API em .json
df_feriados = pd.DataFrame(feriados_api)
df_feriados['date'] = pd.to_datetime(df_feriados['date']).dt.date #convertendo o formato da data

# --- Clima ---
#Utilizando o pseudo código disponibilizado pelo site da API
import openmeteo_requests
import requests_cache
from retry_requests import retry

cache_session = requests_cache.CachedSession('.cache', expire_after = -1) 
retry_session = retry(cache_session, retries = 5, backoff_factor = 0.2)
openmeteo = openmeteo_requests.Client(session = retry_session)

url = "https://archive-api.open-meteo.com/v1/archive"
params = {
	"latitude": -22.9064,
	"longitude": -43.1822, #Código do RJ
	"start_date": "2024-01-01",
	"end_date": "2024-08-01", #Intervalo de datas
	"daily": ["weather_code", "temperature_2m_mean"], #código e temperatura média diária
	"timezone": "auto"
}

responses = openmeteo.weather_api(url, params=params) #utilizando o pacote deles para ler os dados

daily = responses[0].Daily()
daily_temperature_2m_mean = daily.Variables(1).ValuesAsNumpy()
daily_weather_code = daily.Variables(0).ValuesAsNumpy().astype(int).astype(str)

#Criando o dicionário com as datas do intervalo de datas para criar um dataframe
daily_data = {"date": pd.date_range(
	start = pd.to_datetime(daily.Time(), unit = "s", utc = True),
	end = pd.to_datetime(daily.TimeEnd(), unit = "s", utc = True),
	freq = pd.Timedelta(seconds = daily.Interval()),
	inclusive = "left"
)}

daily_data["temperature_2m_mean"] = daily_temperature_2m_mean #adicionando temperatura diário
daily_data["weather_code"] = daily_weather_code #Adicionando código do clima

df_clima = pd.DataFrame(data = daily_data) #Criando o dataframe
df_clima['date'] = pd.to_datetime(df_clima['date']).dt.date #convertendo o formato da data para remover as horas, minutos,...

# Perguntas
1. Quantos feriados há no Brasil em todo o ano de 2024?

In [46]:
#Pergunta 01
qtd_feriados = df_feriados['date'].count()
#qtd_feriados = df_feriados['name'].nunique() #caso queira saber quantos feriados distintos ocorrem em 2024 (embora o carnaval ocorra 2 dias ele seria contado uma vez como 'o feriado de carnaval', mas para efeito análitico isso atrapalharia)
print(f'Quantidade de feriados: {qtd_feriados}')

Quantidade de feriados: 14


2. Qual mês de 2024 tem o maior número de feriados?  
R: Os meses de Fevereiro, Março, Maio e Novembro possuem os maiores números de feriados, todos com 2 feriados.

In [47]:
#Pergunta 02
df_feriados['month'] = pd.to_datetime(df_feriados['date']).dt.month
qtd_feriados_mes = df_feriados['month'].value_counts().sort_values(ascending=False) #Empate quádruplo
qtd_feriados_mes

Unnamed: 0_level_0,count
month,Unnamed: 1_level_1
2,2
3,2
5,2
11,2
1,1
4,1
7,1
9,1
10,1
12,1


3. Quantos feriados em 2024 caem em dias de semana (segunda a sexta-feira)?

In [48]:
#Pergunta 03
df_feriados['weekday'] = pd.to_datetime(df_feriados['date']).dt.weekday
#df_feriados_semana = df_feriados[(df_feriados['weekday'] > 0) & (df_feriados['weekday'] < 5)]['date'].count() #filtro convencional
df_feriados_semana = df_feriados.query('weekday > 0 and weekday < 5')['date'].count() #descobri o 'query' e resolvi usar
print(f'Quantidade de feriados em dias de semana: {df_feriados_semana}')

Quantidade de feriados em dias de semana: 7


4. Qual foi a temperatura média em cada mês?

In [49]:
#Pergunta 04
df_clima['month'] = pd.to_datetime(df_clima['date']).dt.month
df_clima_mes = df_clima.groupby('month')['temperature_2m_mean'].mean().sort_index()
df_clima_mes

Unnamed: 0_level_0,temperature_2m_mean
month,Unnamed: 1_level_1
1,26.694233
2,27.212988
3,26.416479
4,25.16993
5,24.99074
6,22.648958
7,21.105591
8,21.225414


5. Qual foi o tempo predominante em cada mês nesse período?

In [50]:
# --- Código clima ---
import json
url = 'https://gist.githubusercontent.com/stellasphere/9490c195ed2b53c707087c8c2db4ec0c/raw/descriptions.json' #lendo o arquivo .json direto do git solicitado
response = requests.get(url)
data = json.loads(response.text)

df_clima_code = pd.DataFrame() #Criando um dataframe para salvar os códigos de clima

for key in data.keys(): #iterando sob as chaves do dicionário importado do GitHub
  description = pd.DataFrame(data[key].values())
  description['code'] = key
  df_clima_code = pd.concat([df_clima_code, description], ignore_index=True)

df_clima_code.drop_duplicates(subset='code', inplace=True) #Removendo os códigos duplicados
df_clima = df_clima.merge(df_clima_code[['code', 'description']], left_on='weather_code', right_on='code', how='left') #Mesclando os dataframes pelo código do clima

In [51]:
#Pergunta 05
df_clima_mes_descricao = df_clima.groupby(['month', 'description'])['date'].count().reset_index(name='count') #criando um dataframe de contagem para cada mês e tipo de clima
df_clima_mes_descricao_max = df_clima_mes_descricao.loc[df_clima_mes_descricao.groupby('month')['count'].idxmax()] #Pegando o máximo em cada mês
df_clima_mes_descricao_max

Unnamed: 0,month,description,count
8,1,Rain,10
13,2,Light Drizzle,13
22,3,Light Drizzle,9
27,4,Cloudy,7
36,5,Light Drizzle,10
44,6,Mainly Sunny,12
46,7,Cloudy,8
55,8,Partly Cloudy,1


6. Qual foi o tempo e a temperatura média em cada feriado de 01/01/2024 a 01/08/2024?

In [55]:
#Pergunta 06
df_clima_feriado = df_feriados.merge(df_clima, on='date', how='left')
df_clima_feriado[['date','localName','temperature_2m_mean','description']]

Unnamed: 0,date,localName,temperature_2m_mean,description
0,2024-01-01,Confraternização Universal,24.854582,Light Drizzle
1,2024-02-12,Carnaval,30.156668,Mainly Sunny
2,2024-02-13,Carnaval,30.53167,Light Drizzle
3,2024-03-29,Sexta-feira Santa,25.044168,Light Rain
4,2024-03-31,Domingo de Páscoa,24.531664,Drizzle
5,2024-04-21,Dia de Tiradentes,23.087919,Partly Cloudy
6,2024-05-01,Dia do Trabalhador,28.108751,Sunny
7,2024-05-30,Corpus Christi,20.779579,Light Drizzle
8,2024-07-09,Revolução Constitucionalista de 1932,21.487915,Drizzle
9,2024-09-07,Dia da Independência,,


7. Considere as seguintes suposições:
   - O cidadão carioca considera "frio" um dia cuja temperatura média é menor que 20ºC;
   - Um feriado bem aproveitado no Rio de Janeiro é aquele em que se pode ir à praia;
   - O cidadão carioca só vai à praia quando não está com frio;
   - O cidadão carioca também só vai à praia em dias com sol, evitando dias **totalmente** nublados ou chuvosos (considere _weather_code_ para determinar as condições climáticas).

   Houve algum feriado "não aproveitável" em 2024? Se sim, qual(is)?  
   R: Não houve nenhum feriado "não aproveitável" até o momento.

In [75]:
#Pergunta 07
df_clima_feriado[(df_clima_feriado['temperature_2m_mean'] < 20) & (df_clima_feriado['description'].isin(["Rain", "Cloudy"]))][['date','localName','temperature_2m_mean','description']]
#Todos os feriados são aproveitáveis

Unnamed: 0,date,localName,temperature_2m_mean,description


8. Qual foi o feriado "mais aproveitável" de 2024?  
R: Dentre os dois feriados com melhor temperatura e clima, na minha opinião, o Carnavrau foi o "mais aproveitável"

In [76]:
#Pergunta 07
df_clima_feriado[(df_clima_feriado['temperature_2m_mean'] > 20) & (df_clima_feriado['description'].str.contains("Sunny"))][['date','localName','temperature_2m_mean','description']]
#Carnaval o melhor feriado do ano!

Unnamed: 0,date,localName,temperature_2m_mean,description
1,2024-02-12,Carnaval,30.156668,Mainly Sunny
6,2024-05-01,Dia do Trabalhador,28.108751,Sunny
