 ##### Quantos feriados há no Brasil em todo o ano de 2024?

In [175]:
import requests
from datetime import datetime

# Definição da URL da API 
url = "https://date.nager.at/api/v3/publicholidays/2024/BR"
# Requisição da URL
response = requests.get(url)

if response.status_code == 200:
    feriados = response.json()
    datas_feriados = [] 
    print(f"Número total de feriados no Brasil em 2024: {len(feriados)}\n")
    for feriado in feriados:
        data_formatada = datetime.strptime(feriado['date'], "%Y-%m-%d").strftime("%d/%m/%Y")
        print(f"{data_formatada}: {feriado['localName']}")
        datas_feriados.append(data_formatada)

Número total de feriados no Brasil em 2024: 14

01/01/2024: Confraternização Universal
12/02/2024: Carnaval
13/02/2024: Carnaval
29/03/2024: Sexta-feira Santa
31/03/2024: Domingo de Páscoa
21/04/2024: Dia de Tiradentes
01/05/2024: Dia do Trabalhador
30/05/2024: Corpus Christi
09/07/2024: Revolução Constitucionalista de 1932
07/09/2024: Dia da Independência
12/10/2024: Nossa Senhora Aparecida
02/11/2024: Dia de Finados
15/11/2024: Proclamação da República
25/12/2024: Natal


 ##### Qual mês de 2024 tem o maior número de feriados?

In [176]:
from collections import Counter
import locale

# Colocando a biblioteca locale para portugues do Brasil
locale.setlocale(locale.LC_TIME, 'pt_BR.UTF-8')
contagem_por_mes = Counter()

for feriado in feriados:
        data_formatada = datetime.strptime(feriado['date'], "%Y-%m-%d")
        # Incrementando o contador para contar todos os meses
        contagem_por_mes[data_formatada.month] += 1
    
# Encontrando o número de feriados em um mês
max_feriados = max(contagem_por_mes.values())

# Encontrando todos os meses que têm o número máximo de feriadosjá que mais de um mês pode ter a quantidade máxima de feriados
meses_com_mais_feriados = [mes for mes, count in contagem_por_mes.items() if count == max_feriados]

# Convertendo os meses que estão em números para nomes
meses_nomes = [datetime(2024, mes, 1).strftime('%B') for mes in meses_com_mais_feriados]

print(f"Os meses com o maior número de feriados em 2024 são: {', '.join(meses_nomes)}, com {max_feriados} feriados cada")


Os meses com o maior número de feriados em 2024 são: fevereiro, marÃ§o, maio, novembro, com 2 feriados cada


 ##### Quantos feriados em 2024 caem em dias de semana (segunda a sexta-feira)?

In [177]:
feriados_dias_de_semana = 0
for feriado in feriados:
        data_formatada = datetime.strptime(feriado['date'], "%Y-%m-%d")
        # Verificando se o feriado cai em um dia de semana 
        if data_formatada.weekday() < 5:  # 0 = segunda 4 = sexta
            feriados_dias_de_semana += 1
    
print(f"Há {feriados_dias_de_semana} feriados que caem em dias de semana no Brasil em 2024")


Há 9 feriados que caem em dias de semana no Brasil em 2024


 ##### Qual foi a temperatura média em cada mês?

In [178]:
start_date = "2024-01-01"
end_date = "2024-08-01"

# Latitude e longitude encontrados aqui https://pt.db-city.com/Brasil--Rio-de-Janeiro--Rio-de-Janeiro
latitude = -22.9035
longitude = -43.2096

# Definição da URL da API 
url = f"https://archive-api.open-meteo.com/v1/archive?latitude={latitude}&longitude={longitude}&start_date={start_date}&end_date={end_date}&daily=temperature_2m_mean&timezone=America/Sao_Paulo"
# Requisição da URL
response = requests.get(url)

if response.status_code == 200:
    dados = response.json()
    
    # Extraindo as temperaturas médias diárias e suas datas
    temperaturas_medias = dados["daily"]["temperature_2m_mean"]
    datas = dados["daily"]["time"]

    soma_temperaturas = {}
    contagem_dias = {}

    for i in range(len(datas)):
        data_atual = datetime.strptime(datas[i], "%Y-%m-%d")
        mes = data_atual.strftime("%Y-%m")
        
        if mes not in soma_temperaturas:
            soma_temperaturas[mes] = 0.0
            contagem_dias[mes] = 0
        
        soma_temperaturas[mes] += temperaturas_medias[i]
        contagem_dias[mes] += 1
# Calcula a média das temperaturas para cada mês dividindo a soma das temperaturas pelo número de dias.
    temperaturas_medias_mensais = {mes: soma_temperaturas[mes] / contagem_dias[mes] for mes in soma_temperaturas}
    
# Ordena os meses e imprime a temperatura média mensal para cada um
    print("Temperaturas médias por mês: ")
    for mes, temperatura_media in sorted(temperaturas_medias_mensais.items()):
        ano, mes_num = mes.split('-')
        nome_mes = datetime(int(ano), int(mes_num), 1).strftime('%B')
        print(f"{nome_mes}: {temperatura_media:.2f}°C")


Temperaturas médias por mês: 
janeiro: 26.75°C
fevereiro: 27.27°C
marÃ§o: 26.47°C
abril: 25.22°C
maio: 25.06°C
junho: 22.70°C
julho: 21.15°C
agosto: 21.30°C


##### Qual foi o tempo predominante em cada mês nesse período?


In [179]:
import json

# Mapeamento dos códigos de tempo para suas descrições
with open(r"C:\Users\Ana Luiza\Desktop\Git\emd-desafio-junior-data-scientist\descriptions.json", 'r') as file:
    dados_json = json.load(file)
codigo_para_descricao = {int(key): value['day']['description'] for key, value in dados_json.items()}

# Definição da URL da API 
url = f"https://archive-api.open-meteo.com/v1/archive?latitude={latitude}&longitude={longitude}&start_date={start_date}&end_date={end_date}&daily=weathercode&timezone=America/Sao_Paulo"

# Requisição da URL
response = requests.get(url)

if response.status_code == 200:
    dados = response.json()

    # Extraindo os tempos diários e as datas
    codigos_tempo = dados["daily"]["weathercode"]
    datas = dados["daily"]["time"]

    contagem_codigos = {}

    for i in range(len(datas)):
        data_atual = datetime.strptime(datas[i], "%Y-%m-%d")
        mes = data_atual.strftime("%Y-%m")
        
        if mes not in contagem_codigos:
            contagem_codigos[mes] = Counter()

        contagem_codigos[mes][codigos_tempo[i]] += 1

    print("Tempo predominante por mês: " )

 # Determinar o tempo predominante por mês
    tempo_predominante = {}
    for mes, contagem in contagem_codigos.items():
        # Encontrar o código de tempo mais frequente no mês
        codigo_mais_frequente = contagem.most_common(1)[0][0]
        descricao_mais_frequente = codigo_para_descricao.get(codigo_mais_frequente, "Desconhecido")
        
        ano, mes_num = mes.split('-')
        mes_num = int(mes_num)
        ano = int(ano)
        mes_nome = datetime(ano, mes_num, 1).strftime("%B")
        tempo_predominante[(ano, mes_num)] = descricao_mais_frequente

    for (ano, mes_num), descricao in sorted(tempo_predominante.items()):
        mes_nome = datetime(ano, mes_num, 1).strftime("%B")
        print(f"{mes_nome}: {descricao}")

Tempo predominante por mês: 
janeiro: Rain
fevereiro: Light Drizzle
marÃ§o: Light Drizzle
abril: Cloudy
maio: Light Drizzle
junho: Mainly Sunny
julho: Cloudy
agosto: Partly Cloudy


In [180]:

datas_feriados_formatada = []

for data in datas_feriados:
    data_obj = datetime.strptime(data, "%d/%m/%Y")
    data_formatada = data_obj.strftime("%Y-%m-%d")
    datas_feriados_formatada.append(data_formatada)

In [181]:
hoje = datetime.now().strftime("%Y-%m-%d")

##### Qual foi o tempo e a temperatura média em cada feriado de 01/01/2024 a 01/08/2024?

In [182]:
import pandas as pd

def obter_dados_climaticos(data):
    url = f"https://archive-api.open-meteo.com/v1/archive?latitude={latitude}&longitude={longitude}&start_date={data}&end_date={data}&daily=temperature_2m_mean,weathercode&timezone=America/Sao_Paulo"
    response = requests.get(url)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Erro ao obter dados climáticos para {data}: {response.status_code} - {response.text}")
        return None
datas = []
temperaturas = []
tempos = []

# Filtrar e obter dados climáticos para feriados antes da data de hoje
for data in datas_feriados_formatada:
    if data < hoje:
        dados_climaticos = obter_dados_climaticos(data)
        if dados_climaticos:
            temperatura_media = dados_climaticos["daily"]["temperature_2m_mean"][0]
            codigo_tempo = dados_climaticos["daily"]["weathercode"][0]
            descricao_tempo = codigo_para_descricao.get(codigo_tempo, "Desconhecido")
            
            # Adicionar os dados às listas
            datas.append(data)
            temperaturas.append(f"{temperatura_media:.2f}°C")
            tempos.append(descricao_tempo)

datas_formatadas = [datetime.strptime(data, "%Y-%m-%d").strftime("%d/%m/%Y") for data in datas]

df = pd.DataFrame({
    "Data": datas_formatadas,
    "Temp Média": temperaturas,
    "Tempo": tempos
})

print(df)

         Data Temp Média          Tempo
0  01/01/2024    24.90°C  Light Drizzle
1  12/02/2024    30.20°C   Mainly Sunny
2  13/02/2024    30.60°C  Light Drizzle
3  29/03/2024    25.10°C     Light Rain
4  31/03/2024    24.60°C        Drizzle
5  21/04/2024    23.10°C  Partly Cloudy
6  01/05/2024    28.20°C          Sunny
7  30/05/2024    20.80°C  Light Drizzle
8  09/07/2024    21.50°C        Drizzle


###### Considere as seguintes suposições:
###### O cidadão carioca considera "frio" um dia cuja temperatura média é menor que 20ºC;
###### Um feriado bem aproveitado no Rio de Janeiro é aquele em que se pode ir à praia;
###### O cidadão carioca só vai à praia quando não está com frio;
###### O cidadão carioca também só vai à praia em dias com sol, evitando dias totalmente nublados ou chuvosos (considere weather_code para determinar as condições climáticas).
##### Houve algum feriado "não aproveitável" em 2024? Se sim, qual(is)?

In [183]:
tempos_a_evitar = ["Cloudy", "Light drizzle", "Drizzle", "Heavy Drizzle","Light Freezing Drizzle", "Freezing Drizzle","Light Rain", "Rain", "Heavy Rain", "Light Freezing Rain", "Freezing Rain", 
                    "Light Showers", "Showers", "Heavy Showers", "Thunderstorm", "Light Thunderstorms With Hail", "Thunderstorm With Hail","Light rain showers"]

df['Temp Média Numero'] = df['Temp Média'].str.replace('°C', '', regex=False)
df['Temp Média Numero'] = pd.to_numeric(df['Temp Média Numero'], errors='coerce')
filtered_df2 = df
filtered_df = df[df['Tempo'].isin(tempos_a_evitar) | (df['Temp Média Numero'] < 20.0)]
filtered_df = filtered_df.drop(columns="Temp Média Numero")

if len(filtered_df) == 0 :
    print("Não houve nenhum feriado \"não aproveitável\" em 2024")
else:
    print("Feriado \"não aproveitável\" em 2024:")
    print(filtered_df)

Feriado "não aproveitável" em 2024:
         Data Temp Média       Tempo
3  29/03/2024    25.10°C  Light Rain
4  31/03/2024    24.60°C     Drizzle
8  09/07/2024    21.50°C     Drizzle


Qual foi o feriado "mais aproveitável" de 2024?
Considere o melhor par tempo e temperatura.

In [184]:
#Definindo pesos para os tempos, sendo o primeiro (ensolarado) o item com maior peso
pesos_tempo = {
    'Sunny': 27,
    'Mainly Sunny': 26,
    'Partly Cloudy': 25,
    'Cloudy': 24,
    'Foggy': 23,
    'Rime Fog': 22,
    'Light Drizzle': 21,
    'Drizzle': 20,
    'Heavy Drizzle': 19,
    'Light Freezing Drizzle': 18,
    'Freezing Drizzle': 17,
    'Light Rain': 16,
    'Rain': 15,
    'Heavy Rain': 14,
    'Light Freezing Rain': 13,
    'Freezing Rain': 12,
    'Light Snow': 11,
    'Snow': 10,
    'Heavy Snow': 9,
    'Snow Grains': 8,
    'Light Showers': 7,
    'Showers': 6,
    'Heavy Showers': 5,
    'Light Snow Showers': 4,
    'Snow Showers': 3,
    'Thunderstorm': 2,
    'Light Thunderstorms With Hail': 1,
    'Thunderstorm With Hail': 0
}

filtered_df2['Peso Tempo'] = filtered_df2['Tempo'].map(pesos_tempo)

# Fazendo um score final com o peso do Tempo e da Temperatura Médiia
filtered_df2['Score'] = filtered_df2['Temp Média Numero'] + filtered_df2['Peso Tempo']
# Definindo a melhor data
melhor_data = filtered_df2.loc[filtered_df2['Score'].idxmax()]

filtered_df2 = filtered_df2.drop(columns='Temp Média Numero')
filtered_df2 = filtered_df2.sort_values(by='Score', ascending=False)

print(melhor_data)

Data                   12/02/2024
Temp Média                30.20°C
Tempo                Mainly Sunny
Temp Média Numero            30.2
Peso Tempo                     26
Score                        56.2
Name: 1, dtype: object


In [185]:
# Outros Scores
filtered_df2

Unnamed: 0,Data,Temp Média,Tempo,Peso Tempo,Score
1,12/02/2024,30.20°C,Mainly Sunny,26,56.2
6,01/05/2024,28.20°C,Sunny,27,55.2
2,13/02/2024,30.60°C,Light Drizzle,21,51.6
5,21/04/2024,23.10°C,Partly Cloudy,25,48.1
0,01/01/2024,24.90°C,Light Drizzle,21,45.9
4,31/03/2024,24.60°C,Drizzle,20,44.6
7,30/05/2024,20.80°C,Light Drizzle,21,41.8
8,09/07/2024,21.50°C,Drizzle,20,41.5
3,29/03/2024,25.10°C,Light Rain,16,41.1
