# Instruções

<div class="alert alert-block alert-info">
ℹ️ Deve responder às questões no notebook entregue. O notebook deve correr até ao final sem erros dentro da pasta enviada, junto à pasta 'data' com os dados (podem testar com *Kernel->Restart Kernel and Run All Cells...*)

Responda às questões e acrescente células com o código que for necessário.
</div>

<div class="alert alert-block alert-warning">
    ⚠️ <b>Data de entrega:</b> 02-03-2025 23:59<br>
    Penalização de 0.5 valores por cada dia de atraso<br>
    <b>Data final de aceitação:</b> 12-03-2025 23:59
</div>

# Visualização de dados - Avaliação

# Q1
A imagem abaixo, retirada da publicação, SEGURANÇA CONTRA INCÊNDIO EM EDIFÍCIOS - VÍTOR MARTINS PRIMO - Universidade Lusófona do Porto ("**FIGURA 13** - Distribuição dos incêndios de acordo com a causa.") deve ser melhorada. Critique-a e crie uma alternativa com os dados abaixo.

![incendios](img/incendios.png)

O gráfico apresentado acima tem os seguintes apectos a melhorar:
    - o título do gráfico poderia ser mais claro (Ex: Causas dos incêndios em edificios);
    - a legenda encontra-se afastada das fatias, o que dificulta a identificação das causas e a associação com as diferentes fatias;
    - o gráfico em 3d dificulta a perceção do mesmo. Seria preferivel ter um grafico em 2d para uma visualização precisa e objetiva.

In [14]:
import pandas as pd

df = pd.DataFrame([
    ['Acidental', .09],
    ['Descuido', .24],
    ['Intencional', .01],
    ['Falso Alarme', .08],
    ['Infundada', .05],
    ['Indeterminada', .34],
    ['Curto Circuito', .19],
], columns=['causa', 'perc'])

df

Unnamed: 0,causa,perc
0,Acidental,0.09
1,Descuido,0.24
2,Intencional,0.01
3,Falso Alarme,0.08
4,Infundada,0.05
5,Indeterminada,0.34
6,Curto Circuito,0.19


**R:**


In [15]:
import plotly.express as px

fig = px.pie(df, values='perc', names='causa', title='Causas dos incêndios em Edifícios', 
             color_discrete_sequence=px.colors.qualitative.Set2)
fig.update_traces(textinfo='percent+label', pull=[0.05, 0, 0, 0])  
fig.update_layout(title_x=0.5) 
fig.show()


---

# Q2
A imagem abaixo foi retirada da página de um município brasileiro, contendo dados acerca do combate à pandemia nesse local (fonte: https://www.cristais.mg.gov.br/portal/noticias/0/3/114/grafico-de-evolucao-do-covid-no-cenario-restritivo/).

Comente o gráfico, a sua representação e dê sugestões de melhoria, se as tiver.

![cristais_mg](img/sms_cristais.jpg)

**R:**


O gráfico apresentado possui alguns aspectos que podem ser aprimorados:
    - **Título extenso**: Pode ser simplificado para algo mais direto, como "Evolução de Casos Ativos (11 de março a 13 de abril de 2021)".
    - **Uso de gráfico 3D**: Não adiciona valor à análise e pode comprometer a precisão da visualização. Um gráfico 2D seria mais adequado e, considerando a natureza temporal dos dados, um gráfico de linha proporcionaria uma leitura mais clara da evolução dos casos.
    - **Diferenciação entre ondas**: Não está evidente a distinção entre a onda vermelha e a onda roxa, o que pode dificultar a interpretação do impacto de cada fase.
    - **Ênfase na redução dos casos**: Em vez de apresentar a redução de 65,62% apenas em texto, essa informação poderia ser destacada visualmente no próprio gráfico para reforçar o impacto da queda.
    - **Eixo Y sem rótulo**: A inclusão do rótulo "Casos Ativos" ajudaria a contextualizar melhor os valores apresentados.
    - **Posicionamento das informações institucionais**: Dados sobre as organizações responsáveis pela divulgação deveriam estar após o gráfico, evitando interferência na interpretação visual.



In [16]:
casos_ativos = pd.DataFrame([
    ['11-03-2021', 39],
    ['15-03-2021', 51],
    ['16-03-2021', 58],
    ['17-03-2021', 64],
    ['18-03-2021', 58],
    ['19-03-2021', 51],
    ['22-03-2021', 54],
    ['23-03-2021', 43],
    ['25-03-2021', 38],
    ['26-03-2021', 37],
    ['29-03-2021', 35],
    ['30-03-2021', 28],
    ['31-03-2021', 29],
    ['05-04-2021', 25],
    ['06-04-2021', 23],
    ['07-04-2021', 24],
    ['08-04-2021', 25],
    ['09-04-2021', 24],
    ['12-04-2021', 22],
    ['13-04-2021', 24],
], columns=['data', 'casos'])


casos_ativos['data'] = pd.to_datetime(casos_ativos['data'], format='%d-%m-%Y')



casos_ativos


Unnamed: 0,data,casos
0,2021-03-11,39
1,2021-03-15,51
2,2021-03-16,58
3,2021-03-17,64
4,2021-03-18,58
5,2021-03-19,51
6,2021-03-22,54
7,2021-03-23,43
8,2021-03-25,38
9,2021-03-26,37


In [17]:
fig = px.line(casos_ativos, x="data", y="casos", title="Evolução de Casos Ativos (11 de março a 13 de abril de 2021)", markers=True)


fig.update_layout(
    title_x=0.5,
    yaxis=dict(range=[0, max(casos_ativos['casos']) + 5]),
    yaxis_title="Número de Casos Ativos",
    xaxis_title="",
    xaxis=dict(
        tickmode="array",
        tickvals=casos_ativos["data"],
        ticktext=casos_ativos["data"].dt.strftime("%d-%m"),
        type="category"
    ),
)


fig.add_scatter(
    x=casos_ativos[(casos_ativos['data'] >= '2021-03-11') & (casos_ativos['data'] <= '2021-03-19')]['data'],
    y=casos_ativos[(casos_ativos['data'] >= '2021-03-11') & (casos_ativos['data'] <= '2021-03-19')]['casos'],
    mode='lines+markers',
    line=dict(color='red', width=2),
    marker=dict(size=8, color='red', symbol='circle'),
    name="Onda Vermelha"
)


fig.add_scatter(
    x=casos_ativos[(casos_ativos['data'] >= '2021-03-19') & (casos_ativos['data'] <= '2021-04-13')]['data'],
    y=casos_ativos[(casos_ativos['data'] >= '2021-03-19') & (casos_ativos['data'] <= '2021-04-13')]['casos'],
    mode='lines+markers',
    line=dict(color='purple', width=2),
    marker=dict(size=8, color='purple', symbol='circle'),
    name="Onda Roxa"
)

casos_inicial = casos_ativos.loc[casos_ativos["data"] == "2021-03-17", "casos"].values[0]
casos_final = casos_ativos.loc[casos_ativos["data"] == "2021-04-12", "casos"].values[0]
reducao_percentual = ((casos_inicial - casos_final) / casos_inicial) * 100

fig.add_annotation(
    x="2021-04-13", 
    y=casos_final, 
    text=f"Queda de {reducao_percentual:.2f}%", 
    showarrow=True,
    arrowhead=2,
    arrowsize=1,
    arrowcolor="red",
    font=dict(size=14, color="red"),
    ax=-40, ay=-20
)

fig.add_shape(
    type="rect",
    xref="x",
    yref="paper",
    x0="3",   
    x1="18",   
    y0=0.3,             
    y1=0.95,
    fillcolor="rgba(255,0,0,0.3)", 
    line=dict(width=0)  
)


fig.show()

---

# Q3
A imagem abaixo representa uma infografia publicada pelo ***Observatório das migrações***. Faça uma crítica construtiva à infografia, referindo tanto aspectos bem conseguidos como outros a melhorar, caso existam.
Questões para ajudar a começar (mas não devem limitar-se às mesmas):
- Qual o assunto da infografia? É facil perceber qual é?
- A informação transmitida em cada 'parte' é clara?
- O que funciona bem? O que mudariam?

Original: [Infografia-OM-dez-2022](./Infografia-OM-dez-2022.pdf)

![INS](img/Infografia.jpg)

**R:**

O título da infografia é explícito quanto ao tema abordado. Os títulos das seções ilustram claramente os aspectos analisados. A ordem da análise segue uma lógica coerente. Além disso, o esquema de cores é uniforme, facilitando a leitura.

Pontos a melhorar:

    No gráfico de barras, é apresentada a evolução do número de estrangeiros ao longo dos anos de 2011 a 2021. No entanto, no texto explicativo, lê-se: "699 mil estrangeiros residentes em Portugal em 2022". O ano correto deveria ser 2021.

    A informação apresentada no texto sobre o sexo dos estrangeiros não pode ser obtida a partir do gráfico apresentado. O gráfico mostra a distribuição dos estrangeiros residentes em Portugal por sexo, enquanto o texto menciona um aumento da proporção do sexo masculino no total de estrangeiros residentes, o que não é evidenciado visualmente.

---

# Q4
Partindo dos dados incluídos na pasta ```rain/rain_aus.zip```), crie um dashboard simples (min: 4 a 6 elementos) que transmita alguma informação seleccionada desse dataset.

---
Comece por definir o público-alvo, que informação e nível de detalhe faz sentido incluir, como é que vai apresentar a informação e avance para a criação do dashboard. Explique as decisões que levaram à criação desse dashboard em particular: qual o público-alvo, que decisões o dashboard deve ajudar a tomar, que horizonte temporal está a ser analisado, etc.

---
Pode optar por qualquer suporte, não sendo necessário utilizar qualquer software em particular. O dashboard poderá ser uma imagem com uma "colagem" de vários elementos. É, ainda assim, necessário enviar o código que utilizaram para obter esses elementos, para que seja possível reproduzir da minha parte. (Exemplo: Num dashboard que tenha um "Número Total de Pacientes: XXXXX" e algum gráfico, deverão enviar o código que usaram para saber o número XXXX e para criar o gráfico)

---

## Dataset
O *dataset* contém observações diárias da meteorologia de vários locais na Austrália. A variável que interessa prever é "RainTomorrow".
Cada linha representa um dia, cada variável um atributo relativo ao clima ou localização.

## Conteúdo
Este conjunto de dados contém cerca de 10 anos de observações meteorológicas diárias de várias localidades da Austrália.
*RainTomorrow* é a variável alvo a ser prevista. Significa -- choveu no dia seguinte, Sim ou Não? Esta coluna é *Yes* se a precipitação para aquele dia foi de 1mm ou mais.

## Fonte
Observações retiradas de variadas estações meteorológicas. As observações diárias estão disponíveis em http://www.bom.gov.au/climate/data.

Definições das variáveis adaptadas de http://www.bom.gov.au/climate/dwo/IDCJDW0000.shtml

---

#### **Variáveis**:

**Date:** Data de observação<br/>
**Location:** Localidade da estação meteorológica<br/>
**MinTemp:** Temperatura mínima (ºC)<br/>
**MaxTemp:** Temperatura máxima (ºC)<br/>
**Rainfall:** Precipitação em mm registada no dia<br/>
**Evaporation:** Evaporação em tanque classe A (mm) em 24h, até às 9h<br/>
**Sunshine:** Número de horas de sol durante o dia<br/>
**WindGustDir:** Direção da maior rajada de vento<br/>
**WindGustSpeed:** Velocidade da maior rajada de vento (Km/h)<br/>
**WindDir9am:** Direção do vento às 9h<br/>
**WindDir3pm:** Direção do vento às 15h<br/>
**WindSpeed9am:** Velocidade do vento às 9h (média nos 10m anteriores)<br/>
**WindSpeed3pm:** Velocidade do vento às 15h (média nos 10m anteriores)<br/>
**Humidity9am:** Humidade às 9h (%)<br/>
**Humidity3pm:** Humidade às 15h (%)<br/>
**Pressure9am:** Pressão atmosférica comparável ao nível do mar às 9h (hpa)<br/>
**Pressure3pm:** Pressão atmosférica comparável ao nível do mar às 15h (hpa)<br/>
**Cloud9am:** Fração do céu coberta por nuvens às 9h (oktas\*)<br/>
**Cloud3pm:** Fração do céu coberta por nuvens às 15h (oktas\*)<br/>
**Temp9am:** Temperatura às 9h (ºC)<br/>
**Temp3pm:** Temperatura às 15h (ºC)<br/>
**RainToday:** "Yes" se a precipitação nas 24h anteriores às 9h exceder 1 mm. "No", caso contrário<br/>
**RainTomorrow:** "Yes" se a precipitação no dia seguinte ao do registo for superior a 1mm. "No", caso contrário<br/>

\* Oktas: unidade de "oitavos". Mede quantos oitavos do céu estão cobertos por nuvens. 0 indica que o céu está completamente limpo e 8 que está completamente coberto.

**Explique as decisões que levaram à criação desse dashboard em particular: qual o público-alvo, que decisões o dashboard deve ajudar a tomar, que horizonte temporal está a ser analisado, etc.**

**R:**

O dashboard apresentado é direcionado ao Ministério do Meio Ambiente, com o objetivo de analisar as mudanças meteorológicas na Austrália ao longo dos anos de 2007 a 2017.

O dashboard foi projetado para facilitar a análise dos padrões climáticos em diferentes regiões da Austrália. Ele permite uma visualização interativa das variações de temperatura, precipitação e eventos climáticos extremos, possibilitando a identificação de tendências e anomalias ao longo do período analisado.

**Decisões que o Dashboard Ajuda a Tomar**

Monitoramento de temperaturas extremas: Permite avaliar a frequência de dias com temperaturas acima de 35°C ou abaixo de 0°C, o que pode ajudar no desenvolvimento de políticas de mitigação contra ondas de calor e frio extremo.

Análise de padrões de precipitação: Identifica tendências de chuvas intensas e períodos de seca, auxiliando na gestão de recursos hídricos e planejamento de ações contra enchentes ou secas prolongadas.

Comparação anual: Facilita a comparação de indicadores climáticos entre anos consecutivos, ajudando a entender se eventos extremos estão se tornando mais frequentes e severos.

Tomada de decisão para políticas públicas: A partir dos dados apresentados, o governo pode criar estratégias para adaptação climática, alertas meteorológicos e medidas de preservação ambiental.

**Horizonte Temporal e Análise**

O dashboard cobre um período de 11 anos (2007 a 2017), permitindo uma avaliação de médio a longo prazo das mudanças climáticas. Essa abordagem ajuda a identificar tendências sazonais e mudanças climáticas graduais que podem impactar o meio ambiente e a sociedade.

**Estrutura do Dashboard**

Overview: Apresenta KPIs gerais, como temperatura máxima e mínima, número de dias acima de 35°C e com precipitação intensa, além da localização geográfica dos dados analisados.

Temperatura: Exibe a evolução da temperatura máxima média mensal, a diferença entre temperaturas máximas e mínimas ao longo do tempo e a frequência de eventos extremos.

Precipitação: Mostra padrões de chuva e a quantidade de dias com precipitação acima de 20 mm, permitindo identificar períodos de estiagem e chuvas intensas.
Esse dashboard fornece insights relevantes para a compreensão das mudanças climáticas, auxiliando na formulação de políticas públicas e estratégias ambientais eficazes.


Em anexo temos o ficheiro "1_utils.py" que deu origem a um novo excel com a latitude e longitude das diferentes localizacoes ("weather_update.csv"). Posteriormente, temos o ficheiro "2_dashboard.py" que construi o dashboard.





