# Análise e exploração de dados

Este ficheiro é para me "ambientar" com o que é pedido.
O "trabalho" oficial está no reposítório **git** da equipa: 
https://bitbucket.org/anadi-rita/anadi/src/main/

~~~bash
git clone git@bitbucket.org:anadi-rita/anadi.git
~~~

## Imports

In [None]:
from pathlib import Path
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import utilidades as ut

## Variáveis

In [None]:
proj_root_dir = Path(".").resolve().parent.parent
data_files_dir = "/ficheiros/Trabalho 1/"
ficheiro_dados_co = f"{proj_root_dir}{data_files_dir}CO_data.csv"
ficheiro_dicio_dados_co = f"{proj_root_dir}{data_files_dir}CO_data_dicionario.xlsx"

## Carregar os dados

In [None]:
dados_co = pd.read_csv(
    ficheiro_dados_co,
    delimiter=",",
    header=0,
)

### Espreitar os dados

In [None]:
dados_co.head()

## Carregar o dicionário

In [None]:
dicionario_dados = pd.read_excel(ficheiro_dicio_dados_co)

## Análise e exploração de dados

Ponto 4.1 do trabalho

### Ponto 1
Construa um gráfico que permita visualizar as emissões totais de CO2 de Portugal no período 1900-2021. Encontre o ano em que foi emitido um valor máximo de CO2

#### Extrair os dados de Portugal

In [None]:
dados_co_pt = dados_co[dados_co.country == "Portugal"]

In [None]:
dados_co_pt_plt = dados_co_pt.loc[:, ["year", "co2"]]

In [None]:
dados_co_pt_plt.head()

#### Cálcular o máximo

In [None]:
maximo_co2 = dados_co_pt_plt["co2"].max()
maximo_co2

In [None]:
ano_maximo_co2 = dados_co_pt_plt.loc[dados_co_pt_plt["co2"].idxmax(), "year"]
ano_maximo_co2

#### Interface implicita

In [None]:
plt.figure(
    figsize=(10, 6),
)
plt.plot("year", "co2", data=dados_co_pt_plt, color="blue")
plt.xlabel("Ano")
plt.ylabel("Emissão CO2 (milhões de toneladas)")
plt.title("Emissões de CO2 em Portugal entre 1900 e 2021")
plt.ylim(0, maximo_co2 + 10)
plt.annotate(
    f"Máximo emissão ({ano_maximo_co2})",
    xy=(ano_maximo_co2, maximo_co2),  # Ponto a anotar
    xycoords="data",  # Sistema de coordenadas do ponto a anotar 
    xytext=(0, 3), # Offset do texto em relação ao ponto anotado
    textcoords="offset fontsize",  # Sistema de coordenadas do texto
    horizontalalignment="center",
    arrowprops=dict(
        facecolor='black',
        width=1,
        headwidth=8,
        shrink=0.05,
    )
)

#### Interface explicita

In [None]:
fig, ax = plt.subplots(figsize=(12, 8))
linha = ax.plot(
    "year",  # Seria a utilizar para o eixo dos XX.
    "co2",  # Seria a utilizar para o eixo dos YY.
    data=dados_co_pt_plt,  # Estrutura de dados a utilizar, neste caso 1 DataFrame. 
    color="blue",  # Cor da "linha".
)
# Configuraçao do ``Axes``.
ax.set_title(r"Emissões de CO$_2$ em Portugal entre 1900 e 2021")
ax.set_xlabel("Ano")
ax.set_ylabel(r"Emissão CO$_2$ (milhões de toneladas)")
ax.set_ylim(0, maximo_co2 + 10)
# Anotação do ponto máximo, o cálculo é feito anteriormente. 
ax.annotate(
    f"Máximo emissão ({ano_maximo_co2})",
    xy=(ano_maximo_co2, maximo_co2),  # Ponto a anotar
    xycoords="data",  # Sistema de coordenadas do ponto a anotar 
    xytext=(0, 3), # Offset do texto em relação ao ponto anotado
    textcoords="offset fontsize",  # Sistema de coordenadas do texto
    horizontalalignment="center",
    arrowprops=dict(
        facecolor='black',
        width=1,
        headwidth=8,
        shrink=0.05,
    )
)
plt.show()