In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path
import os
from os.path import join
import re
import math

# Coleta de Dados

In [2]:
MODULE_PATH = Path().absolute().parent
DATA_PATH = join(MODULE_PATH, "sources/processed")

In [3]:
processed_data = pd.read_csv(join(DATA_PATH, "processed_data.csv"))

# Dicionário de Dados

In [15]:
keys = processed_data.columns.to_list()[1:-1]

In [5]:
values = [
    "Nas estações automáticas é a medida total de precipitação (chuva), ocorrida na última hora antes de cada mensagem de dados. Nas estações convencionais É a medida do total de precipitação (chuva) que ocorreu no espaço de 24 hora.",
    "Nas estações convencionais é a medida da pressão atmosférica que foi medida na estação, e a partir deste valor, também é calculada a pressão ao nível do mar (para fins sinóticos). Nas estações automáticas é a medida média da pressão atmosférica, também ao nível da estação, ocorrida na última hora antes de cada mensagem de dados.",
    "Nas estações automáticas é a medida da pressão atmosférica máxima, ocorrida na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais.",
    "Nas estações automáticas é medida da pressão atmosférica mínima, ocorrida na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais.",
    "Nas estações automáticas é a medida de toda radiação solar que chegou a superfície terrestre, na última hora antes de cada mensagem de dados. Nas estações convencionais a radiação solar global é medida de forma indireta, cujo registro necessita de processamento posterior, para que se tenha o total de radiação solar global que chegou ao respectivo local.",
    "Nas estações convencionais é a medida da temperatura do ar, a partir do termômetro de bulbo seco do psicrômetro (equipamento dotado de um termômetro de bulbo seco e um termômetro de bulbo úmido). Nas estações automáticas é medida média da temperatura do ar, ocorrida na última hora antes de cada mensagem de dados.",
    "Nas estações convencionais é uma medida determinada de forma indireta (a partir dos valores de temperatura do ar e da umidade relativa), através de valores tabulares. E indica a temperatura que o ar deveria ter, para que ele se tornasse saturado, e assim produzir orvalho. Nas estações automáticas este parâmetro é calculado a partir dos valores de temperatura do ar e da umidade relativa, ocorridos na última hora antes de cada mensagem de dados.",
    "Nas estações convencionais é a medida máxima da temperatura do ar, ocorrida no período de 24 horas, a partir do termômetro específico para este fim. Nas estações automáticas é medida máxima da temperatura do ar, ocorrida na última hora antes de cada mensagem de dados.",
    "Nas estações convencionais é a medida mínima da temperatura do ar, ocorrida no período de 24 horas, a partir do termômetro específico para este fim. Nas estações automáticas é a medida mínima da temperatura do ar, ocorrida na última hora antes de cada mensagem de dados.",
    "Nas estações automáticas este parâmetro é calculado a partir dos valores máximos de temperatura do ar e da umidade relativa, ocorridos na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais.",
    "Nas estações automáticas este parâmetro é calculado a partir dos valores mínimos de temperatura do ar e da umidade relativa, ocorridos na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais.",
    "Nas estações automáticas é a medida máxima da umidade relativa do ar, ocorrida na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais.",
    "Nas estações automáticas é a medida mínima da umidade relativa do ar, ocorrida na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais.",
    "Nas estações convencionais é uma medida determinada de forma indireta, a partir do psicrômetro (equipamento dotado de um termômetro de bulbo seco e um termômetro de bulbo úmido), e o uso de valores tabulares. Nas estações automáticas é a medida da umidade relativa do ar, ocorrida na última hora antes de cada mensagem de dados.",
    "Nas estações automáticas é a medida em graus angulares da direção do vento (de onde o vento vem). Este valor é a média dos últimos 10 minutos antes de cada hora, de envio da mensagem de dados. Nas estações convencionais é a medida da direção do vento, determinada pelas indicações de setor da rosa dos ventos, e se constitui na média dos últimos 10 minutos antes da hora cheia (09:00, ..., 12:00 UTC) de cada observação.",
    "Nas estações automáticas é a medida da velocidade do vento. Este valor é a média dos últimos 10 minutos antes de cada hora, de envio da mensagem de dados. Nas estações convencionais é a medida da velocidade do vento, e determinada a partir da média dos últimos 10 minutos antes da hora cheia (09:00, ..., 12:00 UTC) de cada observação."
]

In [17]:
data_info_df = pd.DataFrame(data=zip(keys, values), columns=["Parâmetro", "Significado"])

In [19]:
pd.options.display.max_colwidth = 500
data_info_df

Unnamed: 0,Parâmetro,Significado
0,"PRECIPITAÇÃO TOTAL, HORÁRIO (mm)","Nas estações automáticas é a medida total de precipitação (chuva), ocorrida na última hora antes de cada mensagem de dados. Nas estações convencionais É a medida do total de precipitação (chuva) que ocorreu no espaço de 24 hora."
1,"PRESSAO ATMOSFERICA AO NIVEL DA ESTACAO, HORARIA (mB)","Nas estações convencionais é a medida da pressão atmosférica que foi medida na estação, e a partir deste valor, também é calculada a pressão ao nível do mar (para fins sinóticos). Nas estações automáticas é a medida média da pressão atmosférica, também ao nível da estação, ocorrida na última hora antes de cada mensagem de dados."
2,PRESSÃO ATMOSFERICA MAX.NA HORA ANT. (AUT) (mB),"Nas estações automáticas é a medida da pressão atmosférica máxima, ocorrida na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais."
3,PRESSÃO ATMOSFERICA MIN. NA HORA ANT. (AUT) (mB),"Nas estações automáticas é medida da pressão atmosférica mínima, ocorrida na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais."
4,RADIACAO GLOBAL (Kj/m²),"Nas estações automáticas é a medida de toda radiação solar que chegou a superfície terrestre, na última hora antes de cada mensagem de dados. Nas estações convencionais a radiação solar global é medida de forma indireta, cujo registro necessita de processamento posterior, para que se tenha o total de radiação solar global que chegou ao respectivo local."
5,"TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)","Nas estações convencionais é a medida da temperatura do ar, a partir do termômetro de bulbo seco do psicrômetro (equipamento dotado de um termômetro de bulbo seco e um termômetro de bulbo úmido). Nas estações automáticas é medida média da temperatura do ar, ocorrida na última hora antes de cada mensagem de dados."
6,TEMPERATURA DO PONTO DE ORVALHO (°C),"Nas estações convencionais é uma medida determinada de forma indireta (a partir dos valores de temperatura do ar e da umidade relativa), através de valores tabulares. E indica a temperatura que o ar deveria ter, para que ele se tornasse saturado, e assim produzir orvalho. Nas estações automáticas este parâmetro é calculado a partir dos valores de temperatura do ar e da umidade relativa, ocorridos na última hora antes de cada mensagem de dados."
7,TEMPERATURA MÁXIMA NA HORA ANT. (AUT) (°C),"Nas estações convencionais é a medida máxima da temperatura do ar, ocorrida no período de 24 horas, a partir do termômetro específico para este fim. Nas estações automáticas é medida máxima da temperatura do ar, ocorrida na última hora antes de cada mensagem de dados."
8,TEMPERATURA MÍNIMA NA HORA ANT. (AUT) (°C),"Nas estações convencionais é a medida mínima da temperatura do ar, ocorrida no período de 24 horas, a partir do termômetro específico para este fim. Nas estações automáticas é a medida mínima da temperatura do ar, ocorrida na última hora antes de cada mensagem de dados."
9,TEMPERATURA ORVALHO MAX. NA HORA ANT. (AUT) (°C),"Nas estações automáticas este parâmetro é calculado a partir dos valores máximos de temperatura do ar e da umidade relativa, ocorridos na última hora antes de cada mensagem de dados. Este parâmetro não é determinado nas estações convencionais."


# Saída de Dados

In [20]:
OUTPUT_PATH = join(MODULE_PATH, "sources/processed")

In [21]:
data_info_df.to_csv(join(OUTPUT_PATH, "data_dictionary.csv"))