In [1]:
import pandas as pd
import os
import numpy as np
import matplotlib.pyplot as plt

In [22]:
# Extraindo o diretório que estamos trabalhando
cwd = os.getcwd()
print('Diretório atual: ' + cwd)

# Estabelecendo a pasta de dados que quero utilizar
dataPath = os.path.dirname(cwd) + '\\ENS410064\\dados_trabalho'
print('Diretório de dados: ' + dataPath)

Diretório atual: c:\Users\alysson.assis\OneDrive - ARAXA\Documentos\Tópicos especiais-Python in Environmental Applications\ENS410064
Diretório de dados: c:\Users\alysson.assis\OneDrive - ARAXA\Documentos\Tópicos especiais-Python in Environmental Applications\ENS410064\dados_trabalho


In [23]:
# Listando arquivos com o nome iniciando em metar
prefixed = [filename for filename in os.listdir(dataPath) if filename.startswith("metar_SBFL")]

dataList = prefixed

print(prefixed)

['metar_SBFL_2013.csv', 'metar_SBFL_2014.csv', 'metar_SBFL_2015.csv', 'metar_SBFL_2016.csv', 'metar_SBFL_2017.csv', 'metar_SBFL_2018.csv', 'metar_SBFL_2019.csv', 'metar_SBFL_2020.csv', 'metar_SBFL_2021.csv', 'metar_SBFL_2022.csv', 'metar_SBFL_2023.csv']


In [24]:
# Extraindo os anos dos dados
# Trabalhando com o nome dos arquivos
years = []
for dl in dataList:
    if os.path.isfile(dataPath+'\\'+dl):
        years.append(dl.split('_')[-1].split('.')[0])
    else:
        print('Não é um arquivo')

years = np.unique(years)
print(years)


# Extraindo as estações de dados
stations = []
for dl in dataList:
    if os.path.isfile(dataPath+'\\'+dl):
        stations.append(dl.split('_')[-2])
    else:
        print('Não é um arquivo')

stations = np.unique(stations)
print(stations)

['2013' '2014' '2015' '2016' '2017' '2018' '2019' '2020' '2021' '2022'
 '2023']
['SBFL']


In [25]:
# lendo todos os arquivos da pasta
# Todos os dados devem estar no mesmo formato, com as mesmas colunas
dataAll=[]
for dl in dataList:
    print(dl)
    data = pd.read_csv(dataPath+'\\'+dl)
    dataAll.append(data)

# Concatenando a lista de dados
dataAll = pd.concat(dataAll)
dataAll.head()

metar_SBFL_2013.csv
metar_SBFL_2014.csv
metar_SBFL_2015.csv
metar_SBFL_2016.csv
metar_SBFL_2017.csv
metar_SBFL_2018.csv
metar_SBFL_2019.csv
metar_SBFL_2020.csv
metar_SBFL_2021.csv
metar_SBFL_2022.csv
metar_SBFL_2023.csv


Unnamed: 0,day,month,year,hour,ct,wd,ws,hc,ccp,cco,p,temp,dpTemp,vis,pw,relh
0,1,1,2013,0,,10.0,7.202216,365.76,3.0,3.0,1009.678792,26.0,24.0,,0.0,88.75
1,1,1,2013,1,,320.0,5.658884,365.76,3.0,3.0,1009.675199,26.0,23.0,,0.0,83.55
2,1,1,2013,2,,330.0,7.202216,365.76,3.0,3.0,1009.675199,26.0,23.0,,0.0,83.55
3,1,1,2013,3,,330.0,7.71666,365.76,3.0,3.0,1009.678792,26.0,23.0,,0.0,83.55
4,1,1,2013,4,,330.0,4.629996,365.76,3.0,3.0,1009.682386,25.0,23.0,,0.0,88.67


In [None]:
# Separando dados que serão trabalhados
df_filtrado = dataAll[['month', 'year','wd','ws']]



In [29]:
# Criando uma função para gerar figuras e estastíticas
def statisticsAndFigures (dataAll,st,years,cwd):
    
    from windrose import WindroseAxes
    import matplotlib.dates as mdates
    
    # Criando a pasta das figuras
    os.makedirs(os.path.dirname(cwd) +'\\figuras\\'+st, exist_ok=True)
    
    # Criando uma figura para a estação
    fig, ax = plt.subplots(2)
    ax[0].plot(dataAll.temp,color='red')
    ax[0].set_ylabel('Temperatura (°C)')
    ax[0].xaxis.set_major_locator(mdates.MonthLocator(interval=3))
    # set formatter
    ax[0].xaxis.set_major_formatter(mdates.DateFormatter('%m-%y'))
    ax[0].set_xlim([dataAll.index.min(),dataAll.index.max()])
    ax[1].plot(dataAll.p, color = '#f3c926')
    ax[1].set_ylabel('Pressão atm (mbar)')
    
    fig.suptitle(st)

    # Salvando a figura
    fig.savefig(os.path.dirname(cwd) +'\\figuras\\'+st+'\\timeseries_'+st+'_'+years[0]+'to'+years[-1]+'.png')

    # Criando uma figura para a estação - windrose
    ax = WindroseAxes.from_ax()
    ax.bar(dataAll['wd'], dataAll['ws'], normed=True, opening=0.8, edgecolor="white")
    ax.set_legend()

    # Salvando a figura
    plt.savefig(os.path.dirname(cwd) +'\\figuras\\'+st+'\\windRose_'+st+'_'+years[0]+'to'+years[-1]+'.png')
    
    return fig