<a href="https://colab.research.google.com/github/cff100/pjenergy/blob/main/Obten%C3%A7%C3%A3o_de_dados/Gera%C3%A7%C3%A3o_Dataframe_Vento.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
''' INFO
Gera dataframes .csv a partir dos arquivos .nc
Na pasta data/dataframe_ventos há os arquivos .csv gerados (dataframes_ventos_por_ano)
Posteriormente os .csv dataframes_ventos_por_ano foram unidos e separados por plataforma (dataframes_ventos_por_plataforma).
É assim que eles dão utilizados nos outros códigos.
'''


# IMPORTAÇÕES E INSTALAÇÕES

import math
import xarray as xr
import pandas as pd
from datetime import datetime, timedelta

In [None]:
# CONSTANTES, INPUTS E FUNÇÕES

# Constantes
PA = 101.325  # Pressão atmosférica ao nível do mar em kPa
k = 1.21e-5   # Constante em s²/m²
g = 9.81      # Aceleração gravitacional em m/s²

# Função para calcular a altura a partir da pressão
def calcular_altura(PA, k, P_h, g):
  # P_h: Pressão a uma altura h (em KPa)
  altura = -math.log(P_h / PA) / (k * g)
  return altura

# Função para converter horário de Brasília para UTC
def brasilia_para_utc(horario_brasilia):
  brasilia_time = datetime.strptime(horario_brasilia, '%H:%M')
  utc_time = brasilia_time + timedelta(hours=3)
  return utc_time.strftime('%H:%M')


# Função para converter temperatura de Kelvin para Celsius
def kelvin_para_celsius(kelvin):
  return kelvin - 273.15

# Função para verificar se a data é válida
def data_valida(dia, mes, ano):
  try:
      datetime(ano, mes, dia)
      return True
  except ValueError:
      return False


def estacao_do_ano(dia, mes):
  """
  Retorna a estação do ano no hemisfério sul com base na data fornecida.

  Parâmetros:
  dia (int): O dia do mês.
  mes (int): O mês (1-12).

  Retorna:
  str: A estação correspondente ('Verão', 'Outono', 'Inverno', 'Primavera').
  """

  """
  Note que os dias em que se iniciam e terminam uma estação variam de ano em ano.
  Contudo, a diferença máxima é de dois dias então foram consideradas como padrão as datas de 2023.
  """

  # Verão: 21 de Dezembro a 20 de Março
  if (mes == 12 and dia >= 21) or (1 <= mes <= 2) or (mes == 3 and dia <= 20):
      return 'Verão'
  # Outono: 21 de Março a 20 de Junho
  elif (mes == 3 and dia >= 21) or (4 <= mes <= 5) or (mes == 6 and dia <= 20):
      return 'Outono'
  # Inverno: 21 de Junho a 22 de Setembro
  elif (mes == 6 and dia >= 21) or (7 <= mes <= 8) or (mes == 9 and dia <= 22):
      return 'Inverno'
  # Primavera: 23 de Setembro a 20 de Dezembro
  elif (mes == 9 and dia >= 23) or (10 <= mes <= 11) or (mes == 12 and dia <= 20):
      return 'Primavera'

# Níveis de pressão em KPa
niveis_pressao = [90.0, 92.5, 95.0, 97.5, 100.0]

# Horas
horas = ['03:00', '09:00', '15:00', '21:00']

# Dias, meses e anos
anos = [ano for ano in range(2010, 2024)]
meses = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
dias = [d for d in range(1, 32)]


# Coordenadas das plataformas
plataformas = {
    'NAMORADO 2 (PNA-2)': (-22.45073, -40.41175),
    'PETROBRAS 26 (P-26)': (-22.4684, -40.02869),
    'PETROBRAS 32 (P-32)': (-22.2051, -40.1431),
    'PETROBRAS 37 (P-37)': (-22.4868, -40.09779),
    'PETROBRAS IX': (-22.57358, -40.82192),
    'PETROBRAS XIX': (-22.3927, -40.05438),
    'PETROBRAS XXXIII': (-22.37, -40.0267),
    'VERMELHO 1 (PVM-1)': (-22.16065, -40.27872),
    'VERMELHO 2 (PVM-2)': (-22.17535, -40.29147),
}








In [None]:
# Lista de arquivos .nc de diferentes anos
arquivos_era5 = {'Era5_Vento_CAMPOS(2010-2011).nc':[2010,2011], 'Era5_Vento_CAMPOS(2012-2013).nc':[2012,2013],
                'Era5_Vento_CAMPOS(2014-2015).nc':[2014,2015], 'Era5_Vento_CAMPOS(2016-2017).nc':[2016,2017],
                 'Era5_Vento_CAMPOS(2018-2019).nc':[2018,2019], 'Era5_Vento_CAMPOS(2020-2021).nc':[2020,2021],
                 'Era5_Vento_CAMPOS(2022-2023).nc':[2022,2023]
}

lista_arq_era5 = list(arquivos_era5.keys())

lista_arq_csv = [nome[:-3] + '.csv' for nome in lista_arq_era5]


In [None]:
'''
Anos 2010-2011 --------------------------------------------------------------------
'''

i = 0

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()



# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)



Data inválida: 29/2/2010
Data inválida: 30/2/2010
Data inválida: 31/2/2010
Data inválida: 31/4/2010
Data inválida: 31/6/2010
Data inválida: 31/9/2010
Data inválida: 31/11/2010
Data inválida: 29/2/2011
Data inválida: 30/2/2011
Data inválida: 31/2/2011
Data inválida: 31/4/2011
Data inválida: 31/6/2011
Data inválida: 31/9/2011
Data inválida: 31/11/2011


KeyError: "None of [Index(['Ano', 'Mês', 'Dia'], dtype='object')] are in the [columns]"

In [None]:
'''
Anos 2012-2013 --------------------------------------------------------------------
'''

i = 1

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()




# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)

Data inválida: 30/2/2012
Data inválida: 31/2/2012
Data inválida: 31/4/2012
Data inválida: 31/6/2012
Data inválida: 31/9/2012
Data inválida: 31/11/2012
Data inválida: 29/2/2013
Data inválida: 30/2/2013
Data inválida: 31/2/2013
Data inválida: 31/4/2013
Data inválida: 31/6/2013
Data inválida: 31/9/2013
Data inválida: 31/11/2013


In [None]:
'''
Anos 2014-2015 --------------------------------------------------------------------
'''

i = 2

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()




# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)

Data inválida: 29/2/2014
Data inválida: 30/2/2014
Data inválida: 31/2/2014
Data inválida: 31/4/2014
Data inválida: 31/6/2014
Data inválida: 31/9/2014
Data inválida: 31/11/2014
Data inválida: 29/2/2015
Data inválida: 30/2/2015
Data inválida: 31/2/2015
Data inválida: 31/4/2015
Data inválida: 31/6/2015
Data inválida: 31/9/2015
Data inválida: 31/11/2015


In [None]:
'''
Anos 2016-2017 --------------------------------------------------------------------
'''

i = 3

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()




# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)

Data inválida: 30/2/2016
Data inválida: 31/2/2016
Data inválida: 31/4/2016
Data inválida: 31/6/2016
Data inválida: 31/9/2016
Data inválida: 31/11/2016
Data inválida: 29/2/2017
Data inválida: 30/2/2017
Data inválida: 31/2/2017
Data inválida: 31/4/2017
Data inválida: 31/6/2017
Data inválida: 31/9/2017
Data inválida: 31/11/2017


In [None]:
'''
Anos 2018-2019 --------------------------------------------------------------------
'''

i = 4

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()




# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)

Data inválida: 29/2/2018
Data inválida: 30/2/2018
Data inválida: 31/2/2018
Data inválida: 31/4/2018
Data inválida: 31/6/2018
Data inválida: 31/9/2018
Data inválida: 31/11/2018
Data inválida: 29/2/2019
Data inválida: 30/2/2019
Data inválida: 31/2/2019
Data inválida: 31/4/2019
Data inválida: 31/6/2019
Data inválida: 31/9/2019
Data inválida: 31/11/2019


In [None]:
'''
Anos 2020-2021 --------------------------------------------------------------------
'''

i = 5

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()




# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)

Data inválida: 30/2/2020
Data inválida: 31/2/2020
Data inválida: 31/4/2020
Data inválida: 31/6/2020
Data inválida: 31/9/2020
Data inválida: 31/11/2020
Data inválida: 29/2/2021
Data inválida: 30/2/2021
Data inválida: 31/2/2021
Data inválida: 31/4/2021
Data inválida: 31/6/2021
Data inválida: 31/9/2021
Data inválida: 31/11/2021


In [None]:
'''
Anos 2022-2023 --------------------------------------------------------------------
'''

i = 6

arquivo_nc = lista_arq_era5[i]
arquivo_csv = lista_arq_csv[i]

# Carrega o arquivo NetCDF usando xarray
ds = xr.open_dataset(arquivo_nc, engine='h5netcdf')

# Renomeia a coordenada 'valid_time' para 'time'
ds = ds.rename({'valid_time': 'time'})

anos = arquivos_era5[arquivo_nc]

ano_df = pd.DataFrame()

# Nomeia o índice do DataFrame
ano_df.index.name = 'Índice'


# Loop sobre cada ano
for ano in anos:

  # Cria um DataFrame vazio para armazenar os resultados combinados dos meses
  mes_df = pd.DataFrame()

  # Loop sobre cada mês
  for mes in meses:

    # Cria um DataFrame vazio para armazenar os resultados combinados dos dias
    dia_df = pd.DataFrame()

    # Loop sobre cada dia
    for dia in dias:

      # Verifica se a data existe
      if not data_valida(dia, mes, ano):
        print(f"Data inválida: {dia}/{mes}/{ano}")
        continue  # Pula esta iteração se o dia não for válido

      # Cria um DataFrame vazio para armazenar os resultados combinados dos níveis de pressão
      nivel_df = pd.DataFrame()

      # Loop sobre cada nível de pressão
      for nivel in niveis_pressao:

        # Cria um DataFrame vazio para armazenar os resultados combinados das horas
        hora_df = pd.DataFrame()

        # Loop sobre cada hora
        for hora in horas:

          #Função para obter a hora UTC (Tempo Universal Coordenado) a partir da hora de Brasília
          hora_utc = brasilia_para_utc(hora)

          # Filtros
          filtra_hora = ds.time.dt.strftime('%H:%M') == hora_utc
          filtra_nivel = ds['pressure_level'] == nivel*10
          filtra_dia = ds.time.dt.day == dia
          filtra_mes = ds.time.dt.month == mes
          filtra_ano = ds.time.dt.year == ano

          # Aplicação dos filtros com where
          ds_f = ds.where(filtra_hora & filtra_nivel & filtra_dia & filtra_mes & filtra_ano, drop=True)

          # DataArray das velocidades
          u = ds_f['u']
          v = ds_f['v']

          # Calcula a velocidade resultante do vento (wspd)
          wspd = (u**2 + v**2)**0.5

          # DataArray das temperaturas
          temp = ds_f['t']

          # Cria um DataFrame vazio para armazenar os resultados combinados das plataformas
          unico_df = pd.DataFrame()

          # Loop sobre cada plataforma
          for plataforma, (lat, lon) in plataformas.items():

            # Interpola o valor das componentes da velocidade do vento
            vento_u = u.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            vento_v = v.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Interpola o valor da resultante da velocidade do vento
            vento_resultante = wspd.interp(latitude=lat, longitude=lon, method='nearest').values.item()

            # Interpola o valor da temperatura em Kelvin
            temp_kelvin = temp.interp(latitude=lat, longitude=lon, method='nearest').values.item()
            # Converte a temperatura para Celsius
            temp_celsius = kelvin_para_celsius(temp_kelvin)

            # Chama a função que determina a estação do ano a partir da data
            estacao = estacao_do_ano(dia, mes)

            # Adiciona uma linha com cada coluna para cada plataforma
            unico_df = pd.concat([unico_df, pd.DataFrame({
                      'Plataforma': plataforma,
                      'Velocidade_Vento_u_m/s': vento_u,
                      'Velocidade_Vento_v_m/s': vento_v,
                      'Velocidade_Vento_resultante_m/s': vento_resultante,
                      'Temperatura_K': temp_kelvin,
                      'Temperatura_C': temp_celsius,
                      'Dia': dia,
                      'Mês': mes,
                      'Ano': ano,
                      'Estação_do_Ano': estacao
                  }, index=[0])], ignore_index=True)


          #Adiciona as colunas de hora
          unico_df['Horário_Brasília'] = hora
          unico_df['Horário_UTC'] = hora_utc

          # Adiciona o DataFrame unico atual ao DataFrame da hora atual
          hora_df = pd.concat([hora_df, unico_df], ignore_index=True)

        # Adiciona a coluna de pressão
        hora_df['Nível_de_Pressão_hPa'] = int(nivel*10)

        # Calcula a altura correspondente ao nível de pressão atual
        altura = calcular_altura(PA, k, nivel, g)
        # Adiciona a coluna de altura
        hora_df['Altitude_m'] = altura

        # Adiciona o DataFrame da hora atual ao DataFrame de nível da pressão atual
        nivel_df = pd.concat([nivel_df, hora_df], ignore_index=True)

      # Adiciona a coluna de dia
      nivel_df['Dia'] = dia
      # Adiciona o DataFrame do nível de pressão atual ao DataFrame do dia atual
      dia_df = pd.concat([dia_df, nivel_df], ignore_index=True)

    # Adiciona a coluna de mês
    dia_df['Mês'] = mes
    # Adiciona o DataFrame do dia atual ao DataFrame do mês atual
    mes_df = pd.concat([mes_df, dia_df], ignore_index=True)

  # Adiciona a coluna de ano
  mes_df['Ano'] = ano
  # Adiciona o DataFrame do nível do mês atual ao DataFrame combinado
  ano_df = pd.concat([ano_df, mes_df], ignore_index=True)

  # Fecha o arquivo NetCDF
  ds.close()




# Criar a coluna 'Data' a partir das colunas 'Ano', 'Mês' e 'Dia'
ano_df['Data'] = pd.to_datetime(ano_df[['Ano', 'Mês', 'Dia']].rename(columns={'Ano':'year', 'Mês':'month', 'Dia':'day'}), errors='coerce') # Rename columns to match expected names

# Remover as colunas 'Ano', 'Mês' e 'Dia'
ano_df = ano_df.drop(columns=['Ano', 'Mês', 'Dia'])

# Ajusta a ordem das colunas
ano_df = ano_df[['Plataforma', 'Nível_de_Pressão_hPa', 'Altitude_m', 'Estação_do_Ano', 'Data', 'Horário_Brasília', 'Horário_UTC',
                           'Velocidade_Vento_u_m/s', 'Velocidade_Vento_v_m/s', 'Velocidade_Vento_resultante_m/s', 'Temperatura_K', 'Temperatura_C']]

# Salvar o DataFrame combinado como um arquivo CSV
ano_df.to_csv(arquivo_csv, encoding='utf-8', index=True)

Data inválida: 29/2/2022
Data inválida: 30/2/2022
Data inválida: 31/2/2022
Data inválida: 31/4/2022
Data inválida: 31/6/2022
Data inválida: 31/9/2022
Data inválida: 31/11/2022
Data inválida: 29/2/2023
Data inválida: 30/2/2023
Data inválida: 31/2/2023
Data inválida: 31/4/2023
Data inválida: 31/6/2023
Data inválida: 31/9/2023
Data inválida: 31/11/2023
