In [223]:
import pandas as pd
import numpy as np
import re
import openpyxl

from metar_taf_parser.parser.parser import MetarParser

Metars de ejemplo, en la practica se puede recorrer un archivo csv y obtener la lista de metars a usar

In [224]:
metares = ['KTTN 051853Z 04011KT 9999 VCTS SN FZFG BKN003 OVC010 M02/M02 A3006',
           'MMAA 021442Z 35003KT 6SM SKC 29/19 A2987 RMK SLP116 52025 900 HZY ISOL CI',
           'MMGL 021444Z 00000KT 7SM SCT300 21/01 A3016 RMK SLP099 52014 904 8/002 HZY',
           'MMMX 021515Z 19003KT 8SM SKC 23/02 A3028 NOSIG RMK HZY RMK 8/100']

In [225]:
df = pd.DataFrame(columns=['ICAO', 'day', 'time', 'wind_dir', 'wind_speed', 'wind_gust', 'visibility', 'weather', 'cloudsheight1', 'cloudsquantity1', 
                           'cloudsheight2', 'cloudsquantity2', 'cloudsheight3', 'cloudsquantity3',
                           'temperature', 'dewpoint', 'altimeter', 'remark'])

In [226]:
df_metars = pd.DataFrame() 
for metar in metares:
    parse = MetarParser().parse(metar)
    df_metars['ICAO'] = [parse.station]
    df_metars['day'] = [parse.day]
    df_metars['time'] = [parse.time]
    df_metars['wind_dir'] = [parse.wind.degrees]
    df_metars['wind_speed'] = [parse.wind.speed]
    df_metars['wind_gust'] = [parse.wind.gust if parse.wind.gust else np.nan]
    df_metars['visibility'] = [parse.visibility.distance.replace('SM', '')]
    df_metars['weather'] = [parse.weather_conditions[0].descriptive.name if parse.weather_conditions else np.nan]
    df_metars['cloudsheight1'] = [parse.clouds[0].height if len(parse.clouds) >= 1 else np.nan]
    df_metars['cloudsquantity1'] = [parse.clouds[0].quantity.name if parse.clouds[0].quantity.name else np.nan]
    df_metars['cloudsheight2'] = [parse.clouds[1].height if len(parse.clouds) >= 2 else np.nan]
    df_metars['cloudsquantity2'] = [parse.clouds[1].quantity.name if len(parse.clouds) >= 2 else np.nan]
    df_metars['cloudsheight3'] = [parse.clouds[2].height if len(parse.clouds) >= 3 else np.nan]
    df_metars['cloudsquantity3'] = [parse.clouds[2].quantity.name if len(parse.clouds) >= 3 else np.nan]
    df_metars['temperature'] = [parse.temperature]
    df_metars['dewpoint'] = [parse.dew_point]
    df_metars['altimeter'] = [parse.altimeter]
    RE = r'^8/.{3}$'
    remarks = parse.remarks
    rmk = [s for s in remarks if re.match(RE, s)]
    df_metars['remark'] = [rmk[0] if rmk else np.nan]
    df = pd.concat([df, df_metars], ignore_index=True)

df.to_excel('metars.xlsx', index=False)

In [227]:
df

Unnamed: 0,ICAO,day,time,wind_dir,wind_speed,wind_gust,visibility,weather,cloudsheight1,cloudsquantity1,cloudsheight2,cloudsquantity2,cloudsheight3,cloudsquantity3,temperature,dewpoint,altimeter,remark
0,KTTN,5,18:53:00,40,11,,> 10km,THUNDERSTORM,300.0,BKN,1000.0,OVC,,,-2,-2,1017,
1,MMAA,2,14:42:00,350,3,,6,,,SKC,,,,,29,19,1011,
2,MMGL,2,14:44:00,0,0,,7,,30000.0,SCT,,,,,21,1,1021,8/002
3,MMMX,2,15:15:00,190,3,,8,,,SKC,,,,,23,2,1025,8/100


In [None]:
import os

# Cambia esta ruta al directorio donde están tus archivos CSV
ruta_carpeta = 'C:/Users/richa/OneDrive/Desktop/DATOS_NL/Temperatura del Aire Diaria/Temperatura del Aire Diaria'

# Busca todos los archivos CSV en la carpeta
archivos = [f for f in os.listdir(ruta_carpeta) if f.endswith('.csv')]

for archivo in archivos:
    # Lee el archivo CSV y asume que las dos primeras columnas contienen 'Fecha' y 'Temperatura promedio'
    ruta_archivo = os.path.join(ruta_carpeta, archivo)
    datos = pd.read_csv(archivo, usecols=[0, 1])
    num_est = str(archivo[1:6])
    datonulo = {num_est: datos.iloc[:, 1].isnull().sum()}
    datos['Fecha'] = pd.to_datetime(datos['Fecha'])
    datos = datos.sort_values('Fecha', ascending=False)
    datos = datos.rename(columns={'Promedio': num_est})
    
    datos_combinados = pd.merge(datos_combinados, datos, on='Fecha', how='outer')