In [1]:
import pandas as pd
import os

from urllib.request import urlopen
from urllib.error import HTTPError
from bs4 import BeautifulSoup
from tqdm import tqdm
from numpy import nan

In [None]:
def temperatura_mensual(estacion, annio, mes):
    '''
    Esta funcion devuelve los datos mensuales de cierta estacion
    metereologica.
    Args:
        estacion (int): Codigo nacional de la estacion metereologica
        annio (int): Annio del que se obtendran datos
        mes (int): Mes del que se obtendran datos
    '''
    urlBase = 'https://climatologia.meteochile.gob.cl/application/mensual/temperaturaMediaMensual/'
    
    while True:
        i = 0
        try:
            html = urlopen(urlBase+str(estacion)+'/'+str(annio)+'/'+str(mes))
            break

        except HTTPError as e:
            i += 1
        
        if i > 10:
            break
            
    bs = BeautifulSoup(html.read(), 'html.parser')
    
    dataMensual = pd.DataFrame(columns=['Annio', 'Mes', 'Dia', 'Tminima',
                                 'Tmaxima', 'MediaClimatologica',
                                 'MediaAritmetica', 'Datos'])
    
    i=0
    for dia in bs.findAll('tr', {'class': 'text-center'}):
        dataDia = [annio, mes]
        
        k=0
        for columna in dia.findAll('td'):
            if k in [0,1,3,5,6,7]:
                dataDia.append(columna.get_text()[1:-1])
            k += 1
            
        if len(dataDia) > 2:
            dataMensual.loc[i] = dataDia
            i += 1
        else:
            break
            
    return dataMensual.replace('.', nan)

In [3]:
def precipitaciones_mensual(estacion, annio, mes):
    '''
    Esta funcion devuelve los datos mensuales de cierta estacion
    metereologica.
    Args:
        estacion (int): Codigo nacional de la estacion metereologica
        annio (int): Annio del que se obtendran datos
        mes (int): Mes del que se obtendran datos
    '''
    urlBase = 'https://climatologia.meteochile.gob.cl/application/mensual/aguaCaidaMensual/'
    
    while True:
        i = 0
        try:
            html = urlopen(urlBase+str(estacion)+'/'+str(annio)+'/'+str(mes))
            break

        except HTTPError as e:
            i += 1
        
        if i > 10:
            break
            
    bs = BeautifulSoup(html.read(), 'html.parser')
    
    dataMensual = pd.DataFrame(columns=['Annio', 'Mes', 'Dia', '(12-18]',
                                        '(18-00]', '(00-06]', '(06-12]',
                                        'SumaDiaria', 'AcumuladoMensual'])
    
    i=0
    for dia in bs.findAll('tr', {'class': 'text-center'}):
        dataDia = [annio, mes]
        
        for columna in dia.findAll('td'):
            dataDia.append(columna.get_text()[1:-1])
            
        if len(dataDia) > 2:
            dataMensual.loc[i] = dataDia
            i += 1
        else:
            break
            
    return dataMensual.replace('.', nan)

In [4]:
estaciones = pd.read_csv('CatastroEstaciones.csv')['Codigo Nacional']

carpeta = 'datosPrecipitaciones'

try:
    os.mkdir(carpeta)
except:
    None
    
for estacion in tqdm(estaciones[:10], leave=False, desc='Estaciones'):
    try:
        os.mkdir(carpeta+'/'+str(estacion))
    except:
        None
    
    for annio in tqdm(range(1990, 2023), leave=False, desc='Annios'):
        for mes in range(1,13):
            
            archivo = str(annio)+'-'+str(mes).zfill(2)+'.csv'
            if archivo in os.listdir(carpeta+'/'+str(estacion)+'/'):
                continue
                
            dataMensual = precipitaciones_mensual(estacion, annio, mes)
            
            if len(dataMensual) > 0:
                dataMensual.to_csv(carpeta+'/'+str(estacion)+'/'+archivo,
                                  index=False)

Estaciones:   0%|                                        | 0/10 [00:00<?, ?it/s]
Annios:   0%|                                            | 0/33 [00:00<?, ?it/s][A
Annios:   3%|█                                   | 1/33 [00:02<01:16,  2.41s/it][A
Annios:   6%|██▏                                 | 2/33 [00:05<01:17,  2.49s/it][A
Annios:   9%|███▎                                | 3/33 [00:07<01:16,  2.55s/it][A
Annios:  12%|████▎                               | 4/33 [00:10<01:14,  2.57s/it][A
Annios:  15%|█████▍                              | 5/33 [00:13<01:15,  2.71s/it][A
Annios:  18%|██████▌                             | 6/33 [00:16<01:17,  2.85s/it][A
Annios:  21%|███████▋                            | 7/33 [00:19<01:12,  2.78s/it][A
Annios:  24%|████████▋                           | 8/33 [00:21<01:09,  2.78s/it][A
Annios:  27%|█████████▊                          | 9/33 [00:24<01:06,  2.76s/it][A
Annios:  30%|██████████▌                        | 10/33 [00:27<01:02,  2.73s/it

KeyboardInterrupt: 