In [4]:
import requests
import os
import pandas as pd
import time

In [5]:
def time_elapsed(function, *args):
    start = time.perf_counter()
    function(*args)
    end = time.perf_counter()
    print(f"Time elapsed: {end - start:0.4f} seconds")

In [6]:
# PENDIENTE
def gather_cicese_data():
    # Column names obtained from CICESE files metadata. None of this files have a header
    columns=["anio","mes","dia","hora","minuto","segundo",
             "id_estacion","voltaje_sistema","nivel_mar_leveltrol","nivel_mar_burbujeador",
             "sw_1","sw_2","temperatura_agua","nivel_mar_ott_rsl", "radiacion_solar",
             "direccion_viento", "magnitud_viento", "temperatura_aire","humedad_relativa",
             "presion_atmosferica","precipitacion","voltaje_estacion_met","nivel_mar_sutron"]

    # df is the dataframe that will allocate all the data
    df = pd.DataFrame()

    # We have data from 2011 to 2021. 
    for anio in ["2014","2015","2016","2017","2018","2019","2020","2021", "2022"]:
        # Define the URL of the directory containing the .dat files
        url = "http://redmar.cicese.mx/emmc/DATA/ICDN/MIN/"+anio+"/"

        # Send a GET request to the URL
        response = requests.get(url)

        # Extract the HTML content of the response
        html_content = response.content.decode('utf-8')

        # Find all the .dat file names in the HTML content
        dat_files = []
        for line in html_content.split('\n'):
            if '.dat' in line:
                filename = line.split('href="')[1][:15]
                dat_files.append(filename)

        # Create a directory to store the downloaded files
        if not os.path.exists('data/isla_cedros'):
            os.mkdir('data/isla_cedros')

        # Download each .dat file and save it in the data directory
        for filename in dat_files:
            try:
                file_url = url + filename
                file_path = os.path.join('data/isla_cedros', filename)
                response = requests.get(file_url)
                with open(file_path, 'wb') as f:
                    f.write(response.content)


                # Open the downloaded file and read its content
                with open(file_path, 'r') as f:
                    content = f.read()


                # Read the downloaded file using pandas and concatenate it to df
                df_aux = pd.read_csv(file_path, lineterminator='\n', delim_whitespace=True, header=None)
                df = pd.concat([df,df_aux])
            except:
                print(filename, "no se agregó")
                
        # Rename df columns with the ones defined before
        dict_columns = {}
        for col, i in zip(columns, range(len(columns))):
            dict_columns[i] = col
        dict_columns
        df = df.rename(columns=dict_columns)

        # Export csv
        df.to_csv("cicese_data.csv")



In [7]:
print("Runs every time we get new sensors data from cicese:")
print(time_elapsed(gather_cicese_data))

Runs every time we get new sensors data from cicese:
ICDN-160106.dat no se agregó
ICDN-160107.dat no se agregó
ICDN-160108.dat no se agregó
ICDN-160109.dat no se agregó
ICDN-160110.dat no se agregó
ICDN-160111.dat no se agregó
ICDN-160112.dat no se agregó
ICDN-160113.dat no se agregó
ICDN-160114.dat no se agregó
ICDN-160115.dat no se agregó
ICDN-160118.dat no se agregó
ICDN-160119.dat no se agregó
ICDN-160126.dat no se agregó
ICDN-160127.dat no se agregó
ICDN-160128.dat no se agregó
ICDN-160129.dat no se agregó
ICDN-160130.dat no se agregó
ICDN-160131.dat no se agregó
ICDN-160201.dat no se agregó
ICDN-160202.dat no se agregó
ICDN-160203.dat no se agregó
ICDN-160204.dat no se agregó
ICDN-160205.dat no se agregó
ICDN-160206.dat no se agregó
ICDN-160207.dat no se agregó
ICDN-160208.dat no se agregó
ICDN-160209.dat no se agregó
ICDN-160210.dat no se agregó
ICDN-160211.dat no se agregó
ICDN-160212.dat no se agregó
ICDN-160213.dat no se agregó
ICDN-160214.dat no se agregó
ICDN-160215.dat no 

ICDN-161107.dat no se agregó
ICDN-161108.dat no se agregó
ICDN-161109.dat no se agregó
ICDN-161110.dat no se agregó
ICDN-161111.dat no se agregó
ICDN-161112.dat no se agregó
ICDN-161113.dat no se agregó
ICDN-161114.dat no se agregó
ICDN-161115.dat no se agregó
ICDN-161116.dat no se agregó
ICDN-161117.dat no se agregó
ICDN-161118.dat no se agregó
ICDN-161119.dat no se agregó
ICDN-161120.dat no se agregó
ICDN-161121.dat no se agregó
ICDN-161122.dat no se agregó
ICDN-161123.dat no se agregó
ICDN-161124.dat no se agregó
ICDN-161125.dat no se agregó
ICDN-161126.dat no se agregó
ICDN-161127.dat no se agregó
ICDN-161128.dat no se agregó
ICDN-161129.dat no se agregó
ICDN-161130.dat no se agregó
ICDN-161201.dat no se agregó
ICDN-161202.dat no se agregó
ICDN-161203.dat no se agregó
ICDN-161204.dat no se agregó
ICDN-161205.dat no se agregó
ICDN-161206.dat no se agregó
ICDN-161207.dat no se agregó
ICDN-161208.dat no se agregó
ICDN-161209.dat no se agregó
ICDN-161210.dat no se agregó
ICDN-161211.da

ICDN-170823.dat no se agregó
ICDN-170824.dat no se agregó
ICDN-170825.dat no se agregó
ICDN-170826.dat no se agregó
ICDN-170827.dat no se agregó
ICDN-170828.dat no se agregó
ICDN-170829.dat no se agregó
ICDN-170830.dat no se agregó
ICDN-170831.dat no se agregó
ICDN-170901.dat no se agregó
ICDN-170902.dat no se agregó
ICDN-170903.dat no se agregó
ICDN-170905.dat no se agregó
ICDN-170906.dat no se agregó
ICDN-170907.dat no se agregó
ICDN-170908.dat no se agregó
ICDN-170909.dat no se agregó
ICDN-170910.dat no se agregó
ICDN-170911.dat no se agregó
ICDN-170912.dat no se agregó
ICDN-170913.dat no se agregó
ICDN-170914.dat no se agregó
ICDN-170915.dat no se agregó
ICDN-170916.dat no se agregó
ICDN-170917.dat no se agregó
ICDN-170918.dat no se agregó
ICDN-170919.dat no se agregó
ICDN-170920.dat no se agregó
ICDN-170921.dat no se agregó
ICDN-170922.dat no se agregó
ICDN-170923.dat no se agregó
ICDN-170924.dat no se agregó
ICDN-170925.dat no se agregó
ICDN-170926.dat no se agregó
ICDN-170927.da

ICDN-180731.dat no se agregó
ICDN-180801.dat no se agregó
ICDN-180802.dat no se agregó
ICDN-180803.dat no se agregó
ICDN-180804.dat no se agregó
ICDN-180805.dat no se agregó
ICDN-180806.dat no se agregó
ICDN-180807.dat no se agregó
ICDN-180808.dat no se agregó
ICDN-180809.dat no se agregó
ICDN-180810.dat no se agregó
ICDN-180811.dat no se agregó
ICDN-180812.dat no se agregó
ICDN-180813.dat no se agregó
ICDN-180814.dat no se agregó
ICDN-180815.dat no se agregó
ICDN-180816.dat no se agregó
ICDN-180817.dat no se agregó
ICDN-180818.dat no se agregó
ICDN-180819.dat no se agregó
ICDN-180820.dat no se agregó
ICDN-180821.dat no se agregó
ICDN-180822.dat no se agregó
ICDN-180823.dat no se agregó
ICDN-180824.dat no se agregó
ICDN-180825.dat no se agregó
ICDN-180826.dat no se agregó
ICDN-180827.dat no se agregó
ICDN-180828.dat no se agregó
ICDN-180829.dat no se agregó
ICDN-180830.dat no se agregó
ICDN-180831.dat no se agregó
ICDN-180901.dat no se agregó
ICDN-180902.dat no se agregó
ICDN-180903.da

ICDN-190518.dat no se agregó
ICDN-190519.dat no se agregó
ICDN-190520.dat no se agregó
ICDN-190521.dat no se agregó
ICDN-190522.dat no se agregó
ICDN-190523.dat no se agregó
ICDN-190524.dat no se agregó
ICDN-190525.dat no se agregó
ICDN-190526.dat no se agregó
ICDN-190527.dat no se agregó
ICDN-190528.dat no se agregó
ICDN-190529.dat no se agregó
ICDN-190530.dat no se agregó
ICDN-190531.dat no se agregó
ICDN-190601.dat no se agregó
ICDN-190602.dat no se agregó
ICDN-190603.dat no se agregó
ICDN-190604.dat no se agregó
ICDN-190605.dat no se agregó
ICDN-190606.dat no se agregó
ICDN-190607.dat no se agregó
ICDN-190608.dat no se agregó
ICDN-190609.dat no se agregó
ICDN-190610.dat no se agregó
ICDN-190611.dat no se agregó
ICDN-190612.dat no se agregó
ICDN-190613.dat no se agregó
ICDN-190614.dat no se agregó
ICDN-190615.dat no se agregó
ICDN-190617.dat no se agregó
ICDN-190618.dat no se agregó
ICDN-190619.dat no se agregó
ICDN-190620.dat no se agregó
ICDN-190621.dat no se agregó
ICDN-190622.da

ICDN-200526.dat no se agregó
ICDN-200527.dat no se agregó
ICDN-200528.dat no se agregó
ICDN-200529.dat no se agregó
ICDN-200530.dat no se agregó
ICDN-200531.dat no se agregó
ICDN-200601.dat no se agregó
ICDN-200602.dat no se agregó
ICDN-200603.dat no se agregó
ICDN-200604.dat no se agregó
ICDN-200605.dat no se agregó
ICDN-200606.dat no se agregó
ICDN-200607.dat no se agregó
ICDN-200608.dat no se agregó
ICDN-200609.dat no se agregó
ICDN-200610.dat no se agregó
ICDN-200611.dat no se agregó
ICDN-200612.dat no se agregó
ICDN-200613.dat no se agregó
ICDN-200614.dat no se agregó
ICDN-200615.dat no se agregó
ICDN-200616.dat no se agregó
ICDN-200617.dat no se agregó
ICDN-200618.dat no se agregó
ICDN-200619.dat no se agregó
ICDN-200620.dat no se agregó
ICDN-200621.dat no se agregó
ICDN-200622.dat no se agregó
ICDN-200623.dat no se agregó
ICDN-200624.dat no se agregó
ICDN-200625.dat no se agregó
ICDN-200626.dat no se agregó
ICDN-200627.dat no se agregó
ICDN-200628.dat no se agregó
ICDN-200629.da

ICDN-211030.dat no se agregó
ICDN-211031.dat no se agregó
ICDN-211101.dat no se agregó
ICDN-211102.dat no se agregó
ICDN-211103.dat no se agregó
ICDN-211104.dat no se agregó
ICDN-211105.dat no se agregó
ICDN-211106.dat no se agregó
ICDN-211107.dat no se agregó
ICDN-211108.dat no se agregó
ICDN-211110.dat no se agregó
ICDN-211111.dat no se agregó
ICDN-211112.dat no se agregó
ICDN-211113.dat no se agregó
ICDN-211114.dat no se agregó
ICDN-211115.dat no se agregó
ICDN-211116.dat no se agregó
ICDN-211117.dat no se agregó
ICDN-211118.dat no se agregó
ICDN-211119.dat no se agregó
ICDN-211120.dat no se agregó
ICDN-211121.dat no se agregó
ICDN-211122.dat no se agregó
ICDN-211123.dat no se agregó
ICDN-211124.dat no se agregó
ICDN-211125.dat no se agregó
ICDN-211126.dat no se agregó
ICDN-211127.dat no se agregó
ICDN-211128.dat no se agregó
ICDN-211129.dat no se agregó
ICDN-211130.dat no se agregó
ICDN-211201.dat no se agregó
ICDN-211202.dat no se agregó
ICDN-211203.dat no se agregó
ICDN-211204.da

In [12]:
# Export 1000 rows to have a preview (in Github)
df.head(1000)

In [None]:
df.columns