
# ¿Veranos Prolongados en Santiago?
**Proyecto de estudio y analisis climatico y ambiental con datos de RedMeteo, Cr2 y Meteochile**

---

## Contexto y Motivacion
Se quien sea que este leyendo esto, durante las ultimas decadas o el ultimo siglo, el cambio climatico ha modificado o mas bien alterado notablemente los patrones meteorologicos en varias regiones del mundo. 

En el caso de Chile, estos efectos se manifiestan de manera alarmante en partes como la zona central del pais, con fenomenos climaticos como **sequias**, pero principalmente repentinas y extremas **olas de calor y frio** que tal parece que han aumentado su frecuencia y tal ves duracion. Subiendo la alerta a casi todo chileno.

Por eso, este proyecto surge desde las cenizas de los **incendios forestales**, con el proposito de  **analizar la posible prolongacion de los veranos en Santiago o en el peor de los casos, es otras ciudades de Chile**. Entenderemos por "veranos prolongados" a aquellos periodos de tiempo en que las temperaturas elevadas sobre pasan mas alla de los meses y semanas que componen las estaciones como conocemos de manera tradicional.

Para poder hacer lo anterior, vamos a usar datos meteorologicos provenientes de diferentes fuentes de informacion, estos pueden ser de:

- **[RedMeteo]** --> Datos en tiempo real (Se actualizan cada minuto) esta se separa por estaciones distribuidas en todo Chile, cada una con su propio id.
- **[CR2]** --> Datos historicos de temperatura y precipitacion desde 1930.
- **[MeteoChile]** --> Tiene registros varios de Olas de Calor y Frio, Cambio climatico y varios registros oficiales.

Si nos enfocamos en la motivacion de este trabajo, esta seria **analizar de caracter logico si los veranos chilenos se estan alargando**, y con ello experimentar o explorar que factores meteorologicas conllevan estas alterciones o variaciones .
Tambien nos parecio un gran idea para fomentar la visibilidad de una crisis ambiental y tener un repositorio que tenga datos, codigos y visualizaciones.

Como referencias, consideramos articulos de **https://efeverde.com/** que habla de como  hay veranos mas calurosos  cada vez en paises como España. tambien en **Cr2** o la **Direccion Meteorologica** que tienen multiples publicaciones semanales, mensuales, anuales, tambien sobre cambio climatico donde en estos trata la varianza climatica y la evolucion historica de esta. Tambien sitios como el **IPCC** que expertos hablan sobre el cambio climatico en variados informes, que tratan los riesgos, desastres, mejoras para adaptacion, sobre el oceano, energia renovable y mitigacion del cambio climatico.

---

## Preguntas Objetivo

El proyecto busca responder mediante su analisis las siguientes preguntas:

1. **¿Se ha modificado la frecuencia y/o duracion de las olas de calor en el verano en comparacion a años anteriores?**

2. **¿Como podemos predecir la probabilidad de aparcion de olas de calor a partir de variables historicas y actuales como temperatura, humedad, radiacion solar, corrientes de viento y presion atmosferica ?**

3. **¿Como a cambiado la temperatura promedio maxima y minima en verano en Chile en distintos años, hasta la actualidad?**

4. **¿Que diferencias existen entre los veranos de la zona central, norte y sur de Chile, y como han cambiado con el paso del tiempo?**

Durante el desarrollo y inspecion mas profunda de los datos, tal ves estas preguntas evolucionen o puedan ampliarse en algunos aspectos, pero ciertamente la idea principal de cada una de ellas probablemente no vaya a cambiar, ya que en conjunto estas preguntas se complementan para dar con el objetivo del proyecto.
Pero estas podrian cambiar en su vision, pasando a ser mas centralizada en la actualidad con estudios diarios atraves de datos que se actualizan constantemente, en relacion a datos anuales o semanales historicos. Estudiando propiedades como la esperanza o la varianza, tambien ver efectos locales como la altitud y urbanizacion, diferencias entre zonas urbanas, rurales o industriales.

## Datos

Cada base de datos tiene una forma distinta de obtener los datos asi que veamos cada una:

### RedMeteo

Desde la carpeta `src` utilizaremos lo escrito en `elt_redmeteo.py` para extraer los datos de la API de **RedMeteo**:

In [2]:
import os
import requests as r
import json as j
import pandas as pd
from datetime import datetime

def revision_existencia_api(url):
    try:
        respuesta = r.get(url, timeout=30)
        if respuesta.status_code <= 299:
            print("La API fue Encontrada:", url)
            print("Parte de respuesta")
            print(respuesta.text[:250])
        else:
            print("No fue encontrada:", respuesta.status_code)
    except r.exceptions.ConnetionError:
        print("No se pudo conectar a", url)
    except r.exceptions.ReadTimeout:
        print("Pasaron mas de 30 seg para conectarse a", url)
    except r.exceptions.RequestException as error:
        print("Error de requests al extraer datos de Meteo:", error)
    return respuesta


In [3]:
url = "https://redmeteo.cl/last-data.json"

#path_carpeta_salida = "data/raw_data"

respuesta = revision_existencia_api(url)

data = respuesta.json()
dataFrame = pd.DataFrame(data)

# Busque para crear el archivo con la fecha actual, asi se esta seguro de en que fecha quedo
# Uso datetime para escribir parecido al formato del json
# fecha_actual = datetime.now().strftime("%Y%m%d_%H%M") # Segun busque esta deberia ser la forma
# nombre_arch = f"RedMeteo_last_data_{fecha_actual}.csv"
# path_archivo = os.path.join(path_carpeta_salida, nombre_arch)

# Lo guarda en el archivo que se indica path_archivo
# dataFrame.to_csv(path_archivo)
# print("Se deverian haber guardado los datos en data/ xd ")

dataFrame

La API fue Encontrada: https://redmeteo.cl/last-data.json
Parte de respuesta
[{"id_estacion": "RMCL0114", "nombre": "Arica - Capitanía de Puerto (SERVIMET)", "latitud": -18.476900, "longitud": -70.321900, "altitud": 8.00, "id_observacion": 5360967, "fecha_hora": "2025-10-21T17:07:54Z", "temperatura": 20.20, "humedad": 68.00, 


Unnamed: 0,id_estacion,nombre,latitud,longitud,altitud,id_observacion,fecha_hora,temperatura,humedad,velocidad_viento,direccion_viento,radiacion_solar,presion_absoluta,precipitacion,punto_rocio,racha_viento,presion,tasalluvia,ultravioleta,lluviadiaria
0,RMCL0114,Arica - Capitanía de Puerto (SERVIMET),-18.47690,-70.3219,8.0,5360967,2025-10-21T17:07:54Z,20.2,68.0,4.7,165.0,643.0,1015.61,15.0,14.1,8.7,1016.56,0.0,5.0,0.0
1,RMCL0115,Pisagua - Alcaldía de Mar (SERVIMET),-19.59594,-70.2112,8.0,5356678,2025-10-21T11:17:47Z,18.2,74.0,0.4,32.0,0.0,1014.22,3.0,13.5,1.7,1015.17,0.0,0.0,0.0
2,RMCL0116,Iquique - Capitanía de Puerto (SERVIMET),-20.21128,-70.1534,12.0,5360969,2025-10-21T17:07:55Z,19.6,72.0,6.4,225.0,721.0,1013.92,15.0,14.4,8.7,1015.34,0.0,5.0,0.0
3,RMCL0071,Iquique - Lic. Bicentenario Minero - UCH,-20.27235,-70.0949,534.0,5361050,2025-10-21T17:09:22Z,16.4,77.0,2.6,267.0,522.2,954.10,,12.3,3.1,1016.15,0.0,5.0,0.0
4,RMCL0073,Alto Hospicio - Las Parcelas,-20.29574,-70.0702,685.0,5361051,2025-10-21T17:09:27Z,19.5,60.0,1.1,271.0,423.2,935.40,,11.6,2.0,1013.27,0.0,4.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
128,RMCL0110,Punta Arenas - Punta Carrera,-53.55830,-70.9496,60.0,5361018,2025-10-21T17:07:00Z,12.6,48.0,2.1,113.0,,999.45,0.0,1.9,3.0,1006.77,0.0,,0.0
129,RMCL0159,Timbales - Alcaldía de Mar (SERVIMET),-54.86759,-70.2919,10.0,5361012,2025-10-21T17:08:04Z,7.3,72.0,10.1,230.0,0.0,999.05,3.0,2.6,18.3,1000.27,0.0,0.0,0.0
130,RMCL0158,Puerto Navarino - Alcaldía de Mar (SERVIMET),-54.92564,-68.3236,6.0,5361011,2025-10-21T17:07:56Z,9.4,62.0,6.4,325.0,265.0,999.68,6.0,2.5,10.4,1000.41,0.0,2.0,0.0
131,RMCL0112,Puerto Williams - Yelcho,-54.93420,-67.6006,12.0,5361019,2025-10-21T17:07:00Z,12.5,42.0,2.7,270.0,400.0,998.54,0.0,-0.1,3.6,998.98,0.0,3.0,0.0


Aqui los datos se extraen de la API como un `.json`. Por la estructura del archivo los datos son **semi-estructurados**.

In [4]:
dataFrame.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 133 entries, 0 to 132
Data columns (total 20 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   id_estacion       133 non-null    object 
 1   nombre            133 non-null    object 
 2   latitud           133 non-null    float64
 3   longitud          133 non-null    float64
 4   altitud           133 non-null    float64
 5   id_observacion    133 non-null    int64  
 6   fecha_hora        133 non-null    object 
 7   temperatura       132 non-null    float64
 8   humedad           132 non-null    float64
 9   velocidad_viento  133 non-null    float64
 10  direccion_viento  132 non-null    float64
 11  radiacion_solar   115 non-null    float64
 12  presion_absoluta  130 non-null    float64
 13  precipitacion     98 non-null     float64
 14  punto_rocio       132 non-null    float64
 15  racha_viento      133 non-null    float64
 16  presion           129 non-null    float64
 1

Los datos que nos importa **(fecha_hora, temperatura, id_estacion, nombre, etc)** estan en su tipo correcto. 

Para obtener los datos que queremos simplemente filtramos por nombre (u otro parametros) y cambiamos la url.

In [5]:
unicos = dataFrame["nombre"].unique()
for i in unicos:
    print(i)

Arica - Capitanía de Puerto (SERVIMET)
Pisagua - Alcaldía de Mar (SERVIMET)
Iquique - Capitanía de Puerto (SERVIMET)
Iquique - Lic. Bicentenario Minero - UCH
Alto Hospicio - Las Parcelas
Tocopilla - Capitanía de Puerto (SERVIMET)
Mejillones - Capitanía de Puerto (SERVIMET)
Taltal - Capitanía de Puerto (SERVIMET)
Chañaral - Capitanía de Puerto (SERVIMET)
Caldera - Capitanía de Puerto (SERVIMET)
Hanga Roa - Capitanía de Puerto (SERVIMET)
Copiapó
Huasco - Capitanía de Puerto (SERVIMET)
La Serena - La Florida - UCH 
Coquimbo - Faro Punta Tortuga (SERVIMET)
La Serena - Peñuelas 
Coquimbo - San Juan - UCH
Coquimbo - Villa San Francisco - UCH
La Serena - El Sauce 
Los Vilos - Capitanía de Puerto (SERVIMET)
Pichicuy, GobTuCosta
El Melón
Quintero - Capitanía de Puerto (SERVIMET)
Quintero
La Calera - Colegio Fundadores
Hijuelas - Centro
Los Andes
Concon - Las Pretas 
Concón Rural - Los Eucaliptus
Viña del Mar - FACIMAR, Universidad de Valparaíso (SERVIMET)
Reñaca - Los Almendros
Reñaca
Viña del 

### MeteoChile

Aqui utilizamos una especie de webscrapping, es decir, leamos las tablas generadas de la pagina de la base de datos de **MeteoChile**:

In [6]:
url = "https://climatologia.meteochile.gob.cl/application/mensual/temperaturaMediaMensual/330020/2000/1" 
tables = pd.read_html(url)

# Seleccionar primera tabla encontrada
df = tables[0]
df

Unnamed: 0_level_0,Día,T. Mínima,T. Mínima,T. Máxima,T. Máxima,Media,Media,Datos,Unnamed: 8_level_0,Unnamed: 9_level_0
Unnamed: 0_level_1,Día,Valor,Hora Local,Valor,Hora Local,Climatológica,Aritmética,Datos,Unnamed: 8_level_1,Unnamed: 9_level_1
0,1,12.1,07:15,27.5,17:10,19.8,22.8,5,,
1,2,11.4,07:15,28.8,16:00,20.1,22.4,5,,
2,3,12.3,06:00,26.3,14:50,19.3,20.6,5,,
3,4,12.5,07:15,30.2,17:15,21.4,23.9,5,,
4,5,13.8,07:30,31.1,16:15,22.5,25.5,5,,
5,6,13.4,07:30,31.5,17:20,22.4,25.4,5,,
6,7,12.0,07:15,29.6,17:30,20.8,24.6,5,,
7,8,12.5,07:30,29.6,17:00,21.1,24.5,5,,
8,9,11.4,07:15,30.5,17:15,20.9,24.7,5,,
9,10,12.9,07:30,32.0,16:30,22.4,26.4,5,,


Los datos obtenidos son dependiendo de la solicitud que se haga en la pagina. Esto cambia la url, mostrando los datos solicitados. Como estan en una tabla los datos son estructurados.

In [8]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 36 entries, 0 to 35
Data columns (total 10 columns):
 #   Column                                    Non-Null Count  Dtype 
---  ------                                    --------------  ----- 
 0   (Día, Día)                                36 non-null     object
 1   (T. Mínima, Valor)                        36 non-null     object
 2   (T. Mínima, Hora Local)                   34 non-null     object
 3   (T. Máxima, Valor)                        36 non-null     object
 4   (T. Máxima, Hora Local)                   34 non-null     object
 5   (Media, Climatológica)                    36 non-null     object
 6   (Media, Aritmética)                       36 non-null     object
 7   (Datos, Datos)                            32 non-null     object
 8   (Unnamed: 8_level_0, Unnamed: 8_level_1)  1 non-null      object
 9   (Unnamed: 9_level_0, Unnamed: 9_level_1)  1 non-null      object
dtypes: object(10)
memory usage: 2.9+ KB


Dependiendo de lo que se solicite, abra que hacer diversas transformaciones de datos, como cambiar el tipo, eliminar filas que no nos interesan, asi como revisar los valores nulos y evaluar si deberia ser eliminadas (filas o columnas) o reemplazadas por un valor.

### CR2

En este caso, los datos estan en `data` como archivo `.txt`. Los transformamos a `.csv` viendo la estrutura del archivo (separacion por comas).

In [9]:
direc = os.path.join("data", "cr2_tasDaily_2020_ghcn", "cr2_tasDaily_2020_ghcn.txt")

dfcr2 = pd.read_csv(direc, sep=",", header=None, encoding="latin-1")

dfcr2trans = dfcr2.set_index(0).T

dfcr2trans

  dfcr2 = pd.read_csv(direc, sep=",", header=None, encoding="latin-1")


Unnamed: 0,codigo_estacion,institucion,fuente,nombre,altura,latitud,longitud,codigo_cuenca,nombre_cuenca,codigo_sub_cuenca,...,2020-03-22,2020-03-23,2020-03-24,2020-03-25,2020-03-26,2020-03-27,2020-03-28,2020-03-29,2020-03-30,2020-03-31
1,01000005,DGA,dga_web,Visviri,4080,-17.595,-69.4831,10,Altiplanicas,100,...,8.069,9.981,9.175,9.131,7.634,6.965,7.234,7.877,8.231,8.131
2,01201005,DGA,dga_web,Rio Caracarani En Humapalca,3908,-17.8428,-69.6994,12,Rio Lluta,120,...,7.786,9.655,8.625,9.413,8.275,7.663,6.399,7.825,8.845,8.118
3,01001005,DGA,dga_web,Caquena,4400,-18.0542,-69.2017,10,Altiplanicas,100,...,-9999,-9999,-9999,-9999,-9999,-9999,-9999,-9999,-9999,-9999
4,01202009,DGA,dga_web,Pacollo,4185,-18.1769,-69.5092,12,Rio Lluta,120,...,-9999,-9999,-9999,-9999,-9999,-9999,-9999,-9999,-9999,-9999
5,01202012,DGA,dga_web,Putre (Dcp),3560,-18.195,-69.5589,12,Rio Lluta,120,...,1.456,3.424,2.642,3.231,2.737,2.618,2.535,2.721,3.492,3.768
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
896,AYM00089314,GHCN,ghcn_ftp,Theresa,1463,-84.6,-115.817,,,,...,,,,,,,,,,
897,AYM00089087,GHCN,ghcn_ftp,Thiel Mtns Aws,1634,-85.2,-87.883,,,,...,,,,,,,,,,
898,AYM00089799,GHCN,ghcn_ftp,Nico,2935,-89.0,89.667,,,,...,,,,,,,,,,
899,AYM00089108,GHCN,ghcn_ftp,Henry,2755,-89.0,-1.017,,,,...,,,,,,,,,,


Debido a lo desorganizacion del archivo, se considerara como no estructurado. Y abra que hacer varias modificaciones a la tabla debido a su estrutura.

In [10]:
dfcr2trans.info()

<class 'pandas.core.frame.DataFrame'>
Index: 900 entries, 1 to 900
Columns: 43935 entries, codigo_estacion to 2020-03-31
dtypes: object(43935)
memory usage: 301.7+ MB


Debido a la grandeza del archivo en terminos de espacio es dificl analizar el Dataframe. Por lo tanto, se requerira un analisis extenso de su estructura y modificaciones.