<a href="https://colab.research.google.com/github/rpizarrog/innovacion-empresarial/blob/main/notebook%20python/Caso_03_Crear_archivo_de_datos_temperaturas_csv.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Objetivo

Crear, evaluar e intrepretar un modelo de regresión mútiple usando un conjunto de variables que impactan en la tempertura ambiental.

# Contexto de los datos

Los datos se relacionan con distintaas variables atmosféricas que afecan a una temperatura de una región o localización geográfica.

## Las variables independientes:

* 1. Mes (mes): Afecta debido a las variaciones estacionales.
* 2. Día (dia): Puede influir ligeramente debido al cambio gradual de las temperaturas a lo largo del mes.
* 3. Velocidad del viento (velocidad_viento): Velocidades más altas pueden reducir la sensación térmica. km/hr
* 4. Presión atmosférica (presion_atmosferica): Cambios en la presión pueden indicar cambios en el clima. hpa
* 5. Humedad relativa (humedad_relativa): Afecta la sensación térmica y puede influir en la temperatura real.
* 6. Presencia de frentes fríos (frentes_frios): Un indicador binario (0 o 1) para la presencia de un frente frío.
* 7. Latitud (latitud): Afecta la temperatura promedio, con temperaturas generalmente disminuyendo al alejarse del ecuador.
* 8. Longitud (longitud): Puede tener un efecto indirecto, especialmente en grandes países donde el clima varía de costa a costa.
* 9. Altitud (altitud): La temperatura tiende a disminuir con la altitud debido a la baja densidad del aire y la disminución de la presión atmosférica.
* 10. Radiación Solar (radiacion_solar): La cantidad de radiación solar que llega a la superficie terrestre tiene un impacto directo en la temperatura. Esta variable puede variar según la cobertura de nubes, la hora del día y la época del año. 100 a 1000 W/m^2
* 11. Luminosidad o Insolación (luminosidad): Estrechamente relacionada con la radiación solar, se refiere a la cantidad de luz solar que llega a la Tierra. Afecta la temperatura especialmente durante las horas diurnas. Soleado obscuro de 0 a 100
* 12. Contaminación o Calidad del Aire (contaminacion): Partículas y gases en la atmósfera pueden atrapar el calor, contribuyendo al efecto invernadero y, por ende, a temperaturas más altas en áreas urbanas o industrializadas. Variables como el nivel de dióxido de carbono o la presencia de ozono cerca de la superficie pueden ser indicadores de contaminación. Niveles de 0 a 500, niveles altos son peligrosos.
* 13. Cobertura de Nubes (cobertura_nubes): La cantidad de nubes en el cielo puede influir en la temperatura al bloquear la radiación solar directa durante el día y atrapar el calor durante la noche. Porcentaje de 0 a 100%


## La variable dependiente

* Temperatura ambiental es la cantidad de grados centígrados promedio.







# Desarrollo



## Cargar librerías



In [11]:
import numpy as np
import pandas as pd
import ipywidgets as widgets
from IPython.display import display

## Crear funciones




In [23]:
def f_crear_datos (start="2018-01-01", end="2024-02-23"):
  # Definir el rango de fechas desde el 1 de enero de 2018 hasta el 23 de febrero de 2024
  fechas = pd.date_range(start="2018-01-01", end="2024-02-23")

  # Generar datos de temperatura simulados para cada día en el rango de fechas
  # Supongamos que la temperatura varía aleatoriamente entre 10 y 30 grados Celsius
  np.random.seed(2024)  # Para asegurar reproducibilidad

  n = len(fechas)
  temperaturas = np.random.normal(18, 4, n)

  # Ajustar las temperaturas según la estación
  temperaturas_ajustadas = []
  for fecha, num in zip(fechas, temperaturas):
    if fecha.month in [4, 5, 6]:
        num += 5  # Abril, Mayo, Junio
    elif fecha.month in [7, 8, 9]:
        num += 2  # Julio, Agosto, Septiembre
    elif fecha.month in [3, 10, 11]:
        num -= 2  # Octubre, Noviembre
    elif fecha.month in [12, 1, 2]:
        num -= 3  # Diciembre, Enero, Febrero
    temperaturas_ajustadas.append(num)

  temperaturas = temperaturas_ajustadas

  # Velociad de viento
  velocidad_viento = np.random.normal(25, 5, n)  # Velocidad del viento en km/h
    # Ajustar las temperaturas según la estación
  velocidad_viento_ajustadas = []
  for fecha, num in zip(fechas, velocidad_viento):
    if fecha.month in [10, 11, 12, 1, 2, 3]:
      num += np.random.randint(4, 12)
    velocidad_viento_ajustadas.append(num)

  presion_atmosferica = np.random.uniform(950, 1050, n)  # Presión en hPa

  # Otras variables ...
  humedad_relativa = np.random.uniform(20, 100, n)  # Porcentaje
  frentes_frios = np.random.choice([0, 1], n)  # 0 = No, 1 = Sí

  # Ajustar las temperaturas según si hay frente frio
  temperaturas_ajustadas = []
  for frente, temp in zip(frentes_frios, temperaturas):
    if frente == 1:
      temp -= 4
    temperaturas_ajustadas.append(temp)

  temperaturas = temperaturas_ajustadas

  # Asumiendo un rango común durante el día de 100 a 1000 W/m^2
  radiacion_solar = np.random.uniform(100, 1000, n)

  # Generar valores simulados para luminosidad en porcentaje
  # Asumiendo un rango de 0% (noche) a 100% (día soleado)
  luminosidad = np.random.uniform(0, 100, n)

  # Generar valores simulados para contaminación atmosférica (índice de calidad del aire, AQI)
  # Asumiendo un rango de AQUI de 0 (buena calidad del aire) a 500 (calidad del aire peligrosa)
  contaminacion_atmosferica = np.random.uniform(0, 500, n)

  # Ajustar las temperaturas según si hay radiacion por encima de 700 y luminosidad por encima del 80%
  temperaturas_ajustadas = []
  for rad, lum, cont, temp in zip(radiacion_solar, luminosidad, contaminacion_atmosferica, temperaturas):
    if rad > 700:
      temp += np.random.randint(2, 4)
    if lum > 70:
      temp += np.random.randint(2, 4)
    if cont > 350:
      temp += np.random.randint(3, 5)

    temperaturas_ajustadas.append(temp)


  # Cobertura de nubes
  # Generar 5 valores aleatorios de cobertura nubosa como porcentaje
  cobertura_nubosa = np.random.uniform(0, 100, n)

  # Crear el DataFrame con las fechas y temperaturas
  datos = pd.DataFrame({
    'fecha': fechas,
    'vel_viento': np.round(velocidad_viento_ajustadas),
    'presion_atmosferica': np.round(presion_atmosferica),
    'humedad_relativa':np.round(humedad_relativa),
    'frentes_frios': frentes_frios,
    'radiacion_solar':np.round(radiacion_solar),
    'luminosidad':np.round(luminosidad),
    'contaminacion_atmosferica':np.round(contaminacion_atmosferica),
    'temperatura': np.round(temperaturas_ajustadas)
  })
  return datos




## Crear widgets


In [24]:
# Crear un widget de salida
visualizar = widgets.Output()

# Crear widgets de título usando Label o HTML para más flexibilidad
titulo_primeros = widgets.HTML(value="<h3>Primeros 20 registros:</h3>")
titulo_ultimos = widgets.HTML(value="<h3>Últimos 20 registros:</h3>")


## Crear los datos



In [26]:
datos = f_crear_datos()


# Mostrar el DataFrame en el widget de salida
with visualizar:
    # Mostrar el título y los primeros 20 registros
    display(titulo_primeros)
    display(datos.head(20))
    # Mostrar el título y los primeros 20 registros
    display(titulo_ultimos)
    display(datos.tail(20))

# Mostrar el widget de salida
display(visualizar)
# print (datos.head(20))
# print (datos.tail(20))


# Guardar el archivo csv

# Guardar el DataFrame en un archivo CSV
datos.to_csv('temperaturas.csv', index=False)  # `index=False` para no incluir el índice del DataFrame en el archivo


Output()