## Identificación de Sitio Web y API

### Página web escogida berger: 
https://www.berger.ca/es/recursos-para-los-productores/tips-y-consejos-practicos/ambiente-necesario-para-la-apropiada-germinacion-de-la-semilla/#:~:text=La%20mayor%C3%ADa%20de%20las%20semillas,luz%20del%20sol%20para%20crecer

### Resumen:
- Germinación de las semillas: La página explica los factores que influyen en la germinación de las semillas, como la temperatura, la humedad, el oxígeno y la luz. También indica los rangos de temperatura óptimos para diferentes tipos de semillas.
- Referencias: La página contiene muchas referencias a otras fuentes de información sobre la producción de hortalizas orgánicas.

### Api escogida de clima global MeteoSource:
https://www.meteosource.com/

### Resumen:
- Meteosource: una empresa que ofrece servicios profesionales de información meteorológica basados en la inteligencia artificial y el big data.
- Weather API: una interfaz de programación de aplicaciones que permite acceder a datos meteorológicos hiperlocales, precisos y actualizados en tiempo real para cualquier coordenada GPS. Incluye pronósticos por minuto, por hora y por día hasta 30 días.
- Weather Maps: mapas meteorológicos de alta resolución que se pueden superponer dentro de aplicaciones de mapeo. Capas actuales y pronosticadas que incluyen los datos más útiles sobre precipitación, temperatura y otras variables.
- Historical Weather: datos meteorológicos históricos basados en mediciones reales. Recibe el clima histórico para cualquier lugar del mundo.
- Custom Solutions: soluciones personalizadas adaptadas a las necesidades y sectores específicos de los clientes. Además, los expertos en IA están siempre listos para aplicar sus modelos para los fines que se especifiquen.

## Web Scraping a la página web berger

In [16]:
import requests
from bs4 import BeautifulSoup

def scrape_berger_ca(url):
    # Realizar la solicitud GET a la página web
    response = requests.get(url)
    
    # Verificar si la solicitud fue exitosa
    if response.status_code == 200:
        # Parsear el contenido HTML con BeautifulSoup
        soup = BeautifulSoup(response.content, 'html.parser')
        
        # Imprimir el contenido HTML formateado
        print(soup.prettify())
        
    else:
        print("Error al acceder a la página web.")

# URL de la página web
url = 'https://www.berger.ca/es/recursos-para-los-productores/tips-y-consejos-practicos/ambiente-necesario-para-la-apropiada-germinacion-de-la-semilla/#:~:text=La%20mayor%C3%ADa%20de%20las%20semillas,luz%20del%20sol%20para%20crecer'

# Llamar a la función para hacer web scraping e imprimir el contenido HTML
scrape_berger_ca(url)


<!DOCTYPE html>
<html class="no-js" lang="es">
 <head>
  <meta charset="utf-8"/>
  <script type="text/javascript">
   /* <![CDATA[ */
 var gform;gform||(document.addEventListener("gform_main_scripts_loaded",function(){gform.scriptsLoaded=!0}),window.addEventListener("DOMContentLoaded",function(){gform.domLoaded=!0}),gform={domLoaded:!1,scriptsLoaded:!1,initializeOnLoaded:function(o){gform.domLoaded&&gform.scriptsLoaded?o():!gform.domLoaded&&gform.scriptsLoaded?window.addEventListener("DOMContentLoaded",o):document.addEventListener("gform_main_scripts_loaded",o)},hooks:{action:{},filter:{}},addAction:function(o,n,r,t){gform.addHook("action",o,n,r,t)},addFilter:function(o,n,r,t){gform.addHook("filter",o,n,r,t)},doAction:function(o){gform.doHook("action",o,arguments)},applyFilters:function(o){return gform.doHook("filter",o,arguments)},removeAction:function(o,n){gform.removeHook("action",o,n)},removeFilter:function(o,n,r){gform.removeHook("filter",o,n,r)},addHook:function(o,n,r,t,i){null==

In [68]:
import requests
from bs4 import BeautifulSoup
import csv

def scrape_table_data(url):
    # Realizar la solicitud GET a la página web
    response = requests.get(url)

    # Verificar si la solicitud fue exitosa
    if response.status_code == 200:
        # Parsear el contenido HTML con BeautifulSoup
        soup = BeautifulSoup(response.content, 'html.parser')

        # Encontrar el div con la clase "column-5"
        div_column_5 = soup.find('div', class_='column-5')

        # Verificar si se encontró el div
        if div_column_5:
            # Buscar la tabla dentro del div
            table = div_column_5.find('table')

            # Verificar si se encontró la tabla
            if table:
                # Obtener las filas de la tabla
                rows = table.find_all('tr')

                # Obtener los nombres de las columnas
                header_row = rows[0]
                header_columns = header_row.find_all(['th', 'td'])
                column_names = ["Hortalizas", "tem_min", "ran_optim", "tem_optim", "tem_max"]

                # Imprimir los nombres de las columnas
                print(column_names)

                # Procesar el resto de las filas
                for row in rows[1:]:
                    columns = row.find_all(['th', 'td'])
                    row_data = [column.text.strip() for column in columns]
                    print(row_data)

                # Crear un archivo CSV para escribir los datos
                csv_filename = 'datos_hortalizas.csv'
                with open(csv_filename, 'w', newline='', encoding='utf-8') as csvfile:
                    writer = csv.writer(csvfile)
                    writer.writerow(column_names)

                    # Procesar el resto de las filas y escribir en el CSV
                    for row in rows[1:]:
                        columns = row.find_all(['th', 'td'])
                        row_data = [column.text.strip() for column in columns]
                        writer.writerow(row_data)

                print(f'Datos exportados a {csv_filename}')
            else:
                print("No se encontró ninguna tabla dentro del div con la clase 'column-5'.")
        else:
            print("No se encontró el div con la clase 'column-5'.")
    else:
        print("Error al acceder a la página web.")

# URL de la página web
url = 'https://www.berger.ca/es/recursos-para-los-productores/tips-y-consejos-practicos/ambiente-necesario-para-la-apropiada-germinacion-de-la-semilla/#:~:text=La%20mayor%C3%ADa%20de%20las%20semillas,luz%20del%20sol%20para%20crecer'

# Llamar a la función para extraer la información de la tabla y exportar a CSV
scrape_table_data(url)




['Hortalizas', 'tem_min', 'ran_optim', 'tem_optim', 'tem_max']
['Betabel', '4', '10-29', '29', '29']
['Frijol', '15', '15-29', '26', '35']
['Repollo', '4', '7-35', '29', '37']
['Coliflor', '4', '7-29', '26', '37']
['Apio', '4', '15-21', '21', '29']
['Acelga', '4', '10-29', '29', '35']
['Pepino', '15', '15-35', '35', '40']
['Berenjena', '15', '23-32', '29', '35']
['Lechuga', '1', '4-26', '23', '29']
['Melón', '15', '23-35', '32', '37']
['Cebolla', '1', '10-35', '23', '35']
['Perejil', '4', '10-29', '23', '32']
['Chícharo', '4', '4-23', '23', '29']
['Chile', '15', '18-35', '29', '35']
['Calabaza', '15', '21-32', '32', '37']
['Espinaca', '1', '7-23', '21', '29']
['Calabacita', '15', '21-35', '35', '37']
['Maíz Dulce', '10', '15-35', '35', '40']
['Tomate', '10', '21-35', '29', '35']
Datos exportados a datos_hortalizas.csv


## Uso de la API de MeteoSource:

Documentación api MeteoSource: https://www.meteosource.com/documentation#python

### Estructura de la solicitud HTML:

- place_id: Ubicación a analizar.
- sections: Secciones que se incluirán en la respuesta, tenemos opciones como current (situación actual), dayli (predicciones para cada día completo), hourly (predicciones con resolución horaria) y all (todos las secciones).
- timezone: Zona horaria, en caso de no poner nada será automática, de otro modo buscar en [Zonas horarias](https://en.wikipedia.org/wiki/List_of_tz_database_time_zones#List).
- language: Idioma de respuestas.
- units: Unidades de las medidas, tenemos la opción de auto (automático), metric (sistema internacional), us (unidades imperiales), uk y ca (iguales al sistema internacional pero con algunas excepciones).
- key: Key generada para el uso del API.

In [4]:
pip install --upgrade requests

Defaulting to user installation because normal site-packages is not writeableNote: you may need to restart the kernel to use updated packages.



### Usando la API para el clima del día:

In [69]:
#Importando librerías
from urllib.request import urlopen
import requests
import json
import csv

# Definición de la API Key y la URL de la API de MeteoSource para Lima

apikey="wl1fq8nuvjv4exgk53iyn63hovk2tz6x4spoigyr" #Key generada para el uso de la API
sections="hourly" #Sección incluida en la respuesta
units="metric" #Unidades del S.I.
# Estructurando la solicitud (Request URL)
url="https://www.meteosource.com/api/v1/free/point?place_id=lima&sections="+sections+"&language=en&units="+units+"&key="+apikey

uclient=urlopen(url)
responsehtml=uclient.read()
uclient.close()
data = responsehtml.decode()
data

'{"lat":"12.04318S","lon":"77.02824W","elevation":152,"timezone":"America/Lima","units":"metric","current":null,"hourly":{"data":[{"date":"2024-01-14T23:00:00","weather":"overcast","icon":7,"summary":"Overcast","temperature":21.2,"wind":{"speed":3.0,"dir":"S","angle":184},"cloud_cover":{"total":100},"precipitation":{"total":0.0,"type":"none"}},{"date":"2024-01-15T00:00:00","weather":"overcast","icon":7,"summary":"Overcast","temperature":21.0,"wind":{"speed":2.9,"dir":"S","angle":183},"cloud_cover":{"total":100},"precipitation":{"total":0.0,"type":"none"}},{"date":"2024-01-15T01:00:00","weather":"overcast","icon":7,"summary":"Overcast","temperature":21.0,"wind":{"speed":2.5,"dir":"S","angle":182},"cloud_cover":{"total":100},"precipitation":{"total":0.0,"type":"none"}},{"date":"2024-01-15T02:00:00","weather":"overcast","icon":7,"summary":"Overcast","temperature":21.0,"wind":{"speed":2.3,"dir":"S","angle":181},"cloud_cover":{"total":100},"precipitation":{"total":0.0,"type":"none"}},{"date

In [70]:
# Imprimir el tipo de datos de la variable "data" para verificar su tipo.
print(type(data))
#print(len(data))

<class 'str'>


In [71]:
# Convertir la cadena "data" (que contiene datos en formato JSON) a un objeto Python utilizando json.loads().
info = json.loads(data) 
info

{'lat': '12.04318S',
 'lon': '77.02824W',
 'elevation': 152,
 'timezone': 'America/Lima',
 'units': 'metric',
 'current': None,
 'hourly': {'data': [{'date': '2024-01-14T23:00:00',
    'weather': 'overcast',
    'icon': 7,
    'summary': 'Overcast',
    'temperature': 21.2,
    'wind': {'speed': 3.0, 'dir': 'S', 'angle': 184},
    'cloud_cover': {'total': 100},
    'precipitation': {'total': 0.0, 'type': 'none'}},
   {'date': '2024-01-15T00:00:00',
    'weather': 'overcast',
    'icon': 7,
    'summary': 'Overcast',
    'temperature': 21.0,
    'wind': {'speed': 2.9, 'dir': 'S', 'angle': 183},
    'cloud_cover': {'total': 100},
    'precipitation': {'total': 0.0, 'type': 'none'}},
   {'date': '2024-01-15T01:00:00',
    'weather': 'overcast',
    'icon': 7,
    'summary': 'Overcast',
    'temperature': 21.0,
    'wind': {'speed': 2.5, 'dir': 'S', 'angle': 182},
    'cloud_cover': {'total': 100},
    'precipitation': {'total': 0.0, 'type': 'none'}},
   {'date': '2024-01-15T02:00:00',
   

In [72]:
import pandas as pd
import json

# Lista para almacenar los datos estructurados
structured_data = []

# Iterar sobre los datos por hora
for hour_data in info['hourly']['data']:
    structured_data.append({
        'temperature': hour_data['temperature'],
        'summary': hour_data['summary'],
        'cloud_cover': hour_data['cloud_cover']['total'],
        'precipitation': hour_data['precipitation']['total'],
        'wind_speed': hour_data['wind']['speed']
    })

# Escribir los datos en un archivo CSV
csv_file_path = 'datos_clima_dia.csv'
csv_fields = ['temperature', 'summary', 'cloud_cover', 'precipitation', 'wind_speed']

with open(csv_file_path, mode='w', newline='') as csv_file:
    writer = csv.DictWriter(csv_file, fieldnames=csv_fields)
    
    # Escribir encabezados
    writer.writeheader()
    
    # Escribir datos
    writer.writerows(structured_data)

print(f"Los datos han sido guardados en {csv_file_path}")

Los datos han sido guardados en datos_clima_dia.csv


### Usando la API para el clima de los días siguientes:

In [73]:
#Importando librerías
from urllib.request import urlopen
import requests
import json
import csv

# Definición de la API Key y la URL de la API de MeteoSource para Lima

apikey="wl1fq8nuvjv4exgk53iyn63hovk2tz6x4spoigyr" #Key generada para el uso de la API
sections="daily" #Sección incluida en la respuesta
units="metric" #Unidades del S.I.
# Estructurando la solicitud (Request URL)
url="https://www.meteosource.com/api/v1/free/point?place_id=lima&sections="+sections+"&language=en&units="+units+"&key="+apikey

uclient=urlopen(url)
responsehtml=uclient.read()
uclient.close()
data = responsehtml.decode()

# Convertir la cadena "data" (que contiene datos en formato JSON) a un objeto Python utilizando json.loads().
info2 = json.loads(data) 
info2

{'lat': '12.04318S',
 'lon': '77.02824W',
 'elevation': 152,
 'timezone': 'America/Lima',
 'units': 'metric',
 'current': None,
 'hourly': None,
 'daily': {'data': [{'day': '2024-01-14',
    'weather': 'overcast',
    'icon': 7,
    'summary': 'Cloudy. Temperature 21/26 °C.',
    'all_day': {'weather': 'overcast',
     'icon': 7,
     'temperature': 23.0,
     'temperature_min': 21.2,
     'temperature_max': 26.2,
     'wind': {'speed': 3.0, 'dir': 'SSW', 'angle': 197},
     'cloud_cover': {'total': 94},
     'precipitation': {'total': 0.5, 'type': 'rain'}},
    'morning': None,
    'afternoon': None,
    'evening': None},
   {'day': '2024-01-15',
    'weather': 'cloudy',
    'icon': 6,
    'summary': 'Partly sunny changing to cloudy by afternoon and evening. Temperature 21/26 °C.',
    'all_day': {'weather': 'cloudy',
     'icon': 6,
     'temperature': 22.8,
     'temperature_min': 20.5,
     'temperature_max': 26.2,
     'wind': {'speed': 3.0, 'dir': 'SSW', 'angle': 199},
     'clou

In [74]:
# Crear un archivo CSV
csv_filename = 'datos_clima_7dias.csv'

# Extraer y escribir los datos en el CSV
with open(csv_filename, 'w', newline='') as csvfile:
    fieldnames = ['tem', 'tem_min', 'tem_max', 'weather', 'wind_speed', 'cloud_cover', 'precipitacion']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

    # Escribir la fila de encabezado
    writer.writeheader()

    # Iterar sobre los datos diarios
    for day_data in info2['daily']['data']:
        all_day_data = day_data.get('all_day', {})
        writer.writerow({
            'tem': all_day_data.get('temperature', ''),
            'tem_min': all_day_data.get('temperature_min', ''),
            'tem_max': all_day_data.get('temperature_max', ''),
            'weather': day_data.get('weather', ''),
            'wind_speed': all_day_data['wind'].get('speed', '') if 'wind' in all_day_data else '',
            'cloud_cover': all_day_data['cloud_cover'].get('total', '') if 'cloud_cover' in all_day_data else '',
            'precipitacion': all_day_data['precipitation'].get('total', '') if 'precipitation' in all_day_data else ''
        })

print(f'Datos exportados a {csv_filename}')

Datos exportados a datos_clima_7dias.csv
