In [38]:
import geopandas
from shapely import Polygon

import os
import json
import wget
import zipfile

from dotenv import load_dotenv

from openai import OpenAI

In [39]:

def download_national_parks_data(
        url_path: str = "https://opendata.arcgis.com/datasets/beb04b0e5bed44da9e5407ea50477a5c_0.zip",
        output_directory_base: str = "../data/parques_nacionales",
        raw_data: str = '../data/raw',
        name: str = "data_parques"
) -> str:
    """
    Download the national parks data from the url_path and save it in the output_directory_base
    """
    if not os.path.exists(output_directory_base):
        os.makedirs(output_directory_base, exist_ok=True)

    if not os.path.exists(raw_data):
        os.makedirs(raw_data, exist_ok=True)

    # Download the data
    output_directory = wget.download(url_path, out=raw_data)
    # Unzip the data
    with zipfile.ZipFile(output_directory, 'r') as zip_ref:
        zip_ref.extractall(output_directory_base)

    for file in os.listdir(output_directory_base):
        os.rename(
            os.path.join(output_directory_base, file), 
            os.path.join(output_directory_base, name + os.path.splitext(file)[1])
        )
    return output_directory_base

In [40]:
load_dotenv("../.env")

name = "data_parques"
output_directory_base = download_national_parks_data(name=name)

# Load files
df = geopandas.read_file(
    os.path.join(output_directory_base, name + ".shp")
)

In [41]:
df_demo = geopandas.read_file(
    "../data/demo_data/doc.kml"
)

In [42]:
df_kms = df.to_crs("EPSG:32633")
demo_geometry_kms = df_demo.to_crs("EPSG:32633")

In [57]:
class NationalParkAssistant:

    def __init__(self, df: geopandas.GeoDataFrame, client: OpenAI):
        self.df = df
        self.client = client

    def system_prompt(self) -> str:
        
        
        system_prompt = """
        Eres un experto en parques nacionales y te han contratado para hacer la evaluación de impacto ambiental
        de un nuevo proyecto fotovoltaico en Chile.

        El usuario entregará su locacion y los parques nacionales cercanos en un radio de 3km.

        Tu trabajo es entregar una detallada evaluación de impacto ambiental del proyecto fotovoltaico en los parques nacionales cercanos.

        Para esto primero vas a entregar un resumen si encuentras algo critico, para rechazar el proyecto, si no di que todo esta bien.

        En caso de que encuentres algo critico, debes entregar una evaluación detallada de los impactos ambientales y sociales del proyecto.

        El output será un JSON con dos campos
        ```json
        {
            "resumen": Resumen corto de la evaluacion,
            "evaluacion": Detalle de la evaluacion
        }
        ```
        """
        return system_prompt
    
    def format_message(self, close_parks: geopandas.GeoDataFrame) -> str:
        close_parks_data = str(close_parks.to_dict("records"))
        message = """
        Los parques nacionales cercanos a menos de 3km son:
        {close_parks}
        """
        return message.replace("{close_parks}", close_parks_data)


    def evaluate_project(self, location: Polygon, threshold_in_meters: int = 3000) -> dict:
        distance = self.df.geometry.distance(location.iloc[0].geometry)

        close_parks = self.df[distance < threshold_in_meters]
        
        print("Numero de parques cercanos: ", close_parks.shape[0])

        system_prompt = self.system_prompt()
        message = self.format_message(close_parks)

        messages = [
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": message}
        ]
        response = self.client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=messages,
            response_format={ "type": "json_object" },
            temperature=0
        )
        return json.loads(response.choices[0].message.content)

In [58]:
park_assistant = NationalParkAssistant(df_kms, OpenAI())

In [59]:
response = park_assistant.evaluate_project(demo_geometry_kms, threshold_in_meters=50000)

Numero de parques cercanos:  9


In [60]:
response

{'resumen': 'Se encontraron varios parques nacionales cercanos al proyecto fotovoltaico, por lo que es necesario realizar una evaluación detallada de impacto ambiental y social antes de aprobar el proyecto.',
 'evaluacion': 'El proyecto fotovoltaico propuesto podría tener impactos significativos en los parques nacionales cercanos, como Quebrada de Córdova, Sector Canelo - Canelillo, Sector costero de Isla Negra, Barrios Vaticano y Quirinal, Playa Tunquén-Quebrada Seca, Humedal de Tunquén, Capilla Los Perales, Casa Labbé y Ex ballenera de Quintay. Algunos de los impactos ambientales y sociales a considerar incluyen la alteración del paisaje natural, la posible contaminación del agua y suelo, la interrupción de los ecosistemas locales, el riesgo para la fauna y flora nativa, así como posibles conflictos con las comunidades locales y turistas que visitan estos parques. Se recomienda realizar estudios de impacto ambiental exhaustivos y consultar con las autoridades competentes y la comunid