<h1 align="center">
PROYECTO:    
    
<h6 align="center"> ANÁLISIS DE LAS CAUSALES DE INCENDIOS FORESTALES EN REPÚBLICA DOMINICANA EN LOS ÚLTIMOS 5 AÑOS. </h6>

</h1>

El proyecto de análisis de las causas de los incendios forestales en la República Dominicana genera varios valores sociales importantes. En primer lugar, desde una perspectiva medioambiental, busca contribuir a la preservación y protección de los recursos naturales del país, especialmente sus bosques y áreas forestales.

Reducir la incidencia de incendios forestales podría ayudar a conservar la biodiversidad, proteger los hábitats de la vida silvestre y mitigar el cambio climático al preservar los sumideros de carbono. Además, desde un punto de vista social, el proyecto busca proteger las comunidades cercanas a estas áreas, así como la infraestructura y los recursos económicos que dependen de los ecosistemas forestales.


### Indice:
- Fuentes de datos.
- Preguntas de análisis.
- Desarrollo.
- Conclusiones.
- Participantes.

#### Fuentes de datos:

- ###### Kaggle: https://www.kaggle.com/datasets/mbritofer/datosabiertosrd

- ###### Ministerio de Medios Ambiente: https://ambiente.gob.do/informacion-ambiental/estadisticas-ambientales/#548-720-2023-bosque

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime as dt

In [None]:
data = pd.read_csv("./data/Incendios-Forestales-2021.csv", parse_dates=["Fecha origen", "Fecha Extincion"])
data.rename({"Mes de origen ": "Mes de origen"}, axis=1, inplace=True)

print(data.info())

In [None]:
data.head(5)

# Preguntas de análisis:

## ¿Cuáles son las causas más comunes de los incendios forestales? (Refactoriazada)

In [None]:
df_causes = data.loc[:, ["Causas"]]

In [None]:
causes = data["Causas"].value_counts()

In [None]:
# Graficar
causes.plot(kind='barh')

# Agregar etiquetas y título
plt.xlabel('Cantidad de veces')
plt.ylabel('Causa del Incendio')
plt.title('Frecuencia de Ocurrencia por Causa')

# Mostrar el gráfico
plt.show()

## ¿Cuáles son los municipios/provincias más afectados por los incendios forestales?(Refactorizada)


### Municipios

In [None]:
df_forest_fires = data.loc[:, ["Municipio","Provincia"]]

df_all_municipalities =  df_forest_fires["Municipio"].value_counts()


In [None]:
df_all_municipalities.plot(kind='barh')
plt.subplots_adjust(left=0.1, right=0.9, top=1.5, bottom=0.1)

# Agregar etiquetas y título
plt.xlabel('Cantidades de incendios')
plt.ylabel('Municios')
plt.title('Cantidad de Incendios segun el Municipio.')

# Mostrar el gráfico
plt.show()

### Provincias

In [None]:
df_all_province = df_forest_fires["Provincia"].value_counts()

In [None]:
df_all_province.plot(kind='barh')
plt.subplots_adjust(left=0.1, right=0.9, top=1.5, bottom=0.1)

# Agregar etiquetas y título
plt.xlabel('Cantidades de incendios')
plt.ylabel('Provincias')
plt.title('Cantidad de Incendios Segun la Provincia.')

# Mostrar el gráfico
plt.show()

In [None]:
import folium
# Coordenadas
coordenadas_provincia_mas_afectada = [
    [19.177711, -71.321072],
    [19.107247, -71.351460],
    [19.124213, -71.467486],
    [19.000188, -71.519974],
    [18.945327, -71.642907],
    [18.938085, -71.618160],
    [18.891633, -71.637928],
    [18.883186, -71.653233],
    [18.875946, -71.632189],
    [18.886203, -71.616884],
    [18.804777, -71.630145],
    [18.783268, -71.567662],
    [18.657242, -71.577690],
    [18.677290, -71.784762],
    [18.705925, -71.788541],
    [18.722388, -71.737907],
    [18.881209, -71.724303],
    [18.907598, -71.768656],
    [18.954779, -71.782260],
    [18.942628, -71.881261],
    [18.942628, -71.881261],
    [18.959782, -71.887307],
    [18.959782, -71.887307],
    [19.134874, -71.647647],
    [19.281773, -71.591141],
    [19.173181, -71.318580]
]


# Crear un mapa centrado en la República Dominicana
mapa = folium.Map(location=[18.735693, -70.162651], zoom_start=9)


In [None]:

# Marcar las coordenadas
folium.Polygon(locations=coordenadas_provincia_mas_afectada, color='blue', fill=True, fill_color='blue', fill_opacity=0.4).add_to(mapa)

In [None]:

# Mostrar el mapa
mapa

## ¿Hay algún patrón estacional en la ocurrencia de los incendios forestales?


In [None]:
#¿Hay algún patrón estacional en la ocurrencia de los incendios forestales?

def fr_mes(fire):
    #Crea una serie con la cantidad de incendios por mes 
    fire_mes = pd.Series(fire["Mes de origen"].value_counts())

    #Grafica la informacion obtenida
    plt.figure(figsize=(12, 5))
    plt.bar(fire_mes.index, fire_mes.values)
    plt.title("Cantidad de incendios por mes")
    plt.xlabel("Meses")
    plt.ylabel("Cantidad de incendios")
    plt.show()


fr_mes(data)

## ¿Cuál es la duración promedio de un incendio forestal?

In [None]:
#¿Cuál es la duración promedio de un incendio forestal?

def d_prom(fire): #extrae la duracion promedio de los incendios en el dataframe
    #Crea otro DataFrame solo con las columnas deseadas
    delete = ["Municipio", "Provincia", "Fecha Mes", "Causas", "Area Afectada en Tareas", "Metros Cuadrados", "Dia de origen", "Dia extincion"]
    f_clean = fire.drop(delete, axis= 1).sort_values(by='no.')

    #Convierte el continido de las columnas a utilizar en tipo DateTime
    f_clean["Fecha origen"] = pd.to_datetime(f_clean["Fecha origen"], format='%m/%d/%Y')
    f_clean["Fecha Extincion"] = pd.to_datetime(f_clean["Fecha Extincion"], format='%m/%d/%Y')

    #Se descubrio que algunas informaciones sobre meses estaban erroneas, por lo que a continuacion se corrigen
    f_clean.loc[f_clean['Fecha Extincion'] < f_clean['Fecha origen'], 'Fecha Extincion'] = f_clean.loc[f_clean['Fecha Extincion'] < f_clean['Fecha origen'], 'Fecha Extincion'].apply(sum_m)

    #Crea otra columna con la diferencia en dias entre la fecha de inicio de los incendios y la fecha de extincion
    f_clean["Duracion en Dias"] = (f_clean["Fecha Extincion"] - f_clean["Fecha origen"]).dt.days

    #Grafica Duracion de cada incendio forestal
    plt.figure(figsize=(12, 6))
    plt.scatter(f_clean["no."], f_clean["Duracion en Dias"])
    plt.title("Duracion de cada incendio forestal")
    plt.xlabel("no. del incendio")
    plt.ylabel("Dias")
    plt.grid()
    prom = np.mean(f_clean["Duracion en Dias"])
    plt.axhline(y=prom, color='r', linestyle='--', label=f'Promedio de dias = {prom:.2f}')
    plt.legend(loc='upper right')
    plt.show()
    
    #Grafica Cantidad de incendios en funcion a los dias de duracion
    dat = f_clean["Duracion en Dias"].value_counts()
    plt.figure(figsize=(8, 5))
    plt.bar(dat.index, dat.values)
    plt.title("Cantidad de incendios en funcion a los dias de duracion")
    plt.xlabel("Dias")
    plt.ylabel("Cantidad de incendios")
    plt.show()

    #print(f_clean.sort_values(by='Duracion en Dias'))


def sum_m(fecha):
  fecha = dt.strftime(fecha, "%m-%d-%Y")
  m, d, y = fecha.split("-")
  m = int(m) + 1
  return dt.strptime(f"{m}-{d}-{y}", "%m-%d-%Y")

d_prom(data)

### ¿Existe alguna relación entre las causas de los incendios y la duración o el tamaño del área afectada?

Se pueden realizar análisis de correlación para determinar si ciertas causas están asociadas con incendios más grandes o de mayor duración.

##### Tiempo promedio tomado para erradiar los incendios, según la causa y la provincia.


In [None]:
# Tiempo promedio tomado para erradiar los incendios, según la causa
import datetime

datav2 = data.copy()

datav2["Duracion Promedio Ext."] =  datav2["Fecha Extincion"] - datav2["Fecha origen"]
datav2 = datav2.groupby(["Causas"])["Duracion Promedio Ext."].mean()
datav2.sort_values()

In [None]:
plt.figure(figsize=(8, 5))
plt.barh(datav2.index, datav2.values)
plt.title("Tiempo promedio tomado para erradiar los incendios")
plt.xlabel("Días")
plt.ylabel("Causas de incendios")
plt.show()

##### Metros cuadrados totales afectados por tipo de causa.

In [None]:
causes_meter = data.groupby(["Causas"]).agg({"Metros Cuadrados":"sum", "no.":"size"}).reset_index()
causes_meter

In [None]:
causes_meter.plot.barh(x="Causas")

### ¿Cuál es la tendencia de los incendios forestales a lo largo del tiempo?

Al analizar la columna de fecha de origen, se pueden identificar tendencias a lo largo de los años, como si la frecuencia o la magnitud de los incendios ha aumentado o disminuido con el tiempo.

In [None]:
forest_fire_trend = data.groupby("Mes de origen")["Mes de origen"].size()
forest_fire_trend.sort_values(ascending=False).reset_index(name = "Cant. Incendios")

In [None]:
forest_fire_trend
#plt.scatter(forest_fire_trend)
#plt.show()

## ¿Cuál es el impacto económico de los incendios forestales en términos de pérdida de metros cuadrados y recursos utilizados para la extinción?

In [None]:
gasto_total = 6786000  # 6,786,000 pesos dominicanos
datos = data.copy()

# Calcula el gasto por metro cuadrado para cada fila
datos['Gasto por metro cuadrado (DOP)'] = gasto_total / datos['Metros Cuadrados']

# Agrupa los datos por provincia y calcular el promedio del gasto por metro cuadrado
gasto_promedio_por_provincia = datos.groupby('Provincia')['Gasto por metro cuadrado (DOP)'].mean()

# Ordena los valores para identificar las provincias con el mayor gasto por metro cuadrado
provincias_con_mayor_gasto = gasto_promedio_por_provincia.sort_values(ascending=False)

# Obtiene los metros cuadrados para cada provincia
metros_cuadrados_por_provincia = datos.groupby('Provincia')['Metros Cuadrados'].sum()

# Modifica el índice para incluir los metros cuadrados junto al nombre de la provincia
provincias_con_mayor_gasto.index = provincias_con_mayor_gasto.index + ' (' + metros_cuadrados_por_provincia.astype(str) + ' m^2)'

# Imprime el resultado
print("Provincias con el mayor gasto por metro cuadrado:")
print(provincias_con_mayor_gasto)


In [None]:
plt.figure(figsize=(10, 6))
provincias_con_mayor_gasto.plot(kind='bar', color='skyblue')
plt.title('Gasto promedio por metro cuadrado por provincia\n Gasto promedio mensual de 6,786,000 (DOP)')
plt.xlabel('Provincia')
plt.ylabel('gasto_por_metro_cuadrado (Dop)')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

In [None]:
# Agrupa los datos por provincia y causa de incendio, y contar la frecuencia
causas_por_provincia = datos.groupby(['Provincia', 'Causas'])['Causas'].count()

# Encuentra la causa más común por provincia
causas_principales_por_provincia = causas_por_provincia.groupby(level=0).idxmax().reset_index()

# Imprime el resultado
print("Principales causas de incendios por provincia:")
print(causas_principales_por_provincia)


In [None]:
# Contar la frecuencia de cada causa de incendio por provincia
causas_por_provincia = datos.groupby(['Provincia', 'Causas']).size().unstack(fill_value=0)

# Graficar
causas_por_provincia.plot(kind='bar', stacked=True, figsize=(10, 6))
plt.xlabel('Provincia')
plt.ylabel('Número de Incendios')
plt.title('Causas de Incendios por Provincia')
plt.legend(title='Causas', bbox_to_anchor=(1.05, 1), loc='upper left')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

# Resumen de incendios (2000 a 2024)

In [None]:
incendios_2000_act = pd.read_csv("./data/Incendios-Forestales-Ocurridos-2000-2024-ene.csv")
incendios_2000_act.set_index("Años")

incendios_2000_act.plot.bar(x="Años", y="Cantidad de incendios")

In [None]:
causa_2k21_to_2k24 = pd.read_csv("./data/Incendio-ocurridos-por-causa-2021-2024.csv")
resumen = causa_2k21_to_2k24.groupby(["Causa del Incendio", "Año"])["Cantidad de incendio"].sum().reset_index(name = "Cant. incendios").set_index("Año")
resumen