# Politica 1

Esta política de evacuación (Política 1) implementa una estrategia de navegación básica que utiliza exclusivamente la información estructural de la ciudad, sin depender de ningún dato de proxy.

# Estrategia principal

La política funciona de la siguiente manera:

1. Intenta encontrar un camino válido desde el nodo inicial hasta cada uno de los nodos de extracción disponibles.
2. Para cada nodo de extracción, calcula el camino más corto usando el algoritmo de Dijkstra (implementado en NetworkX).
3. Para cada camino encontrado, calcula su longitud real sumando los pesos de las aristas.
4. Selecciona el camino con la menor longitud total entre todos los caminos válidos.
5. Si no existe ningún camino hacia los puntos de extracción, la política devuelve solo el nodo inicial.

Para la distribución de recursos, se implementa una estrategia equitativa:
- Los recursos disponibles se dividen en partes iguales entre los tres tipos (explosivos, munición y trajes de radiación)
- Si hay recursos restantes que no pueden dividirse equitativamente, se asignan de manera secuencial

# Lógica detrás de la política

Esta política representa la estrategia de "Los Primeros Días" donde:
1. No hay información disponible sobre condiciones ambientales o amenazas específicas
2. Las decisiones se basan únicamente en la estructura de la ciudad y las distancias
3. Se busca el camino más corto posible, operando bajo la hipótesis de que rutas más cortas implican menor exposición a peligros

La distribución equitativa de recursos refleja la incertidumbre inicial: sin información específica sobre los peligros, es prudente mantener un balance en los recursos para estar preparado ante cualquier escenario.

Esta política establece una línea base simple pero robusta para la evacuación cuando se opera completamente a ciegas, confiando únicamente en el mapa básico de la ciudad.

# Politica 2

Esta política de evacuación (Política 2) implementa una estrategia que utiliza los datos de proxies para encontrar un camino seguro hacia los puntos de extracción, enfocándose específicamente en minimizar el gradiente de peligro.

# Estrategia principal

La política funciona de la siguiente manera:

1. Primero verifica cuáles puntos de extracción son alcanzables desde el nodo inicial.
2. Si no se puede llegar a ningún punto de extracción, la política devuelve solo el nodo inicial.
3. Crea una copia del grafo de la ciudad y modifica los pesos de las aristas basándose en el indicador `hazard_gradient` de cada conexión.
4. La fórmula para el nuevo peso es: `peso_original * (1 + hazard_gradient * 10)`, donde:
   - El factor base (1) preserva el peso original
   - El factor de multiplicación (10) amplifica la influencia del gradiente de peligro
5. Encuentra el camino más corto hacia cada punto de extracción alcanzable usando estos nuevos pesos.
6. Selecciona el camino con el menor costo total (menor exposición acumulada al gradiente de peligro).

Para la distribución de recursos, se implementa una estrategia equitativa:
- Los recursos disponibles se dividen en partes iguales entre los tres tipos (explosivos, munición y trajes de radiación)
- Si hay recursos restantes que no pueden dividirse equitativamente, se asignan secuencialmente

# Lógica detrás de la política

Esta política representa la fase de "Estableciendo la Red de Monitoreo" donde:

1. El `hazard_gradient` se utiliza como indicador crítico porque:
   - Representa cambios bruscos en las condiciones ambientales
   - Los equipos de rescate han identificado que los cambios repentinos en el entorno suelen ser más peligrosos que condiciones adversas constantes
   - Ayuda a evitar zonas donde las condiciones pueden deteriorarse rápidamente

2. A diferencia de la Política 1, esta estrategia:
   - Incorpora información ambiental de los sensores
   - Optimiza las rutas basándose en datos de peligro reales
   - Mantiene la simplicidad en la distribución de recursos mientras mejora significativamente la selección de rutas

Esta política logra un equilibrio entre utilizar la nueva información disponible de los sensores para elegir rutas más seguras, mientras mantiene una asignación de recursos conservadora ante la falta de datos históricos sobre el uso efectivo de cada tipo de recurso.

# Politica 3

Esta política de evacuación (Política 3) implementa un enfoque basado en el análisis de proxies para determinar el camino más seguro hacia los puntos de extracción, con una asignación de recursos dependiente de los problemas encontrados.

# Estrategia principal

La política funciona de la siguiente manera:

1. Se analizan los datos de los nodos y las aristas de la ciudad utilizando PCA para reducir la dimensionalidad de los proxies.
2. Se seleccionan tres proxies representativos para cada tipo de problema (radiación, munición y explosivos).
3. Se establecen umbrales basados en las medias de los valores de los proxies seleccionados, para determinar si un nodo o arista presenta un problema.
4. Se construye un grafo ponderado, donde:
   - Cada nodo recibe un peso equivalente a la cantidad de problemas detectados.
   - Cada arista recibe un peso binario (1 si presenta algún problema, 0 si no lo presenta).
5. Se emplea el algoritmo de Dijkstra para encontrar el camino de menor peso total hacia los puntos de extracción alcanzables.
6. Se elige el camino con la menor exposición acumulada a problemas.
7. Se asignan recursos según los problemas encontrados a lo largo del camino.

# Cálculo de problemas

Se definen umbrales de problemas basados en la media de los valores de los proxies seleccionados:
- **Radiación**: Se asigna un problema si el valor del proxy de radiación excede su umbral.
- **Munición**: Se asigna un problema si el valor del proxy de munición excede su umbral.
- **Explosivos**: Se asigna un problema si el valor del proxy de explosivos excede su umbral.

Cada nodo y arista se evalúa según estos criterios y se asignan pesos en consecuencia.

# Asignación de recursos

Los recursos disponibles se asignan según la cantidad de problemas encontrados en el mejor camino:
- **Trajes de radiación**: Se asigna uno por cada problema de radiación identificado.
- **Munición**: Se asigna una unidad por cada problema térmico identificado.
- **Explosivos**: Se asigna una unidad por cada problema de bloqueo o daño estructural identificado.

Si hay recursos sobrantes, se distribuyen equitativamente entre las tres categorías. Si no es divisible exactamente, se asignan en orden de prioridad.

# Lógica detrás de la política

Esta política mejora la selección de rutas y la asignación de recursos mediante:
- **Uso de PCA**: Reduce la complejidad de los datos y selecciona los proxies más relevantes.
- **Umbrales basados en medias**: Asegura una detección estadísticamente fundamentada de problemas.
- **Optimización de caminos**: Minimiza la exposición acumulada a peligros en la ruta de evacuación.

Al integrar información ambiental con técnicas de reducción de dimensionalidad, esta estrategia ofrece un equilibrio entre precisión y eficiencia en la toma de decisiones bajo condiciones de riesgo.



# Politica 4

Esta política de evacuación (Política 4) implementa una estrategia que utiliza los datos de proxies para encontrar un camino seguro hacia los puntos de extracción, enfocándose específicamente en minimizar el gradiente de peligro.

# Estrategia principal

La política funciona de la siguiente manera:

1. Primero verifica cuáles puntos de extracción son alcanzables desde el nodo inicial.
2. Si no se puede llegar a ningún punto de extracción, la política devuelve solo el nodo inicial.
3. Creamos una copia del grafo de la ciudad y modificamos los pesos de las aristas basándonos en el indicador `hazard_gradient` de cada conexión.
4. Para definir los umbrales de los problemas, utilizamos un algoritmo de Monte Carlo Tree Search para optimizar la asignación de los pesos en función del contexto de peligro.
5. La fórmula para el nuevo peso es: `peso_original * (1 + hazard_gradient * factor_montecarlo)`, donde:
   - El factor Monte Carlo se ajusta en función de las simulaciones realizadas para optimizar la evasión del peligro.
6. Encontramos el camino más corto hacia cada punto de extracción alcanzable usando estos nuevos pesos.
7. Seleccionamos el camino con el menor costo total (menor exposición acumulada al gradiente de peligro).

Para la distribución de recursos, se implementa una estrategia equitativa:
- Los recursos disponibles se dividen en partes iguales entre los tres tipos (explosivos, munición y trajes de radiación)
- Si hay recursos restantes que no pueden dividirse equitativamente, se asignan secuencialmente

# Lógica detrás de la política

Esta política representa la fase de "Estableciendo la Red de Monitoreo" donde:

1. El `hazard_gradient` se utiliza como indicador crítico porque:
   - Representa cambios bruscos en las condiciones ambientales.
   - Los equipos de rescate han identificado que los cambios repentinos en el entorno suelen ser más peligrosos que condiciones adversas constantes.
   - Ayuda a evitar zonas donde las condiciones pueden deteriorarse rápidamente.

2. A diferencia de la Política 3, esta estrategia:
   - Utiliza Monte Carlo Tree Search para optimizar los umbrales de peligro.
   - Optimiza las rutas basándose en datos de peligro simulados.
   - Mantiene la simplicidad en la distribución de recursos mientras mejora significativamente la selección de rutas.

Esta política logra un equilibrio entre utilizar la nueva información disponible de los sensores para elegir rutas más seguras, mientras mantiene una asignación de recursos conservadora ante la falta de datos históricos sobre el uso efectivo de cada tipo de recurso.

