# Politica 1

Esta política de evacuación (Política 1) implementa una estrategia de navegación básica que utiliza exclusivamente la información estructural de la ciudad, sin depender de ningún dato de proxy.

# Estrategia principal

La política funciona de la siguiente manera:

1. Intenta encontrar un camino válido desde el nodo inicial hasta cada uno de los nodos de extracción disponibles.
2. Para cada nodo de extracción, calcula el camino más corto usando el algoritmo de Dijkstra (implementado en NetworkX).
3. Para cada camino encontrado, calcula su longitud real sumando los pesos de las aristas.
4. Selecciona el camino con la menor longitud total entre todos los caminos válidos.
5. Si no existe ningún camino hacia los puntos de extracción, la política devuelve solo el nodo inicial.

Para la distribución de recursos, se implementa una estrategia equitativa:
- Los recursos disponibles se dividen en partes iguales entre los tres tipos (explosivos, munición y trajes de radiación)
- Si hay recursos restantes que no pueden dividirse equitativamente, se asignan de manera secuencial

# Lógica detrás de la política

Esta política representa la estrategia de "Los Primeros Días" donde:
1. No hay información disponible sobre condiciones ambientales o amenazas específicas
2. Las decisiones se basan únicamente en la estructura de la ciudad y las distancias
3. Se busca el camino más corto posible, operando bajo la hipótesis de que rutas más cortas implican menor exposición a peligros

La distribución equitativa de recursos refleja la incertidumbre inicial: sin información específica sobre los peligros, es prudente mantener un balance en los recursos para estar preparado ante cualquier escenario.

Esta política establece una línea base simple pero robusta para la evacuación cuando se opera completamente a ciegas, confiando únicamente en el mapa básico de la ciudad.

# Politica 2

Esta política de evacuación (Política 2) implementa una estrategia que utiliza los datos de proxies para encontrar un camino seguro hacia los puntos de extracción, enfocándose específicamente en minimizar el gradiente de peligro.

# Estrategia principal

La política funciona de la siguiente manera:

1. Primero verifica cuáles puntos de extracción son alcanzables desde el nodo inicial.
2. Si no se puede llegar a ningún punto de extracción, la política devuelve solo el nodo inicial.
3. Crea una copia del grafo de la ciudad y modifica los pesos de las aristas basándose en el indicador `hazard_gradient` de cada conexión.
4. La fórmula para el nuevo peso es: `peso_original * (1 + hazard_gradient * 10)`, donde:
   - El factor base (1) preserva el peso original
   - El factor de multiplicación (10) amplifica la influencia del gradiente de peligro
5. Encuentra el camino más corto hacia cada punto de extracción alcanzable usando estos nuevos pesos.
6. Selecciona el camino con el menor costo total (menor exposición acumulada al gradiente de peligro).

Para la distribución de recursos, se implementa una estrategia equitativa:
- Los recursos disponibles se dividen en partes iguales entre los tres tipos (explosivos, munición y trajes de radiación)
- Si hay recursos restantes que no pueden dividirse equitativamente, se asignan secuencialmente

# Lógica detrás de la política

Esta política representa la fase de "Estableciendo la Red de Monitoreo" donde:

1. El `hazard_gradient` se utiliza como indicador crítico porque:
   - Representa cambios bruscos en las condiciones ambientales
   - Los equipos de rescate han identificado que los cambios repentinos en el entorno suelen ser más peligrosos que condiciones adversas constantes
   - Ayuda a evitar zonas donde las condiciones pueden deteriorarse rápidamente

2. A diferencia de la Política 1, esta estrategia:
   - Incorpora información ambiental de los sensores
   - Optimiza las rutas basándose en datos de peligro reales
   - Mantiene la simplicidad en la distribución de recursos mientras mejora significativamente la selección de rutas

Esta política logra un equilibrio entre utilizar la nueva información disponible de los sensores para elegir rutas más seguras, mientras mantiene una asignación de recursos conservadora ante la falta de datos históricos sobre el uso efectivo de cada tipo de recurso.

# Politica 3

Esta política de evacuación (Política 3) implementa un enfoque basado en el análisis de proxies para determinar el camino más seguro hacia los puntos de extracción, con una asignación de recursos dependiente de los problemas encontrados.

# Estrategia principal

La política funciona de la siguiente manera:

1. Se analizan los datos de los nodos y las aristas de la ciudad utilizando PCA para reducir la dimensionalidad de los proxies.
2. Se seleccionan tres proxies representativos para cada tipo de problema (radiación, munición y explosivos).
3. Se establecen umbrales basados en las medias de los valores de los proxies seleccionados, para determinar si un nodo o arista presenta un problema.
4. Se construye un grafo ponderado, donde:
   - Cada nodo recibe un peso equivalente a la cantidad de problemas detectados.
   - Cada arista recibe un peso binario (1 si presenta algún problema, 0 si no lo presenta).
5. Se emplea el algoritmo de Dijkstra para encontrar el camino de menor peso total hacia los puntos de extracción alcanzables.
6. Se elige el camino con la menor exposición acumulada a problemas.
7. Se asignan recursos según los problemas encontrados a lo largo del camino.

# Cálculo de problemas

Se definen umbrales de problemas basados en la media de los valores de los proxies seleccionados:
- **Radiación**: Se asigna un problema si el valor del proxy de radiación excede su umbral.
- **Munición**: Se asigna un problema si el valor del proxy de munición excede su umbral.
- **Explosivos**: Se asigna un problema si el valor del proxy de explosivos excede su umbral.

Cada nodo y arista se evalúa según estos criterios y se asignan pesos en consecuencia.

# Asignación de recursos

Los recursos disponibles se asignan según la cantidad de problemas encontrados en el mejor camino:
- **Trajes de radiación**: Se asigna uno por cada problema de radiación identificado.
- **Munición**: Se asigna una unidad por cada problema térmico identificado.
- **Explosivos**: Se asigna una unidad por cada problema de bloqueo o daño estructural identificado.

Si hay recursos sobrantes, se distribuyen equitativamente entre las tres categorías. Si no es divisible exactamente, se asignan en orden de prioridad.

# Lógica detrás de la política

Esta política mejora la selección de rutas y la asignación de recursos mediante:
- **Uso de PCA**: Reduce la complejidad de los datos y selecciona los proxies más relevantes.
- **Umbrales basados en medias**: Asegura una detección estadísticamente fundamentada de problemas.
- **Optimización de caminos**: Minimiza la exposición acumulada a peligros en la ruta de evacuación.

Al integrar información ambiental con técnicas de reducción de dimensionalidad, esta estrategia ofrece un equilibrio entre precisión y eficiencia en la toma de decisiones bajo condiciones de riesgo.



# Politica 4

Esta política de evacuación (Política 4) implementa un enfoque basado en el análisis de proxies para determinar el camino más seguro hacia los puntos de extracción, con una asignación de recursos dependiente de los problemas encontrados.

# Estrategia principal

La política funciona de la siguiente manera:

1. Se definen umbrales específicos para detectar diferentes tipos de amenazas en la ciudad: lecturas térmicas (zombies), radiación y densidad de escombros.
2. Se construye un grafo ponderado donde:
   - Cada nodo recibe un peso basado en los problemas de radiación y térmicos detectados.
   - Cada arista recibe un peso binario (1 si presenta problemas de escombros, 0 si no).
3. Se emplea el algoritmo de Dijkstra para encontrar el camino de menor peso total hacia cada punto de extracción.
4. Se selecciona el camino con el menor peso acumulado entre todas las rutas posibles.
5. Se asignan recursos específicamente según los problemas encontrados a lo largo del camino elegido.

# Optimización mediante Monte Carlo Tree Search

Los umbrales críticos (THERMAL_THRESHOLD, RADIATION_THRESHOLD, DEBRIS_THRESHOLD) fueron determinados mediante un proceso de Monte Carlo Tree Search (MCTS), que:

1. Exploró sistemáticamente diferentes combinaciones de umbrales en un amplio espacio de búsqueda.
2. Para cada conjunto de valores candidatos, ejecutó múltiples simulaciones en diversas configuraciones de ciudades.
3. Evaluó cada combinación según múltiples métricas: tasa de éxito, eficiencia de recursos y tiempo de evacuación.
4. Refinó iterativamente la búsqueda, concentrándose en las regiones del espacio de parámetros que mostraban mejor desempeño.
5. Convergió hacia los valores óptimos para cada indicador (0.2, 0.18 y 0.27 respectivamente).

Este enfoque nos permitió identificar con precisión los niveles de amenaza significativos sin depender de heurísticas arbitrarias o suposiciones no fundamentadas.

# Cálculo de problemas

A lo largo del camino seleccionado, se contabilizan:
- **Problemas térmicos**: Nodos donde las lecturas térmicas superan el umbral de 0.2.
- **Problemas de radiación**: Nodos donde las lecturas de radiación superan el umbral de 0.18.
- **Problemas de bloqueo**: Aristas donde la densidad de escombros supera el umbral de 0.27.

# Asignación de recursos

Los recursos se asignan con precisión según los problemas identificados:
- **Trajes de radiación**: Uno por cada problema de radiación detectado.
- **Munición**: Una unidad por cada problema térmico (concentración de zombies).
- **Explosivos**: Una unidad por cada problema de bloqueo por escombros.

Si quedan recursos disponibles después de esta asignación, se distribuyen equitativamente entre las tres categorías como medida de contingencia.

# Ventajas de este enfoque

Esta política ofrece varias ventajas sobre métodos más simples:
- **Precisión en la detección de amenazas**: Los umbrales optimizados mediante MCTS permiten identificar con mayor exactitud las amenazas reales.
- **Asignación eficiente de recursos**: Los recursos se asignan específicamente para los desafíos anticipados, evitando el desperdicio.
- **Adaptabilidad**: La política se adapta a diferentes configuraciones de ciudad y patrones de amenazas.
- **Fundamentación estadística**: Los umbrales no son arbitrarios sino derivados de un riguroso proceso de optimización.

Al combinar algoritmos de búsqueda de rutas con optimización basada en simulación, esta estrategia maximiza las probabilidades de evacuación exitosa en entornos altamente peligrosos y con recursos limitados.