<a href="https://colab.research.google.com/github/MartinezLaura/RPC_PAC1/blob/main/Actividad1_RPC_MartinezSanchezLaura.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
#Clonamos el git
!git clone https://MartinezLaura:G4t3tT3d1!@github.com/MartinezLaura/RPC_PAC1.git
!sleep 3
#Realizamos importacion
import os 
import sys
#Importacion de nuestras funciones
sys.path.append('/content/RPC_PAC1')
import main as mn
import numpy as np

Cloning into 'RPC_PAC1'...
remote: Enumerating objects: 128, done.[K
remote: Counting objects: 100% (128/128), done.[K
remote: Compressing objects: 100% (124/124), done.[K
remote: Total 128 (delta 71), reused 0 (delta 0), pack-reused 0[K
Receiving objects: 100% (128/128), 775.17 KiB | 17.23 MiB/s, done.
Resolving deltas: 100% (71/71), done.


# A*

## Definición
El algoritmo A* es un algoritmo de búsqueda informada que, a partir de un estado inicial y un estado meta, busca una solución óptima al problema a través de una búsqueda por anchura y una heurística. La función que evalua los estados posibles para llegar al estado meta es:

$f(n) = g(n) + h'(n)$, donde

$g(n)$ es la distancia real entre el nodo inicial y el actual, y

$h'(n)$ es la funcion heurística que mide la distancia estimada entre el nodo actual y la meta





## Propiedades
* La heuristica tiene que se **admisible**. Nunca puede sobreestimar la distancia, para todo $n$, $h(n)\leq Coste_{minReal}(n)$ 
* Si el problema tiene solución, el algoritmo la encuentra
* $h(n)$ es consistente o monotona,  $h'(n_{actual}) \leq g(n_{sucesor}) - g(n_{actual}) + h'(n_{sucesor})$ 



## Problema planteado
Amazon robot que debe mover las mercancias de un origen a un destino marcado


### Estado inicial y final
![Estados iniciales y finales](https://raw.githubusercontent.com/MartinezLaura/RPC_PAC1/main/soporte/Estados.jpg?token=AF4STFUOXUBCQ3A6HOXXDJLASPTFO)


Donde, 
*   R: representa el robot. Inicialmente está ubicado en la posición [2,2]
*   \#: representa una pared. 
*   M1, M2, e M3: representan los tres inventarios que el robot debe mover. Y se encuentran ubicadas en las posiciones [0,0], [2,0] y [0,3] respectivamente.




## Asunciones hechas:
 1. Las mercancias, al ser estanterias como en el video, se consideraran obstáculos, solo cuando tengamos mercancia cargada. En los otros casos se asume que no es obstáculo dado que el robot puede pasar por debajo.
 2. El orden de recogida se escoge con una heurística.
 3. La posicion del robot para recoger la siguiente mercancia siempre será la ultima posición que el robot tubiera. 
 4. Dado que la distancia de Manhattan, en este problema, es monotona y admisible, $h(n)$ no puede ser mayor que el del coste camino. Esto implica que no hace falta implementar la comprobación de coste del nodo actual con el vecino.
 5. Dado que el coste es constante en las acciones, se ha hecho una aproximacion simplística al cálculo $g(n)$ en este algoritmo. Si bien es cierto que se podria haber creado una matriz matriz de adyaciencias para gestionarlo, se consideró que generarla solo con unos era un gasto incecesario de memoria.

## Definición de la estructura de datos y diagrama de flujo
![Estados iniciales y finales](https://raw.githubusercontent.com/MartinezLaura/RPC_PAC1/main/soporte/Diagrama.jpeg?token=AF4STFUQPREN4V45IDIR2MLASPSY4)

En las gráficas representadas arriba, se muestra el diagrama de classes con sus métodos y la representación del flujo del algoritmo.

Se ha decidido implementar la práctica orientada a objetos para poder definir y abstraer las propiedades de nuestras tres classes (Mapa, A* y Nodo)

Todas las posiciones de los objetos, incluyendo las codificadas en los nodos y en las listas abiertas y cerradas, son de tipo tupla dado que son inmutables y garantizan un correcto funcionamiento y asignación de posiciones.

Se ha decidido codificar las mercancías y sus posiciones iniciales y finales como un diccionario. Las claves son los nombres de las mercancías y los valores, una lista de dos tuplas con las posiciones origen y fin.

Todas las funciones esan comentadas en el codigo adjunto a la práctica.


## Consideraciones y problemas


### Heurística para la selección del orden
Dado que en la práctica no se mencionaba explicitamente como gestionar la recogida de mercancias se ha decidido implementar una simple heurística para la selección. Por cada mercancia, se calculará la suma de la distancia de manhattan del robot a la mercancia y de la mercancia a su destino:

$h = d(robot, initmercancia) + d(initmercancia, finmercancia)$ 

Al hacer la suma de ambas distancias estamos haciendo una estimacion optimista de la distancia real sin sobreestimar el coste de llegada, por lo tanto es **admisible**. Este cálculo se hará al inicio de cada iteración teniendo en cuena solo las mercacías que no han sido aún descargadas.



In [2]:
m = mn.Mapa()
m.pared = m.loc_pared()
m.robot= m.loc_robot()
m.mercas = {'M1': [(0, 0), (3, 3)], 'M2': [(2, 0), (3, 2)], 'M3': [(0, 3), (3, 1)]}
#controlador de mercancias finalizadas
m_hechas = []
#Seleccionamos la primera mercancia
sel = m.selecion_orden(m_hechas)
print(sel)

  Mercancia heuristica Posicion inicial Posicion fin
2        M2          5           (2, 2)       (3, 2)
0        M3          8           (2, 2)       (3, 1)
1        M1         10           (2, 2)       (3, 3)


Como podemos ver la primera mercancía a recoger sera *M2* las subsiguientes seran calculadas con la última posición del robot, una vez descargada la mercancía.

### Gestión de obstáculos
De posibles restricciones u obtraculos tenemos de tres tipos:
1. Control de posiciones fuera del Mapa. Se comprueba que la posición destino este dentro de los márgenes del mapa.
2. Control de obstáculo pared. Dado que las posiciones de la pared se han codificado como propiedad de la clase Mapa, se retorna un booleano que indica si la posicion es pared o no.
3. Control de obstáculo mercancía, pero solo en el caso que estemos cargando otra. Para poder hacerlo se ha creado una propiedad dentro de la clase Aestrella que indica el estado en el que está el robot en cada camino. En la clase mapa se comprueba esta variable y, si el robot está en modo carga, se gestionan las otras mercancias como obstáculos.

Dado que las tres funciones interaccionan con el Mapa son implementadas como metodos de dicha clase, aunque la llamada a estas funciones se hace en *tratar_nodo* de la clase Aestrella.



In [3]:
class Mapa:
    """Clase mapa  donde se almacenan las caracteristicas basicas del mapa
    an/alt: ancho y alto del mapa
    pared: es una lista de tuplas con las posiciones donde se ubica pared
    mapa: descripcion del mapa 
    mercas: un diccionario donde key en la mercancia y value una lista de tuplas con posicion inicial y objectivo
    robot: tupla con la posicion del robot
    """
    def __init__(self, mapa = np.matrix([['M1', '#', 1, 'M3'], [1, '#', 1, 1], ['M2', 1, 'R', 1], [1, 1, 1, 1]])):
        self.an = mapa.shape[1]
        self.alt = mapa.shape[0]
        self.pared = tuple
        self.mapa = mapa
        self.mercas = dict
        self.robot = tuple
#[...]
    
    def es_obstac(self, pos, merc, cargado):
        """Funcion que comprueba dada una posicion si esta en un obstaculo o no
        pos: tupla, posicion a comprobar
        merc: str, la mercancia que estamos buscando/recogiendo
        cargado: Bool si True el robot carga mercancia si False no
        retorna Bool indicando si la posicion es o no obstaculo
        """
        #comprueba pared
        aux1 = any([True if tuple(i) == pos else False for i in self.pared])
        
        if not cargado:
            return (aux1 == True)
        #Si el robot va cargado, comprueva mercancias como obstaculos
        elif cargado:
            mercs = [key for key in self.mercas if merc not in key]
            aux2 = [m for m in mercs if pos == self.mercas[m][0]]
            return (aux1 == True) or (len(aux2)!=0)

    def dentromapa(self, pos):
        """Se comprueva si la posicion esta dentro de los limites del mapa
        pos: tupla, posicion a comprobar
        retorna Bool indicando si esta dentro o fuera de los limites
        """
        return (pos[0] >= 0) and (pos[0] < self.alt) and (pos[1] >= 0) and (pos[1] < self.an)
#[...]

### Carga y descarga de la mercancía
El A* es un algoritmo de búsqueda offline que tiene que tener como parámetros un inicio y un fin. En este caso, al estar aplicandolo a robots cogiendo mercancías, tenemos que ejecutar dos veces el A* por mercancía:
* Una para la búsqueda de la mercancía y carga.
* Otra para el depósito de la mercancía y descarga.
Por lo que para cada mercancia ejecutaremos el A* dos veces. 

Aqui se muestra la implementacion:
![codigo](https://raw.githubusercontent.com/MartinezLaura/RPC_PAC1/main/soporte/carga_descarga.png?token=AF4STFX7W7QMW3V2VQRD4QLASP75G)


### Retroceso del robot
La gestión del retroceso del robot viene dada por la propia implementacón del A*. En el tratamiento de vecinos se hace una comprobación. Si el nodo esta en la lista abierta, y el coste del nuevo es más bajo que el del nodo actual, entonces se recodifica el padre del nuevo nodo con la posición del actual. De esta manera se hace retrozeder al robot en caso que la ruta no lleve al destino.

En este caso, vale la pena mencionar que se sobrecargó el operador *__srt__*, en la clase Nodo, para que devolviera el objeto de forma legible y asi, poder hacer comprobaciones del correcto funcionamiento durante el debugado.
![Nodo](https://github.com/MartinezLaura/RPC_PAC1/blob/main/soporte/Nodo.png)



### Imprimir camino
Dado que puede haber casos en los que el camino requiera de retroceso durante la exploración de nodos, no sería correcto imprimir la lista cerrada como resultado de ruta óptima. 

Se muestra la función implementada para la generación de camino donde se recorre de hijo a padre desde el último nodo para generar e imprimir el camino y el coste total:





## Conclusiones
En este caso se ha intentado seguir el pseudocódigo presentado en clase y añadiendo heuristicas nuevas y funciones para gestionar este problema.
Se ha consultado la Wikipedia para la definición y propiedades del A*.
Asimismo, se ha querido realizar un esfuerzo en la formulación del código y en la encapsulazión del problema en clases.
Un posible trabajo futuro seria generalizar el cálculo del coste con matrices de adyacencias y el generar una interfície gráfica para visualizar el camino y resultado

# Ejecución y resultados
Imagen mundo


In [4]:
%cd RPC_PAC1/
!python3 main.py --printListas 1

/content/RPC_PAC1
*********************************************************
Comienzo A* con mercancia M2. Origen robot: (2, 2), destino(3, 2)
*********************************************************
Mover R fila: 2 columna 2
Mover R fila: 2 columna 1
Mover R fila: 2 columna 0
Cargar en R mercancia: M2 fila: 2 columna 0
Este recorrido ha tenido un coste de: 3
Lista cerrada:
pos: (2, 2), ances: None, g:0, h:0, f0
pos: (2, 1), ances: (2, 2), g:1, h:1, f2
pos: (2, 0), ances: (2, 1), g:2, h:0, f2

Lista abierta:
pos: (2, 3), ances: (2, 2), g:1, h:3, f4
pos: (3, 2), ances: (2, 2), g:1, h:3, f4
pos: (1, 2), ances: (2, 2), g:1, h:3, f4
pos: (3, 1), ances: (2, 1), g:2, h:2, f4
pos: (3, 0), ances: (2, 0), g:3, h:1, f4
pos: (1, 0), ances: (2, 0), g:3, h:1, f4

Mover R fila: 2 columna 0
Mover R fila: 3 columna 0
Mover R fila: 3 columna 1
Mover R fila: 3 columna 2
Descargar mercancia en: M2 fila: 3 columna 2
Este recorrido ha tenido un coste de: 4
Lista cerrada:
pos: (2, 0), ances: None, g:0, h:0,