Vi skal nå implementere belønningsfunksjonen
I filen laby_ai.py
, lag en ny funksjon reward_function(app, direction)
. Importer funksjonen get_neighbour
fra laby_maze.py
og bruk denne til å finne posisjonen til ruten i retning direction
fra app.agent_pos
.
Funksjonen reward_function
skal da returnere et flyttall som følger:
- Agenten går ut av labyrinten: Hvis ruten fra
get_neighbour
er utenfor labyrinten så returner-1.0
. - Agenten går inn i veggen: Hvis ruten fra
get_neighbour
er en veggrute (har verdi1
iapp.maze
) så returner-1.0
. - Agenten går i mål: Hvis ruten fra
get_neighbour
er mål (har verdi2
iapp.maze
), returner1.0
. - Agenten går til en åpen rute: Hvis ruten er en åpen rute (har verdi
0
iapp.maze
), returner-0.1
.