Vi skal nå opprette Q-tabellen som representerer Q-funksjonen "Left"
, "Right"
, "Up"
og "Down"
med alle tilhørende verdier lik 0.0
når vi starter programmet.
I funksjonen init
i filen laby_ai.py
(ikke i laby_maze.py
), lag en ny variabel app.q_table
som er en 2D-liste av samme størrelse som app.maze
, men i stedet for heltall, skal app.q_table
være en 2D-liste av oppslagsverk: {"Left": 0.0, "Right": 0.0, "Up": 0.0, "Down": 0.0}
.
For eksempel, Q-verdien for paret app.q_table[1][2]["Left"]
For å få tak i Q-verdien for å gå ned når agenten er i posisjon q_table[1][0]["Down"]
.
💡 Hint
- Du kan bruke to nøstede for-løkker for å lage 2D-listen av oppslagsverk.
- Hvis du vil, kan du ta utgangspunkt i koden under og finne ut hva
...
,n_rows
ogn_cols
skal være:
new_q_table = []
for row in range(n_rows):
q_row = []
for col in range(n_cols):
q_row.append(...)
new_q_table.append(q_row)
app.q_table = new_q_table