Tic-Tac-Toe-Reinforcement-learning

Agent learns to play Tic-Tac-Toe using Reinforcement-learning (Q-learning). The agent was trained by playing against itself. Human can also play against trained Agent.

Requirements:
python 3.5.2 and pygame

Run Play.py to play game.

py -3 Play.py

Run Train.py to train the agent.

py -3 Train.py

Training:
It took 200,000 iterations to master the game.

game = TicTacToe(True) #game instance, True means training
player1= Qlearning() #player1 learning agent 
player2 =Qlearning() #player2 learning agent 
game.startTraining(player1,player2) #start training
game.train(200000) #train for 200,000 iterations
game.saveStates()  #save Qtable

Playing

Human player vs AI agent

game = TicTacToe() #game instance
player1=Humanplayer() #human player
player2=Qlearning()  #agent
game.startGame(player1,player2)#player1 is X, player2 is 0
game.reset() #reset
game.render() # render display

Random player instead of AI agent

#change player1 or player2 to Randomplayer()
player2 =Randomplayer()

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
__pycache__		__pycache__
Game.jpg		Game.jpg
Game.py		Game.py
Play.py		Play.py
QLearning.py		QLearning.py
README.md		README.md
Readme.txt		Readme.txt
Train.py		Train.py
player1states		player1states
player2states		player2states

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pycache

pycache

Game.jpg

Game.jpg

Game.py

Game.py

Play.py

Play.py

QLearning.py

QLearning.py

README.md

README.md

Readme.txt

Readme.txt

Train.py

Train.py

player1states

player1states

player2states

player2states

Repository files navigation

Tic-Tac-Toe-Reinforcement-learning

About

Releases

Packages

Languages

Smeilz/Tic-Tac-Toe-Reinforcement-learning

Folders and files

Latest commit

History

Repository files navigation

Tic-Tac-Toe-Reinforcement-learning

About

Resources

Stars

Watchers

Forks

Languages