Alpha_Omokjomok - 인공지능 오목 대국프로그램

* 2019년 한서대학교 항공 소프트웨어 공학과 2019-A5 프로젝트

* 팀원 : 201301256 김상우 201301264 김준연 201401443 이승혁 201301307 한대호

* Alpha_Omokjomok은 강화학습 및 Rule 기반 인공지능 오목 대국프로그램입니다.

* Google Deepmind 사의 Alpha-zero를 기반으로 하여 Policy-value Network 및 MCTS 알고리즘 적용

Requirements 및 개발환경

개발언어 : Python==3.6.10
딥러닝/머신러닝 프레임워크 : torch,torchvision -> https://pytorch.org/ , tensorflow==2.1.0 , numpy
게임환경 구현용 UI 라이브러리 : Pygame
통합개발환경 ide : Pycharm
OS : Ubuntu 18.04
H/W GPU : Geforce GTX 1660 ti

Alpha_Omokjomok State & Pygame UI

기존 15x15의 2차원 배열로 AI를 구현해보고자 하였으나, 프로젝트 진행 중 개발환경과 H/W의 성능부족으로 8X8의 State로 환경 구축

Omok 규칙

기존의 오목 대회나 정규 시합에서 적용되는 금수(금지된 수)에 대해 적용하기에는
State가 충분히 작고 Agent의 학습 부담을 덜기위해 착수된 돌이 5개가 연이어서
직선 혹은 대각선으로 연결시 해당 돌의 승리로 구현

Rule-based AI Agent 구축

코드 기반으로 작용하는 Rule-based AI agent 15x15 state 구현화면입니다.
돌이 3개 혹은 4개 이상일 경우 특정 Array 좌표에 돌을 둘수 있도록
유리한 환경에 따라 차등적으로 조건을 선택하도록 구현

Reinforcement Learning AI Agent vs Rule-based AI Agent

강화학습 기반 Agent와 Rule-based Agent간의 대국
각 대국별 현재 State와 RL Agent의 Policy-value network를 통해 현재 State에 대한 가중치 확인

RL AI agent 성능평가

RL(Reinforcement Learning) AI Agent는 MCTS 알고리즘을 기반으로
자가대국(Agent vs Agent)을 통해 Policy-value network를 형성,
자가대국 횟수별 Model를 차등적으로 저장 후, 벤치마킹 대상인 Rule 기반 Agent와의 대국을 통해 성능평가

2019-A05 알파 오목조목 종합프로젝트 팀원 역할

AlphaGo Omok Version By Kim Joon Yeon, Kim Sang Woo, Lee Seung Hyeok, Han Dae Ho

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
Alpha-omokjmok		Alpha-omokjmok
Omok State		Omok State
발표자료		발표자료
보고서 자료		보고서 자료
종합프로젝트 최종발표자료		종합프로젝트 최종발표자료
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Alpha_Omokjomok - 인공지능 오목 대국프로그램

* 2019년 한서대학교 항공 소프트웨어 공학과 2019-A5 프로젝트

* 팀원 : 201301256 김상우 201301264 김준연 201401443 이승혁 201301307 한대호

* Alpha_Omokjomok은 강화학습 및 Rule 기반 인공지능 오목 대국프로그램입니다.

* Google Deepmind 사의 Alpha-zero를 기반으로 하여 Policy-value Network 및 MCTS 알고리즘 적용

Requirements 및 개발환경

Alpha_Omokjomok State & Pygame UI

Omok 규칙

Rule-based AI Agent 구축

Reinforcement Learning AI Agent vs Rule-based AI Agent

RL AI agent 성능평가

2019-A05 알파 오목조목 종합프로젝트 팀원 역할

About

Releases

Packages

Languages

pentagram5/Alpha_omokjomok

Folders and files

Latest commit

History

Repository files navigation

Alpha_Omokjomok - 인공지능 오목 대국프로그램

* 2019년 한서대학교 항공 소프트웨어 공학과 2019-A5 프로젝트

* 팀원 : 201301256 김상우 201301264 김준연 201401443 이승혁 201301307 한대호

* Alpha_Omokjomok은 강화학습 및 Rule 기반 인공지능 오목 대국프로그램입니다.

* Google Deepmind 사의 Alpha-zero를 기반으로 하여 Policy-value Network 및 MCTS 알고리즘 적용

Requirements 및 개발환경

Alpha_Omokjomok State & Pygame UI

Omok 규칙

Rule-based AI Agent 구축

Reinforcement Learning AI Agent vs Rule-based AI Agent

RL AI agent 성능평가

2019-A05 알파 오목조목 종합프로젝트 팀원 역할

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages