backgammon_project

Backgammon

http://wiki.cs.hse.ru/%D0%A3%D1%87%D0%B8%D0%BC%D1%81%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0%D1%82%D1%8C_%D0%B2_%D0%BD%D0%B0%D1%80%D0%B4%D1%8B_%28%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29

Здесь будет появляться код по проекту. Что нужно сделать ко 2 контрольной точке:

Реализовать стратегию, которая бьёт рандом в 90% случаев

Сравнить стратегию, обученную при помощи линейной регресии и градиентного спуска

К 3 контрольной точке:

+1 Реализовать визуализацию (частично готово)

+1 Сбор датасета и прогон на нейронных сетях (готово)

+1 Реализация стратегии time-difference learning и нейронных сетей (готово).

+1 реализовать и сравнить несколько вариантов количество скрытых слоёв в нейросети (готово).

+1 Релизовать стратегию с нейронными сетями, которая бьёт уже существующую с линейной регрессией (винрейт <50%) (готово)

#Что готово:

+Линейная модель с 78% винрейта

+Градиентный спуск, который бьёт рандом в 79% случаев.

Вывод: сравнивая эти стратегии, получили, что метод градиентного спуска опережает линейную регрессию. При этом на сбор датасета для обучения линейной регресии ушло около 12 часов, тогда как для градиентного спуска хватило и 10 минут.

+Стратегия с нейронной сетью "из коробки" (использовалась библиотека PyBrain) и теми же факторами. При этом винрейт в сравнении с рандомом оказался равен 81%.

Таким образом, можно утверждать, что нейронная сеть опережает линейную модель.

+Градиентный спуск+нейронные сети.

+Полученная стратегия побеждает линейную регрессию в 52% случаев, что опять доказывает утверждение выше.

+Была также запущена нейронная сеть из sklearn (MLPRegressor) с 1 и 2 слоями. Винрейт против рандома 86%.

+Реализована простейшая визуализация.

+Сравнивая нейронку с 2 слоями с градиентным спуском, убеждаемся, что количество слоёв решает.

#По итогам проекта

Я ознакомился (в теории и на практике) с основами машинного обучения и нейронных сетей

Получен бесценный опыт работы над нетривиальным и довольно громоздким проектом

Получен некоторый минимальный опыт работы с библиотеками PyBrain, sklearn, numpy, scipy, openNN

Значительно улучшены навыки программирования

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
README.md		README.md
Referee.h		Referee.h
Source.cpp		Source.cpp
Strategy.h		Strategy.h
first_v.txt		first_v.txt
first_vec.dat		first_vec.dat
lin_coefs.dat		lin_coefs.dat
matrix_coefs.dat		matrix_coefs.dat
out.txt		out.txt
outtt.txt		outtt.txt
second_v.txt		second_v.txt
second_vec.dat		second_vec.dat
syn1.dat		syn1.dat
syn2.dat		syn2.dat
syn3.dat		syn3.dat

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Referee.h

Referee.h

Source.cpp

Source.cpp

Strategy.h

Strategy.h

first_v.txt

first_v.txt

first_vec.dat

first_vec.dat

lin_coefs.dat

lin_coefs.dat

matrix_coefs.dat

matrix_coefs.dat

out.txt

out.txt

outtt.txt

outtt.txt

second_v.txt

second_v.txt

second_vec.dat

second_vec.dat

syn1.dat

syn1.dat

syn2.dat

syn2.dat

syn3.dat

syn3.dat

Repository files navigation

backgammon_project

About

Releases

Packages

Languages

new-okaerinasai/backgammon_project

Folders and files

Latest commit

History

Repository files navigation

backgammon_project

About

Resources

Stars

Watchers

Forks

Languages