At Last

使用强化学习玩只狼。
花了两天学习了下PaddlePaddle的强化学习课程，按照PARL框架（Model,Algorithm,Agent,Environment）对强化学习代码进行重构，尽量将代码解耦。

DL框架选择tensorflow
（因为对PARL还不熟）目前代码应该是可以跑通的。因为只是为了测试有无bug，

目前backbone实现的非常简单。强化学习算法采用的是DQN，按键通过pywin32模拟按键实现。

关于reward的计分规则，参考了Up主蓝魔的实现，以下是他的项目链接：https://github.com/analoganddigital/DQN_play_sekiro/blob/main/README.md

欢迎感兴趣的小伙伴，可以选择自己擅长的模块进行创作吧！

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.idea		.idea
framework		framework
logs/DQN_Algorithm_Sekiro_0.99_0.0005		logs/DQN_Algorithm_Sekiro_0.99_0.0005
net		net
ops		ops
strategy		strategy
thirdparty		thirdparty
unit_test		unit_test
utils		utils
win32_utils		win32_utils
.gitignore		.gitignore
DQN_sekiro_testing_gpu.py		DQN_sekiro_testing_gpu.py
DQN_sekiro_training_gpu.py		DQN_sekiro_training_gpu.py
DQN_tensorflow_gpu.py		DQN_tensorflow_gpu.py
README.md		README.md
_config.py		_config.py
find_blood_location.py		find_blood_location.py
offline_train.py		offline_train.py
restart.py		restart.py
sample_data.py		sample_data.py
settings.py		settings.py
test_key.py		test_key.py
train.py		train.py

Provide feedback