Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Stage 4-4 #30

Closed
2 tasks done
chottokun opened this issue Jan 18, 2022 · 9 comments
Closed
2 tasks done

Stage 4-4 #30

chottokun opened this issue Jan 18, 2022 · 9 comments

Comments

@chottokun
Copy link

chottokun commented Jan 18, 2022

Stage

4-4

Status

  • Create Notebook
  • Clear

Challenge Notebook Link

https://github.com/Tiryoh/mario-ai-challenge/blob/dev/docker/workspace/mario_ai_challenge_4_4_try003.ipynb

Best Movie

ai_mario_SuperMarioBros-4-4-v0

Best Trained Model

4-4_try003_best_model_4150000.zip

Challenger

@chottokun
@Tiryoh

@chottokun
Copy link
Author

経過

ai_mario.mp4

コメント

無謀だったか・・・。
info['life']での死亡判定ができてない気がする。死亡ペナを発生させるにはどうしらいいのか。

@chottokun
Copy link
Author

経過

ai_mario.mp4

コメント

ここで諦めます!迷路を解くのは厳しすぎます(笑)

@Tiryoh
Copy link
Contributor

Tiryoh commented Feb 5, 2022

せっかくなのでちょっとチャレンジしてみます 👀

@Tiryoh
Copy link
Contributor

Tiryoh commented Feb 6, 2022

try001

ループにはまってしまいました 😿

ai_mario_SuperMarioBros-4-4-v0

image

https://github.com/Tiryoh/mario-ai-challenge/blob/dev/docker/workspace/mario_ai_challenge_4_4_try001.ipynb

@karaage0703
Copy link
Owner

#42 では、巻き戻ったらマイナスの報酬を渡したりしようとしているようです。

一番単純なのは、報酬を以下みたいに設計しちゃうやつですねー。

https://github.com/uvipen/Super-mario-bros-PPO-pytorch/blob/ab4248d715346c6adc33c2157455e2b98c130bcc/src/env.py#L74

@Tiryoh
Copy link
Contributor

Tiryoh commented Feb 6, 2022

情報ありがとうございます。報酬の設計見直してみます。
このまま追加で学習するとどうなるのかが気になるので、もうちょっと追加で学習してみます。

@Tiryoh
Copy link
Contributor

Tiryoh commented Feb 7, 2022

教えていただいた設計読んでみました。4-4と7-4(と8-4)は最後まで残ってたステージなんですね〜

uvipen/Super-mario-bros-PPO-pytorch@871b5a0

@Tiryoh
Copy link
Contributor

Tiryoh commented Feb 7, 2022

try002

途中でWindows Updateに阻まれました…
try001から追加で学習させても全然よくなりませんでした。

ai_mario_SuperMarioBros-4-4-v0

image

https://github.com/Tiryoh/mario-ai-challenge/blob/dev/docker/workspace/mario_ai_challenge_4_4_try002.ipynb

次は

        if self.world == 4 and self.stage == 4:
            if (info["x_pos"] <= 1500 and info["y_pos"] < 127) or (
                    1588 <= info["x_pos"] < 2380 and info["y_pos"] >= 127):
                reward = -50
                done = True

にしてやってみます。

uvipen/Super-mario-bros-PPO-pytorch@871b5a0#diff-e2e5163f3f4707be4ff1c9979672ef0456e4af3a46fad9a34ec4eeee3ece164d

@Tiryoh
Copy link
Contributor

Tiryoh commented Feb 8, 2022

try003

ゴールしました!
4-4に特化しすぎた報酬設計だと思うので他に方法がないか引き続きチャレンジしてみます。

image

ai_mario_SuperMarioBros-4-4-v0

4-4_try003_best_model_4150000.zip

https://github.com/Tiryoh/mario-ai-challenge/blob/dev/docker/workspace/mario_ai_challenge_4_4_try003.ipynb

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants