Skip to content

Latest commit

 

History

History
7 lines (6 loc) · 589 Bytes

experience_replay.md

File metadata and controls

7 lines (6 loc) · 589 Bytes
layout word translation
word
Experience Replay
تکرار تجربه

یک تکنیک مربوط به ‌DQN در یادگیری تقویتی که با هدف کاهش هم‌بستگی زمانی در مجموعه‌داده‌های آموزش استفاده می‌شود. عامل انتقال بین حالت‌ها را در یک بافر تکرار ذخیره می‌کند، و سپس با نمونه‌گیری از انتقال‌های درون بافر تکرار داده‌های آموزش را ایجاد می‌کند.