Metrics

d3rlpy.metrics

d3rlpy provides scoring functions without compromising scikit-learn compatibility. You can evaluate many metrics with test episodes during training.

from d3rlpy.datasets import get_cartpole
from d3rlpy.algos import DQN
from d3rlpy.metrics.scorer import td_error_scorer
from d3rlpy.metrics.scorer import average_value_estimation_scorer
from d3rlpy.metrics.scorer import evaluate_on_environment
from sklearn.model_selection import train_test_split

dataset, env = get_cartpole()

train_episodes, test_episodes = train_test_split(dataset)

dqn = DQN()

dqn.fit(train_episodes,
        eval_episodes=test_episodes,
        scorers={
            'td_error': td_error_scorer,
            'value_scale': average_value_estimation_scorer,
            'environment': evaluate_on_environment(env)
        })

You can also use them with scikit-learn utilities.

from sklearn.model_selection import cross_validate

scores = cross_validate(dqn,
                        dataset,
                        scoring={
                            'td_error': td_error_scorer,
                            'environment': evaluate_on_environment(env)
                        })

Algorithms

d3rlpy.metrics.scorer.td_error_scorer d3rlpy.metrics.scorer.discounted_sum_of_advantage_scorer d3rlpy.metrics.scorer.average_value_estimation_scorer d3rlpy.metrics.scorer.value_estimation_std_scorer d3rlpy.metrics.scorer.continuous_action_diff_scorer d3rlpy.metrics.scorer.discrete_action_match_scorer d3rlpy.metrics.scorer.evaluate_on_environment d3rlpy.metrics.comparer.compare_continuous_action_diff d3rlpy.metrics.comparer.compare_discrete_action_match

Dynamics

d3rlpy.metrics.scorer.dynamics_observation_prediction_error_scorer d3rlpy.metrics.scorer.dynamics_reward_prediction_error_scorer d3rlpy.metrics.scorer.dynamics_prediction_variance_scorer

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

metrics.rst

metrics.rst

Metrics

Algorithms

Dynamics

Files

metrics.rst

Latest commit

History

metrics.rst

File metadata and controls

Metrics

Algorithms

Dynamics