🔬🔁 Evaluation loop #768

mberr · 2022-02-02T16:43:26Z

This PR adds an evaluation loop based upon torch's data loaders, and delegates the automatic batch size optimization to torch-max-mem. It also brings support for relation prediction evaluation.

trigger ci

src/pykeen/evaluation/evaluation_loop.py

trigger ci

This reverts commit 9444e38.

mberr · 2022-05-25T14:20:22Z

target-specific evaluation datasets have been moved to a new branch, cf. evaluation-loop-2, as they require additional changes to the evaluation to enable separate, independently optimized batch sizes for different targets.

trigger ci

src/pykeen/training/callbacks.py

trigger ci

cthoyt · 2022-05-25T15:39:34Z

@mberr lgtm but would be nice to get a second reviewer

migalkin · 2022-05-25T17:23:52Z

Tried the branch on the ILPC codebase - it works, can reproduce the numbers 👍
My only small wish (which is more about result tracking and hot this PR) is that the default console result tracker dumps all 100+ metrics in the console after each eval step and it's kinda too much, I'd like to have a way to set up seeing maybe only 1-3 representative metrics like realistic hits@10 and inverse harmonic mean rank

mberr · 2022-05-25T17:36:25Z

Tried the branch on the ILPC codebase - it works, can reproduce the numbers 👍 My only small wish (which is more about result tracking and hot this PR) is that the default console result tracker dumps all 100+ metrics in the console after each eval step and it's kinda too much, I'd like to have a way to set up seeing maybe only 1-3 representative metrics like realistic hits@10 and inverse harmonic mean rank

Did you know about the metric_filter parameter of the ConsoleTracker? 😇 e.g.

from pykeen.pipeline import pipeline

result = pipeline(
    dataset="nations",
    model="mure",
    result_tracker="console",
    result_tracker_kwargs=dict(metric_filter=r"both.realistic.(hits_at_10|inverse_harmonic_mean_rank)"),
)

will only print realistic H@10 and MRR averaged over head & tail.

mberr and others added 7 commits January 8, 2022 17:59

add first draft of structure

53ed466

draft 1

bdac642

Merge remote-tracking branch 'origin/master' into evaluation-loop

3ec50e6

mwe

61ef3a8

working MWE

e8c94b0

remove obsolete part

5fda9b7

Merge branch 'master' into evaluation-loop

6c62347

cthoyt added this to the PyKEEN v1.9.0 milestone Feb 13, 2022

mberr added 22 commits February 18, 2022 18:54

Merge branch 'master' into evaluation-loop

5342b81

Merge remote-tracking branch 'origin/master' into evaluation-loop

ade41b4

update link pred dataset

094ebb0

trigger ci

update

907af25

optimize memory utilization and resolve evaluator

a938418

trigger ci

Merge branch 'master' into evaluation-loop

839e49a

Merge branch 'master' into evaluation-loop

6fd0a8c

Merge branch 'master' into evaluation-loop

81233c5

Merge remote-tracking branch 'origin/master' into evaluation-loop

9274c9a

lint

e2401dd

fix import

6485aec

add callback

80e7ee5

fix _evaluate utility

be3d24d

Merge remote-tracking branch 'origin/master' into evaluation-loop

20ebc66

Merge branch 'master' into evaluation-loop

f3e1b47

rename and extend docstring

16cd1d6

extend init docstring

7fd614a

add some comments

329fe2b

add some comments

c36cf0a

extend doc

217d227

extend doc for evaluation loop

71c40c9

extend doc for _evaluate

db7faa1

mberr added 10 commits May 25, 2022 11:01

extract utility

407f474

add support for additional filter triples

57602ef

fix missing default value

4ae1cec

trigger ci

add todo comment

a820167

trigger ci

trigger ci

f18e732

trigger ci

144f40b

fix mypy & missing default values

03a3d55

trigger ci

lazy extraction + warning

575fee1

trigger ci

add comment

3aa03c3

trigger ci

export evaluation loop

48ae2eb

trigger ci

cthoyt reviewed May 25, 2022

View reviewed changes

src/pykeen/evaluation/evaluation_loop.py Outdated Show resolved Hide resolved

mberr added 4 commits May 25, 2022 12:13

break cyclic import; use DefaultDict type

13eb3f7

trigger ci

fix missing default inductive mode for predict_r

5e1c5b9

add a target-specific dataset

9444e38

Revert "add a target-specific dataset"

3c40bb2

This reverts commit 9444e38.

trigger ci

a8dd4a1

mberr changed the title ~~WIP: Evaluation loop~~ 🔬🔁 Evaluation loop May 25, 2022

mberr marked this pull request as ready for review May 25, 2022 14:22

add test for relation prediction evaluation

b5e0a7e

trigger ci

cthoyt reviewed May 25, 2022

View reviewed changes

src/pykeen/training/callbacks.py Show resolved Hide resolved

export EvaluationLoopTrainingCallback in __all__

af914ea

trigger ci

mberr requested a review from migalkin May 25, 2022 16:00

migalkin approved these changes May 25, 2022

View reviewed changes

mberr merged commit 605ebec into master May 25, 2022

mberr deleted the evaluation-loop branch May 25, 2022 17:37

mberr mentioned this pull request Apr 23, 2023

🧪🔢 Reproducing results of LiteralE #1226

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

🔬🔁 Evaluation loop #768

🔬🔁 Evaluation loop #768

mberr commented Feb 2, 2022 •

edited

mberr commented May 25, 2022

cthoyt commented May 25, 2022

migalkin commented May 25, 2022 •

edited

mberr commented May 25, 2022

🔬🔁 Evaluation loop #768

🔬🔁 Evaluation loop #768

Conversation

mberr commented Feb 2, 2022 • edited

mberr commented May 25, 2022

cthoyt commented May 25, 2022

migalkin commented May 25, 2022 • edited

mberr commented May 25, 2022

mberr commented Feb 2, 2022 •

edited

migalkin commented May 25, 2022 •

edited