Pervasive Label Errors in Test Sets Destabilize Machine Learning Benchmarks #2057

icoxfog417 · 2021-05-08T09:47:48Z

一言でいうと

機械学習で用いられるベンチマークのデータセット内にある、誤ったラベルのデータを訂正した研究。画像はImageNetやCIFAR等、自然言語はIMDB等、音声はAudioSet等各タスクで検証している。全体として3.4%程度誤りがあり訂正すると小さいモデルの方が精度が高くなる傾向がある

Curtis G. Northcutt, Anish Athalye, Jonas Mueller

2021/3/26