Will the Pre-trained ELECTRA-1.75M be released? #17

xf05888 · 2020-03-15T04:56:48Z

In the paper, it also described a model called ELECTRA-1.75M and has a better performance than ELECTRA-1.45M ( ELECTRA-large ).
So will the pre-trained ELECTRA-1.75M be released?

vprelovac · 2020-03-15T05:28:13Z

It looks like a typo, 1.45M is never mentioned in the paper.

xf05888 · 2020-03-15T06:12:35Z

@vprelovac According to README.md,

The models were trained on uncased English text. They correspond to ELECTRA-Small++, ELECTRA-Base++, ELECTRA-1.45M in our paper.

And in the paper it mentioned ELECTRA-Large which is same as ELECTRA-1.45M

Also,
We therefore also report resultsfor ELECTRA-1.75M with the only trick being dev-set model

clarkkev · 2020-04-08T05:16:50Z

Yes, that is a typo!

clarkkev closed this as completed Apr 8, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Will the Pre-trained ELECTRA-1.75M be released? #17

Will the Pre-trained ELECTRA-1.75M be released? #17

xf05888 commented Mar 15, 2020

vprelovac commented Mar 15, 2020

xf05888 commented Mar 15, 2020

clarkkev commented Apr 8, 2020

Will the Pre-trained ELECTRA-1.75M be released? #17

Will the Pre-trained ELECTRA-1.75M be released? #17

Comments

xf05888 commented Mar 15, 2020

vprelovac commented Mar 15, 2020

xf05888 commented Mar 15, 2020

clarkkev commented Apr 8, 2020