https://huggingface.co/datasets/liwu/MNBVC CLUE AFQMC 语义相似度 数据集 CLUE TNEWS 文本分类数据集 MovieLens 20M Dataset MovieLens 25M Dataset criteo dataset(CTR数据集)part1,criteo dataset(CTR数据集)part2,criteo dataset(CTR数据集)part3 avazu dataset(CTR数据集) 英文BERT论文预训练数据 part1,英文BERT论文预训练数据 part2 14G的中文预训练数据 part1,14G的中文预训练数据 part2,14G的中文预训练数据 part3 维基百科中文预训练数据 金庸TXT格式数据集 古龙TXT格式数据集 Penn Tree Bank(PTB)数据集 quora question pairs 数据集 wikitext 103 数据集 知乎文本分类数据集 part1,知乎文本分类数据集 part2 机器翻译WMT14数据集 WikiMovies dataset NLPIR新闻预训练数据