Skip to content

四项数据集的格式如何设置 #5

@vincand

Description

@vincand

您好,我是接触机器学习的新手,请问我应该如何设置我的数据集,按照您给的模板我设置为类似如下格式
其中test.txt,train.txt,dev.txt设置为:
安徽 0
温哥华 1
……
……

而class.txt设置为:
中国
加拿大
……
……

但是运行中出现错误
File "D:\Chinese_Text_Classification_Pytorch-main\run.py", line 25, in
train_data, dev_data, test_data = build_dataset(config)
^^^^^^^^^^^^^^^^^^^^^
File "D:\Chinese_Text_Classification_Pytorch-main\utils.py", line 40, in build_dataset
train = load_dataset(config.train_path, config.pad_size)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\Chinese_Text_Classification_Pytorch-main\utils.py", line 22, in load_dataset
content, s1, s2, s3, label = lin.split('\t')
^^^^^^^^^^^^^^^^^^^^^^^^^^
ValueError: not enough values to unpack (expected 5, got 1)

我应该如何处理

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions