您好,我是接触机器学习的新手,请问我应该如何设置我的数据集,按照您给的模板我设置为类似如下格式
其中test.txt,train.txt,dev.txt设置为:
安徽 0
温哥华 1
……
……
而class.txt设置为:
中国
加拿大
……
……
但是运行中出现错误
File "D:\Chinese_Text_Classification_Pytorch-main\run.py", line 25, in
train_data, dev_data, test_data = build_dataset(config)
^^^^^^^^^^^^^^^^^^^^^
File "D:\Chinese_Text_Classification_Pytorch-main\utils.py", line 40, in build_dataset
train = load_dataset(config.train_path, config.pad_size)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\Chinese_Text_Classification_Pytorch-main\utils.py", line 22, in load_dataset
content, s1, s2, s3, label = lin.split('\t')
^^^^^^^^^^^^^^^^^^^^^^^^^^
ValueError: not enough values to unpack (expected 5, got 1)
我应该如何处理
您好,我是接触机器学习的新手,请问我应该如何设置我的数据集,按照您给的模板我设置为类似如下格式
其中test.txt,train.txt,dev.txt设置为:
安徽 0
温哥华 1
……
……
而class.txt设置为:
中国
加拿大
……
……
但是运行中出现错误
File "D:\Chinese_Text_Classification_Pytorch-main\run.py", line 25, in
train_data, dev_data, test_data = build_dataset(config)
^^^^^^^^^^^^^^^^^^^^^
File "D:\Chinese_Text_Classification_Pytorch-main\utils.py", line 40, in build_dataset
train = load_dataset(config.train_path, config.pad_size)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\Chinese_Text_Classification_Pytorch-main\utils.py", line 22, in load_dataset
content, s1, s2, s3, label = lin.split('\t')
^^^^^^^^^^^^^^^^^^^^^^^^^^
ValueError: not enough values to unpack (expected 5, got 1)
我应该如何处理