请问运行preprocess.py报这个错，该怎么解决啊？ #15

liuyue94 · 2018-10-28T11:52:23Z

Traceback (most recent call last):
File "C:/Users/user/PycharmProjects/textgeneration/Preprocess.py", line 77, in
vocab, _ = Read_WordVec(config)
File "C:/Users/user/PycharmProjects/textgeneration/Preprocess.py", line 36, in Read_WordVec
assert len(wordLS) == config.vocab_size
AssertionError

TobiasLee · 2018-11-02T03:15:07Z

这里的 word2vec 文件存储的格式是第一行注明 vocab_siz embedding_size 的，读取的时候跳过了这一行。猜测是因为少了一行导致，可以把读取第一行的注释掉：

def Read_WordVec(config):
    with open(config.vec_file, 'r') as fvec:
        wordLS = []
        vec_ls =[]
        # fvec.readline() # 这一行是读取文件头信息的，如果没有信息可以注释掉，避免 size 不匹配

19970623 · 2021-06-25T12:20:42Z

您好，请问这个问题解决了吗，我注释了fvec.readline()，但依然报错assert len(wordLS) == config.vocab_size
AssertionError

hit-computer · 2021-07-08T09:48:07Z

@19970623 这里把 vocab_size 设置成词表大小就行了（即和 vec_file 里word数量相同）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问运行preprocess.py报这个错，该怎么解决啊？ #15

请问运行preprocess.py报这个错，该怎么解决啊？ #15

liuyue94 commented Oct 28, 2018

TobiasLee commented Nov 2, 2018

19970623 commented Jun 25, 2021

hit-computer commented Jul 8, 2021

请问运行preprocess.py报这个错，该怎么解决啊？ #15

请问运行preprocess.py报这个错，该怎么解决啊？ #15

Comments

liuyue94 commented Oct 28, 2018

TobiasLee commented Nov 2, 2018

19970623 commented Jun 25, 2021

hit-computer commented Jul 8, 2021