Skip to content

Commit

Permalink
更新MS_OUTPUT_SIZE
Browse files Browse the repository at this point in the history
  • Loading branch information
nl8590687 committed Oct 22, 2020
1 parent 053c990 commit 024dbcc
Show file tree
Hide file tree
Showing 11 changed files with 21 additions and 21 deletions.
4 changes: 2 additions & 2 deletions SpeechModel24.py
Expand Up @@ -28,9 +28,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel25.py
Expand Up @@ -28,9 +28,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel251.py
Expand Up @@ -33,9 +33,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
6 changes: 3 additions & 3 deletions SpeechModel251_limitless.py
Expand Up @@ -32,9 +32,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down Expand Up @@ -429,7 +429,7 @@ def model(self):


#ms.LoadModel(modelpath + 'm251/speech_model251_e_0_step_100000.model')
#ms.TrainModel(datapath, epoch = 50, batch_size = 16, save_step = 500)
ms.TrainModel(datapath, epoch = 50, batch_size = 16, save_step = 500)

#t1=time.time()
#ms.TestModel(datapath, str_dataset='train', data_count = 128, out_report = True)
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel251_p.py
Expand Up @@ -32,9 +32,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel252.py
Expand Up @@ -31,9 +31,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel26.py
Expand Up @@ -29,9 +29,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1424,即1423个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel261.py
Expand Up @@ -33,9 +33,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1422,即1421个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
4 changes: 2 additions & 2 deletions SpeechModel261_p.py
Expand Up @@ -33,9 +33,9 @@ class ModelSpeech(): # 语音模型类
def __init__(self, datapath):
'''
初始化
默认输出的拼音的表示大小是1422,即1421个拼音+1个空白块
默认输出的拼音的表示大小是1428,即1427个拼音+1个空白块
'''
MS_OUTPUT_SIZE = 1424
MS_OUTPUT_SIZE = 1428
self.MS_OUTPUT_SIZE = MS_OUTPUT_SIZE # 神经网络最终输出的每一个字符向量维度的大小
#self.BATCH_SIZE = BATCH_SIZE # 一次训练的batch
self.label_max_string_length = 64
Expand Down
2 changes: 1 addition & 1 deletion test_mspeech.py
Expand Up @@ -34,7 +34,7 @@

system_type = plat.system() # 由于不同的系统的文件路径表示不一样,需要进行判断
if(system_type == 'Windows'):
datapath = 'E:\\语音数据集'
datapath = 'D:\\SpeechData'
modelpath = modelpath + '\\'
elif(system_type == 'Linux'):
datapath = 'dataset'
Expand Down
2 changes: 1 addition & 1 deletion train_mspeech.py
Expand Up @@ -33,7 +33,7 @@

system_type = plat.system() # 由于不同的系统的文件路径表示不一样,需要进行判断
if(system_type == 'Windows'):
datapath = 'E:\\语音数据集'
datapath = 'D:\\SpeechData'
modelpath = modelpath + '\\'
elif(system_type == 'Linux'):
datapath = 'dataset'
Expand Down

0 comments on commit 024dbcc

Please sign in to comment.