Skip to content

Fun-ASR-Nano-2512模型进行微调后,直接崩溃了,识别验证集的音频出来乱码了 #2802

@linyilong33

Description

@linyilong33

我是想先用几个音频文件微调一下,用的是官方的train_example.jsonl和val_example.jsonl
我用同一段代码去识别,如果用的是我微调的模型去识别val.jsonl的数据集,出来就是乱码, 如果用官方默认的,就是正常的

`
微调脚本:

python -m funasr.bin.train_ds ^
++device="cuda:0" ^
++model="%model_name_or_model_dir%" ^
++trust_remote_code=true ^
++train_data_set_list="%train_data%" ^
++valid_data_set_list="%val_data%" ^
++dataset_conf.data_split_num=1 ^
++dataset_conf.batch_size=16 ^
++dataset_conf.sort_size=1024 ^
++dataset_conf.num_workers=0 ^
++train_conf.max_epoch=2 ^
++train_conf.use_lora=true ^
++train_conf.log_interval=1 ^
++train_conf.resume=false ^
++train_conf.validate_interval=2000 ^
++train_conf.save_checkpoint_interval=2000 ^
++train_conf.keep_nbest_models=20 ^
++train_conf.avg_nbest_model=10 ^
++train_conf.use_deepspeed=false ^
++optim_conf.lr=0.0000002 ^
++audio_encoder_conf.freeze=true ^
++audio_adaptor_conf.freeze=false ^
++llm_conf.freeze=true ^
++output_dir="%output_dir%"
`

识别结果:
('./funasr-test\BAC009S0764W0123.wav', '.Toolkit_claim.Toolkit_claim dol convenient Pey Pey Pey Pey Pey Pey Pey Pey Pey Pey Pey镠 Pey镠かもしれ Kiaaecかもしれ�かもしれ�かもしれかもしれかもしれ就是在 Smsかもしれ filtering_claimかもしれ� Smsaecかもしれかもしれかもしれかもしれ.pb.pb.pb.pb.pb植物�かもしれ�かもしれ�nierniernierniernierniernier Territorynier Territorynier Territoryฝ้าฝ้า/Framework Touchniernierniernier Territory Touch_socket_socketnierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernieritorednieritorednierniernierniernierniernierniernierniernierniernieritorednieritorednieritorednieritorednieritorednieritorednierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernier Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Políticanierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernier')

  • OS (Windows):
  • FunASR Version (1.3.1):
  • ModelScope Version (e.g., 1.11.0):
  • PyTorch Version (2.10.0+cu126):
  • How you installed funasr (source):
  • Python version: 3.11
  • GPU (GTX4090)
  • CUDA/cuDNN version (12.8):

Metadata

Metadata

Assignees

No one assigned

    Labels

    questionFurther information is requested

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions