-
Notifications
You must be signed in to change notification settings - Fork 1.6k
Description
我是想先用几个音频文件微调一下,用的是官方的train_example.jsonl和val_example.jsonl
我用同一段代码去识别,如果用的是我微调的模型去识别val.jsonl的数据集,出来就是乱码, 如果用官方默认的,就是正常的
`
微调脚本:
python -m funasr.bin.train_ds ^
++device="cuda:0" ^
++model="%model_name_or_model_dir%" ^
++trust_remote_code=true ^
++train_data_set_list="%train_data%" ^
++valid_data_set_list="%val_data%" ^
++dataset_conf.data_split_num=1 ^
++dataset_conf.batch_size=16 ^
++dataset_conf.sort_size=1024 ^
++dataset_conf.num_workers=0 ^
++train_conf.max_epoch=2 ^
++train_conf.use_lora=true ^
++train_conf.log_interval=1 ^
++train_conf.resume=false ^
++train_conf.validate_interval=2000 ^
++train_conf.save_checkpoint_interval=2000 ^
++train_conf.keep_nbest_models=20 ^
++train_conf.avg_nbest_model=10 ^
++train_conf.use_deepspeed=false ^
++optim_conf.lr=0.0000002 ^
++audio_encoder_conf.freeze=true ^
++audio_adaptor_conf.freeze=false ^
++llm_conf.freeze=true ^
++output_dir="%output_dir%"
`
识别结果:
('./funasr-test\BAC009S0764W0123.wav', '.Toolkit_claim.Toolkit_claim dol convenient Pey Pey Pey Pey Pey Pey Pey Pey Pey Pey Pey镠 Pey镠かもしれ Kiaaecかもしれ�かもしれ�かもしれかもしれかもしれ就是在 Smsかもしれ filtering_claimかもしれ� Smsaecかもしれかもしれかもしれかもしれ.pb.pb.pb.pb.pb植物�かもしれ�かもしれ�nierniernierniernierniernier Territorynier Territorynier Territoryฝ้าฝ้า/Framework Touchniernierniernier Territory Touch_socket_socketnierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าฝ้าniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernieritorednieritorednierniernierniernierniernierniernierniernierniernieritorednieritorednieritorednieritorednieritorednieritorednierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernier Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Política Políticanierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernierniernier')
- OS (Windows):
- FunASR Version (1.3.1):
- ModelScope Version (e.g., 1.11.0):
- PyTorch Version (2.10.0+cu126):
- How you installed funasr (source):
- Python version: 3.11
- GPU (GTX4090)
- CUDA/cuDNN version (12.8):