Responsive image

荀彧 - 2024-03-16 09:29 [GF]
目前版本4.1,家用1660s速度太慢,用云端训练的。想问一下loss值真的不重要吗?目前自己从抠的数据集,大概70多分钟,裁剪5-15s,训练的时候loss总在30和40之间,训练三四万步,最好的也才29左右- -,config设置的学习率0.0001,bs 12。试推理的时候带上了浅扩散和聚类模型,出来的音频感觉还是有点怪怪的,是原始数据集不够好吗?数据集没有歌声文件,基本都是说话的干声,AU去除了大部分呼吸声以及匹配了响度QAQ,有大佬解答一下吗


Mni - 2024-03-16 09:51 [B1F]
数据集的质量是最重要的 loss数值当然也重要 根据loss值能看出ai学得怎么样了 可以找一下相关训练的视频 看一下他们的loss值在多少


荀彧 - 2024-03-17 04:43 [B2F]
看了一下,loss值有影响但还是得综合看fm,mel和kr值,目前的15w的step的部分效果没有11w左右的好,同一首干声会有哑音,据说还得看数据集,我的才360m






桌面版


Powered by SP Project v1.0 © 2010-2019
Time 0.001595 second(s),query:3 Gzip enabled


Top