當(dāng)下軟件園 / 匯聚當(dāng)下最新最酷的軟件下載站!
當(dāng)下軟件園

您的位置: 首頁 > 多媒體類 > 音頻處理 > MoeTTS V1.1.1 最新版

  MoeTTS是一款Tacotron2/HifiGAN模型+編譯好的GUI版本發(fā)布倉庫,訓(xùn)練時長3天,約900 Epoch,13人大型模型還在訓(xùn)練中,之后也會發(fā)布至MoeTTS項目頁,視頻后面的模型400 Epoch訓(xùn)練了5天,語音合成大部分角色效果很好了,數(shù)據(jù)較少的幾個角色還不太行。

MoeTTS

【使用說明】

  模型目錄格式

  單模型可以放在任意位置,如果模型帶有配置文件,請將它重命名為config.json并與TTS模型放置在同一目錄。(例如hifigan,vits模型,它們是帶有配置文件的)

  VITS模型請將config.json中的cleaners 改為custom_cleaners

  文本輸入格式

  文本一般是輸入音素(日語在這里應(yīng)該輸入羅馬音),但具體要看模型訓(xùn)練者的數(shù)據(jù)是怎么輸入的。比如我的ATRI模型(Tacotron2版本)是輸入無空格羅馬音,標(biāo)點符號只支持逗號句號。

  自定義Cleaner與Symbols

  你可以在與moetts.exe同級的目錄下找到custom文件夾,這里面存放了兩種模型的文本模塊。

  自定義cleaner:找到cleaners.py并修改custom_cleaners函數(shù)即可(軟件默認(rèn)只會移除不在symbols中的字符,不對文本做進一步處理)

  自定義symbols:找到symbols.py,將里面的符號為你需要的符號

  注意:不同模型可能使用不同的cleaners與symbols訓(xùn)練,有需要請修改他們,保證模型能正常使用。

MoeTTS

  GUI使用方法

  tacotron2

  選擇您的模型路徑與輸出目錄,最后輸入待合成文本,點擊合成語音等待一會軟件會將音頻輸出到輸出目錄/outpus.wav

  注意事項:

  首次合成需要加載模型,耗時較長,相同模型再次合成不會再次加載,直接合成。

  如果切換模型,再次合成會重新加載。

  如果修改cleaners與symbols,重新啟動軟件后才能生效。

  軟件為64位版本,不支持32位系統(tǒng)。

  VITS特殊說明

  VITS-Single,VITS-Multi分別為單角色模型與多角色模型

  VITS-Multi中的原角色ID即待合成語音的角色ID,需要填入數(shù)字,目標(biāo)角色ID為語音遷移功能的待遷移目標(biāo)角色ID。

  待遷移音頻需要22050的采樣率,16位,單聲道。

軟件特別說明

標(biāo)簽: MoeTTS

其他版本下載
網(wǎng)友評論
回頂部 去下載

關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們

Copyright ? 2005-2024 m.daaijiaoyu.cn.All rights reserved.

浙ICP備2024132706號-1 浙公網(wǎng)安備33038102330474號