中文切音步驟說明
- 環境需求
- 請先安裝python以及MCR,並設好環境變數。
- 目前提供之檔案及安裝檔,請在windows底下使用。
- 備妥正確格式的文本及音檔
- 文本檔案
將欲做切音的文本存成txt檔,如下圖所示:
可為一行之文本,
或為多行之文本。
文本前面不需一定要留空白,但若文本內原有空白亦可交由程式流程處理。
基本上已可排除多數全形標點符號及半形標點符號,但文本仍希望盡量以全形標點符號為主。
- 音檔
音檔所需格式為16-bit, 16k Hz,單聲道的 wav 檔
- 請將以上的兩個檔置於waveToneAssess資料夾中。
- 開始進行切音流程
- 產生純文字txt檔
在waveToneAssess的資料夾底下執行produce_transcript.py檔
指令如下:python produce_transcript.py <文本檔案> <音檔> <產生出來的純文字txt檔> <產生出來去除空白的txt檔>。
此步驟將產生純文字txt檔案。執行畫面如下:
- 進行切音
在waveToneAssess的資料夾底下執行waveToneAssess.exe檔
指令如下:waveToneAssess.exe <音檔之絕對路徑> <A步驟產生出來的純文字txt檔之絕對路徑>。
此步驟將產生lab檔。執行畫面如下:
※ 注意:此步驟將花上較多時間,請靜待直至出現如下圖之執行結束畫面,方可執行下一步驟。
- 產生時間標籤
在waveToneAssess的資料夾底下執行produce_timelabel.py檔
指令如下:python produce_timelabel.py <A步驟產生出來的文本檔案> <B步驟產生的lab檔> <將產生的時間標籤檔>。
此步驟將產生時間標籤txt檔案。執行畫面如下:
即可產生如下的時間標籤檔案
- 產生DEMO PAGE
在waveToneAssess的資料夾底下執行produce_html_new2.py檔
指令如下:python produce_html_new2.py <C步驟產生出來的時間標籤檔案> <A步驟產生出來去除空白的txt檔> <音檔> <要產生之html Demo檔檔名>。
此步驟將產生可供DEMO之HTML檔案。執行畫面如下:
即可產生如下的DEMO PAGE HTML檔案
簡易版使用說明
- 使用說明
- 環境參數設定如同原始版本,請參考最上方。
- 操作方式:
在waveToneAssess的資料夾底下執行runAll.bat檔
輸入指令:runAll.bat <文本檔案> <音檔> <要產生出來的時間標籤檔> <要產生之html Demo檔檔名> 。
程式結束將產生時間標籤txt檔。執行畫面如下:
依文本資料多寡,執行時間約需40-60秒。
SnowWhite_p01
SnowWhite_p02
SnowWhite_p03
ae004_zh-hant_10
an001_zh-hant_03
gr002_zh-hant_06
gr002_zh-hant_12