Upload
eji-warp
View
684
Download
1
Embed Size (px)
Citation preview
● Usage 1 - Resampler と wavtool 両方で機能するために、MoresamplerにおけるCache(合成時の歌声ファイル中間出力先)の使い方はほかのResamplerとWavtoolはある程度異なる。よってここには一部のUTAU設定を変更する必要が生む。
● Usage 2 -もしMoresamplerをResamplerとしてだけ使う場合は、他のResamplerと同じ使い方で大丈夫です。Moresampler.exeとmoreconfig.txtは同じフォルダーにあることだけ確認してください。
Moresampler - 使い方
Usage 1 - UTAU の設定
こちらのオプションをオフしてください。
(通常はオフなので大体の場合は特にいじる必要がありません)
オプション→レンダリング
Usage 1 - UTAU の設定
このオプションを有効してください
(デフォルト有効となってますので通常はいじらなくでいいはず)
オプション→キャッシュ
Usage 1 – ファイルをコピーする
● そしてMoresamplerのアーカイブのすべてのファイルを置けたい場
所に解凍してください。
● Moresampler.exeとmoreconfig.txtは同じフォルダーに置く必要が
あります。
● このデモではUTAUのインストールフォルダーに置きました。
Usage 1 – プロジェクト設定
● そろそろ終わります。最後はプロジェクトの中にMoresamplerをResamplerとwavtoolとして使うことを指定してください。
Usage 1 – プロジェクト設定
● もしPresampを使う場合、Preditをこう設定してください。
Usage 2
● Moresamplerと他のwavtoolと連携を取るため、Moresamplerのこれらの設定をオフする必要あります。(sampling rateは44100Hzより低くするなど)
● moreconfig.txtを編集:
# === Output settings ===output-sampling-rate 44100output-bit-depth 16resampler-compatibility on
調整の仕方
● 合成品質を高めるため、Moresamplerは多数の設定をmoreconfig.txtに用意した。注意を払えば調整によってよい合成品質が得られます。
● 主は三種類に分かれる
− Output Settings(出力
− Synthesis Settings(合成)
− Analysis Settings(分析)
● 「可能性の獣を解き放て!」
設定の各所属
● Moresamplerは変数式合成器であり、こういう流れで処理を行います。
Read .wavAnalysis(wave to LLSM)
LLSM Parameter
ModificationSynthesis(LLSM to
wave)Write .wav
Analysis Settings
Synthesis SettingsOutput Settings
Output Settings(出力設定)
● 出力WAVのフォーマットを設定する
○ 文法はoutput-sampling-rate <frequency>○ Hz付けない
● 例: output-sampling-rate 44100
● 上下限などあらずどんな正整数でも可能です(例えば通常は使わな
い「12345」とか)
● サンプリングレートを原音に合わせる必要はございません。(100Hzより低い設定できないようですが)
● 他のWAVTOOLに連携する場合、44100に設定してください。
Output Settings(出力設定)
● output-bit-depth 8/16/24/32● 出力の量子化精度。
8/16/24/32に出来ます。
● 例: output-bit-depth 24● 24bit推奨
● 他のWAVTOOLに連携する場合、16に設定してくださ
い。
Output Settings(出力設定)
● resampler-compatibility on/off● Resamplerモードで合成時WAVは出力する(on)か否か(off)
● 例:resampler-compatibility on● Usage 2の使い方において、ONしてください。● Usage 1の使い方において、オフすると時間節約出来て品質は影響しません。
Synthesis Settings(合成設定)
● これらの設定はMoresamplerはどのように歌声を調整することを影響します。
● synthesis-utau-style-normalization full/voiced/off
プロジェクト中の各セクトの声の増幅量を一致するために、今まで各Resamplerはピッチ調整後、ボリュームを特定値(デフォルトは100%、最大値の50%)に合わせてリニア調整をしました。
50%
Synthesis Settings(合成設定)
● synthesis-utau-style-normalization(続き)● この項目は 以降のオプションがあります:full/voiced/off
− full - 声部分とノイズ部分を同時にノーマライズ
− voiced - 声部分だけ調整
− off - ノーマライゼーション
● (UTAUの仕様によって)このオプションはオリジナル音声の声量比
例を変更するのため、録音するときで保留したい特徴(囁き声など)
はいじられてしまう。意図的オフする場合がございます。
● 原音の音量自体特に整合性をとってない場合はFULLに設定してく
ださい(通常UTAU通り合わせる想定となります)
Synthesis Settings(合成設定)
● synthesis-utau-style-normalization (続き)● このオプション(UTAU式ノーマライズ)のもう一つの問題を引き起こ
すのが、ラウンドネスより増幅量の絶対値(ピーク)だけを考慮する
こと。
● 絶対値だけを考慮すると、人間の聴覚が予期する(=声の強さ/弱さ
はどう聞こえるか=ラウンドネス)と不整合性が出てしまう。
Synthesis Settings(合成設定)
● synthesis-loudness-preservation on/off
● 前述の不整合性を解決するために、このオプションを導入しました。
● Hynek Hermansky教授の等当量ラウンドネス曲線[1]に合わせて、
音声ピーチ編集する以前で(原音に対して)音量を補正します。
● このオプションをUTAU式ノーマライズに合わせて使用することも可
能。(音量整合とってないライブラリーは両方オンしてください)
[1] H. Hermansky, "Perceptual linear predictive (PLP) analysis of speech", J. Acoust. Soc. Am., vol. 87, no. 4, pp. 1738-1752, Apr. 1990.
Synthesis Settings(合成設定)
● synthesis-duration-extension-method auto/stretch/loop
このオプションはMoresamplerがどのように原音の伸縮部を処理する方式を設定します。
以降伸長をする場合を例にします
Synthesis Settings(合成設定)
● synthesis-duration-extension-method (続き)ループ: 重複するパターンが見えます(時々見えつらいが)
Synthesis Settings(合成設定)
● synthesis-duration-extension-method (続き)伸縮: パターンはないけれど時々伸縮部がぼけてしまう
Synthesis Settings(合成設定)
● synthesis-duration-extension-method (続き)Auto:原音の長さを見てループもしくは伸縮式を自動選択する
(大抵の場合そんなに変わらない)
原音の発声が短促の場合、明示的伸縮にすることをオススメします。
Analysis Settings(分析設定)
● 分析は初回実行だけ行います。毎回新しいWAV使う場合MoresamplerはそれをLLSMへ変換し増し。ただその分析結果の(良さ悪さ)によって出力結果が変わることが予想できる。
● 再分析したい場合は原音フォルダーの特定.llsmファイルを削除することでMoresamplerは再分析を行います。
Analysis Settings(分析設定)
● load-frq on/strict/off場合によってMoresamplerは音高分析失敗するので、このオプションによって(frq存在する場合)それを基ついて音高予測を行います。
onに設定する場合、自前予測が清音、frqは濁音のときfrqの内容を信頼する。
strictに設定する場合、Moresamplerは自前の音高抽出をスキップしてfrqの内容を強制使用する。
Analysis Settings(分析設定)
● load-frq on/strict/offこのオプションはonとstrictにすることをオススメしません。
Moresamplerがまったく分析がうまく行かない場合だけにしてください。(そして作者にご連絡お願いします)
*:これは現状の分析アルゴリズムは正確な清音、濁音の判断することを強く依存してますが、現存のfrq編集ツールはそれをご提供できませんゆえ。
Analysis Settings(分析設定)
● analysis-biased-f0-estimation on/offもしMoresamplerの出力が粗い場合はこのオプションを試してください。
テスト機能でありますが、特定のノイジー、粗い音声には有効になる場合があります。
Analysis Settings(分析設定)
● analysis-f0-min <frequency>● analysis-f0-max <frequency>( 'Hz' 書かない。例 analysis-f0-max 800 )● 音高分析の上下限を設定する。● デフォルト値は相当広く設定してます。録音した原音の基本周波数に合わせて設定すると、予測エラーを抑えることが出来ます。
Analysis Settings(分析設定)
● analysis-noise-reduction on/off● 有効すると、分析時自動的ノイズキャンセリング機能
が働く● 原音の頭に長い無音段階がある場合が有効● 波形エディターより、Moresamplerのノイズキャンセリ
ング機能を使用する利点は、通常のノイズ低減方式より原音に対する音質低下が少ない。
Analysis Settings(分析設定)
● analysis-noise-reduction (続き)例:
Q&A● Moresamplerは他のresamplerと連携できますか?
○ 出来ません。
WavtoolモードにおいてMoresamplerは独自の変数式言語合成
フォーマット(.llsm)だけ処理可能のため、WAVは処理できませ
ん。
○ 今後Moresamplerを他のWAVTOOLへwav出力は引き続き可
能です。