Reply To: 音源分離について

HARK FORUM 音源分離について Reply To: 音源分離について

#1071
nterakado
Moderator

お問い合わせありがとうございます。

短い音声ファイルが大量に作成されるとのことですが、
大きく二つの原因がございます。

1. 小さな音声がノイズと認識されてしまう場合
この場合、発話の最中に声が小さくなるような音声は、別の音声として分割されてしまいます。
SourceTracker ノードのパラメータ THRESH の値を小さくすることで改善する可能性がありますが、ノイズを拾いやすくなります。

2. 無音区間と認識する時間が短い場合
この場合、発話の最中の息継ぎなどで音声が分割されてしまいます。
SourceTracker ノードのパラメータ PAUSE_LENGTH の値を大きくすることで無音区間があっても同一の音声と認識されます。
問題点としては、発話前後に録音される無音区間が長くなります。

どちらも、実際の録音環境に応じて調整が必要となります。
ノードの詳細については、以下を参照してください。

https://www.hark.jp/document/3.0.0/hark-document-ja/subsec-SourceTracker.html

以上、よろしくお願いいたします。

  • This reply was modified 2 years, 2 months ago by nterakado.