Reply To: demoOnline.nにおける録音のタイミングと THRESHの設定に関して

HARK FORUM demoOnline.nにおける録音のタイミングと THRESHの設定に関して Reply To: demoOnline.nにおける録音のタイミングと THRESHの設定に関して

#850

お問い合わせ、ありがとうございます。

まず、お使いのサンプルファイルに同梱されている伝達関数は旧Kinect(v1)用のものと思われます。
https://www.hark.jp/document/supported/
より、Kinect v2用の伝達関数をダウンロードして頂き、差し替えて頂ければと思います。
マイクのチャネル数が一致しているのでクラッシュはしませんがマイク配置は異なりますので
今のままでは意図通りに動作していないと思われます。

—————————————-

下記は伝達関数が正しい場合、どのような動作となっているか記載しました。
伝達関数をKinect v2用のファイルに置き換えてから読んで頂けますようお願い致します。

添付して頂いた画像の音声ファイルがどのような定位結果で出力されたものか
確認させて頂いても宜しいでしょうか。

実行時にDisplayLocalizationノードによって定位結果がplotされていたかと思います。
この時、「0.png」の定位結果と並行で「2.png」が定位していませんでしょうか。

この場合、「0.png」の音声と「2.png」のノイズが分離された事になり正常です。
SourceByDirectionノードなどを用いると音源情報をフィルタする事が可能ですので
SaveWavPCMで音声を保存する際に自分の声の分離音だけを保存する事が可能です。

GHDSSノードに入力する前にノイズの音源情報をフィルタしてしまった場合、
ノイズを分離出来なくなり指向性を持たせるだけになってしまいます。
GHDSSノードに入力するSOURCEはSourceIntervalExtenderから出力しているSource、
SaveWavPCMに入力するSOURCEはSourceIntervalExtenderの出力を一度
SourceByDirectionに入力し、SourceByDirectionでフィルタした後のSourceとします。

「2.png」が「0.png」と無関係のタイミングで定位する場合。
大量のノイズが定位してしまう場合、SourceTrackerノードのTHRESHを上げる事で
不要なノイズを定位しないようにする事が可能です。

もし、ご不明な点がございましたら再度お問い合わせください。
その際、お使いのHARKバージョンとOS(バージョン込み)で情報を頂けると幸いです。

以上、宜しくお願い致します。