iGEVD-MUSIC法について

HARK FORUM iGEVD-MUSIC法について

Viewing 5 posts - 1 through 5 (of 5 total)
  • Author
    Posts
  • #2554
    M.Inoue
    Participant

    いつもお世話になっております.

    私はHARKにて,iGEVD-MUSIC法を使って音像定位をしたいと思っています.
    以下の中臺先生らの論文のP2ではHARK内にてiGEVD-MUSIC法が提供されているとありますが,LocalizeMUSICではアルゴリズムにiGEVD-MUSICがありません.
    http://winnie.kuis.kyoto-u.ac.jp/members/okuno/Public/SI2014-Nakadai.pdf

    これは何かしらの追加パッケージをインストールしないといけないという事でしょうか?
    それとも,iGEVD-MUSIC法は雑音相関行列を逐次的に変化させるものであるため,LocalizeMUSICにてCMLoadノードを使って行列を読み込む代わりにCMMakerFromFFTを使えばiGEVD-MUSIC法が実装できるということでしょうか?

    何卒宜しくお願い致します.

    #2556

    お問い合わせありがとうございます。

    iGEVDは雑音相関行列を逐次的に変化させるという認識で合っています。追加パッケージは不要です。
    直前(指定したフレーム前)の相関行列を雑音相関行列とみなすことで実現します。

    仰る通り、作成済み雑音相関行列を CMLoad ノードで読み込む代わりに CMMakerFromFFT または CMMakerFromFFTwithFlag ノードで相関行列を生成しながら LocalizeMUSIC ノードの NOISECM 端子に与えるネットワークにします。
    ここで注意点として、INPUT 端子へ入力する信号と NOISECM 端子へ入力する雑音相関行列を同じフレームから生成してしまうと自分自身を WhiteNoise 化してしまうため MUSIC スペクトルでピークが出なくなってしまいます。そのため、 Delay ノードを挿入して入力フレームをずらす必要があります。
    HARKの仕様として、 Delay ノードに与える遅延量は負値で与える必要がありますのでご注意ください。正値で入力した場合、後段ノードに対して入力が揃っていない状態で計算指示を出している意味になりクラッシュします。負値の場合は、後段ノードに先行フレームなのでバッファに保持しておいてくださいという指示になり、後段ノードの計算開始タイミングをずらすという処理となります。

    iGEVD-MUSIC の場合は LocalizeMUSIC のパラメータを GEVD に、iGSVD-MUSIC の場合は LocalizeMUSIC のパラメータを GSVD に設定して下さい。

    iGEVD/iGSVD いずれの場合も継続音がある場合は雑音として扱われてしまうため、人間の声で「あーーーー」と言い続けていたり電子音で「ピーーーー」と鳴り続けている場合には音の出始め部分だけピークが出て、あるフレーム以降はピークが消えます。
    検出したい継続音がある場合は、 Delay ノードの遅延フレーム数と CMMakerFromFFT ノードや LocalizeMUSIC ノードのウィンドウサイズを調整して頂くと解決できる場合があります。

    ご不明な点がございましたら、コメントでご返信ください。

    以上、宜しくお願い致します。
    HARK Support Team.

    #2557
    M.Inoue
    Participant

    返信,誠に有難うございます.
    非常に良くわかりました.試してみます.

    #2567
    M.Inoue
    Participant

    いつもお世話になっております.

    CMMakeFromFFTの出力端子とLocalizeMUSICのNOISECMの間にDelayノードを挿入し,音源分離を行ってみました.delayの値を-1とした時はエラーは起こらなかったのですがそれよりも小さい値(-10など)ではエラーが起きて実行することができませんでした.

    これは,ディレイの幅が大きいとバッファとして保存できる容量を超過してエラーが起こっているのでしょうか?(この場合はCMMakeFromFFTwithFlagで計算する回数を調整すれば解決するのでしょうか?)
    それともdelayが-1の時だけ異なる挙動をする様になっているのでしょうか?

    実行環境は
    OS: Ubuntu 20.04
    Hark version: 3.3.0
    です.

    自分が作ったネットワークファイルとテストで使った音源(8ch)が入ったフォルダの共有urlを送ります.何卒よろしくお願い致します.
    https://www.dropbox.com/sh/8u93j0yglajq6tp/AACqQb2cGoY8KwRcxUA21r0Pa?dl=0

    • This reply was modified 4 days, 22 hours ago by M.Inoue.
    • This reply was modified 4 days, 22 hours ago by M.Inoue.
    #2570
    nterakado
    Moderator

    お問い合わせありがとうございます。

    ご不便をおかけして申し訳ありません。
    ご提供頂いたファイルで再現したところ、
    最新版における不具合ということが確認できました。

    以前のバージョンであれば動作いたしますので、
    可能であれば、そちらをご使用いただけますでしょうか?
    動作確認できた最新のバージョンは3.0.0となりますが、
    Ubuntu 18.04 までしか対応しておりませんので、
    新しい環境(実機もしくは仮想)をご用意いただく必要がございます。

    その他、ご不明な点がございましたらコメントにてご返信ください。

    お手数をおかけしますが、以上よろしくお願いいたします。
    HARKサポートチーム

Viewing 5 posts - 1 through 5 (of 5 total)
  • You must be logged in to reply to this topic.