実行速度向上の問題

HARK FORUM 実行速度向上の問題

Viewing 8 posts - 1 through 8 (of 8 total)
  • Author
    Posts
  • #2741
    程治
    Participant

      申し訳ございませんが、またお手数をおかけしてしまいますが、現在2つの問題が解決したいと考えています:
      1. 2秒の音声ファイルを分離する際、なぜ結果が1秒しか得られないのかを知りたいです。
      2. 私の手法は下記の通りですが、識別の速度を大幅に向上させる方法を教えていただけないでしょうか? 現在、2秒の音声ファイルを分離するのに約4秒かかり、毎回、少なくとも1秒の音声が分離され、その後分類される必要があります。(第1の問題が解決すれば、1秒の音声のみを処理できます)

      Attachments:
      #2757
      nterakado
      Moderator

        お問い合わせありがとうございます。

        申し訳ありませんが、
        入力する音声ファイルや、設定しているパラメータによって異なりますので、
        回答が難しいです。

        ご使用されている環境(音声ファイル、.nファイル)をご提供いただければ、
        こちらで調査もできますが、可能でしょうか?
        また、その際は使用されているHARKのバージョンやOSの情報も頂けると調査がスムーズに行えますので、
        ご検討ください。

        以上、よろしくお願いいたします。
        HARKサポートチーム

        #2762
        程治
        Participant

          現在はLinuxシステムを使用しており、HARKのバージョンは3.5.0で、tfファイルは球形です。音声ファイルは30チャンネル2秒の音声で、最大チャンネル数を32に変更しました。ただし、tfファイルと音声ファイルの関係により、認識には長い時間がかかる可能性があります。また、分離された音声ファイルは私が提供した2秒に満たないかもしれません。私の理想的な状況は、1秒を録音して1秒を分離できることです。また、認識時間を最大限に短縮する方法も知りたいです。お手数をおかけしますが、よろしくお願いします。ありがとうございます。
          問題1: 音声の分離問題
          問題2: 識別時間の短縮

          Attachments:
          #2764
          程治
          Participant

            その他の添付ファイルのサイズが制限を超えています。どのような方法でお送りすればよろしいでしょうか。

            #2765
            nterakado
            Moderator

              お手数おかけして申し訳ありません。
              大容量のファイルであれば、
              ギガファイル便等のファイル転送サービスをご利用いただければと思います。

              以上、よろしくお願いいたします。
              HARKサポートチーム

              #2766
              程治
              Participant

                URL:https://xgf.nu/vU8fJ
                またお手数をおかけしますが、ありがとうございます。

                #2772
                程治
                Participant

                  恐れ入りますが、再度お伺いします。この問題の解決方法はありますでしょうか。

                  #2773
                  nterakado
                  Moderator

                    ご提供いただいた環境で確認しておりますが、
                    LocalizeMUSICノードでの計算量が多いため、処理速度が遅くなっているようです。
                    対策として、PERIODの値を大きくすることで処理を早くすることは可能ですが、
                    定位の精度が下がるためチューニングが必要となります。

                    そもそも、マイクのチャネル数と音源の数が多いため、
                    高性能な計算サーバ等でなければ処理速度が追い付かない可能性が高いです。

                    また、使用されている伝達関数ですが、
                    音源座標ファイルの頂点(x,y,z)=(0,0,1)のIDが複数ありますので、
                    重複しているIDを削除していただくことを推奨します。

                    分離される音声が短くなる件ですが、
                    LocalizeMUSICで定位する際に、PERIODで設定した音声フレーム(10ms)ごとに処理します。
                    このため、デフォルトのPERIOD:50では最初の50フレーム(500ms)分は検出されません。
                    また、終端の50フレーム未満も同様に検出されませんので、
                    最大で先頭50フレーム(500ms)+終端49フレーム(490ms)の合計990msは定位結果として検出されません。
                    実際、こちらで確認した際は、530msほど欠落しており、PERIODを1に設定した際は30ms程度の欠落となりました。

                    このため、定位結果はどうしても実際の入力音声より短くなります。
                    また、これを防ぐと計算量が増加し、処理が遅くなります。

                    速度と精度のどちらを重視するかによって調整する必要がありますので、
                    あらためて目的と優先順位を検討していただければと思います。

                    以上、よろしくお願いいたします。
                    HARKサポートチーム

                    • This reply was modified 1 month ago by nterakado.
                    • This reply was modified 1 month ago by nterakado.
                    • This reply was modified 1 month ago by nterakado.
                    • This reply was modified 1 month ago by nterakado.
                    • This reply was modified 1 month ago by nterakado.
                  Viewing 8 posts - 1 through 8 (of 8 total)
                  • You must be logged in to reply to this topic.