nterakado

Forum Replies Created

Viewing 15 posts - 76 through 90 (of 96 total)
  • Author
    Posts
  • in reply to: HARKのHarkDataStreamSenderについて #1141
    nterakado
    Moderator

      添付のネットワークであれば、
      ConstantLocalization からの出力をSRC_INFOに接続してください。

      それ以外のノードを使用しており、音源の定位方向が不定の場合は、
      LocalizaMUSIC で定位させた音源情報などを接続するようにしてください。

      以上、宜しくお願い致します。
      HARKサポートチーム

      in reply to: Recording audio stream from ROS – data type error #1136
      nterakado
      Moderator

        Please see previous answer on how to convert Structure.

        For frame proccessing, refer to the AudioStreamFromWave source code.
        The source code can be obtained with the following command on Ubuntu.
        apt source hark-core

        Best regards,
        HARK Support

        • This reply was modified 6 years, 7 months ago by nterakado.
        • This reply was modified 6 years, 7 months ago by nterakado.
        in reply to: HARKのHarkDataStreamSenderについて #1134
        nterakado
        Moderator

          お問い合わせありがとうございます。

          HarkDataStreamSenderノードの使い方については、下記リファレンスをご参照ください。
          https://www.hark.jp/document/hark-document-ja/subsec-HarkDataStreamSender.html

          別の投稿ですがHarkDataStreamSenderについて解説しておりますので、参考までに。

          また、添付画像ではSRC_WAVEしか入力されていませんが、
          SRC_INFOに元となるSource情報を入力する必要があります。

          以上、宜しくお願い致します。
          HARKサポートチーム

          in reply to: Understanding Recording Time equation #1104
          nterakado
          Moderator

            Thank you for your inquiry.

            We will answer to the following.

            1.
            Yes, you can set arbitrarily.
            But sample network files and transfer functions are based on 512 / 160 settings.

            The value for LENGTH is derived by:
            32 ms = 0.032 seconds
            16000 Hz * 0.032 seconds = 512

            The value for ADVANCE is derived by:
            10 ms = 0.01 seconds
            16000 Hz * 0.01 seconds = 160

            Why use the values 32ms and 10ms?
            In, https://www.hark.jp/document/3.0.0/hark-document-en/subsec-AudioStreamFromWave.html – see “Rough indication of parameters”.

            2.
            A brief description is in the cookbook.
            https://www.hark.jp/document/hark-cookbook-en/subsec-Others-001.html

            It is another inquiry, but the explanation document about the frame is in the following.
            https://wp.hark.jp/wp-content/uploads/2019/04/frames_revised.png

            3.
            For the same reason as the second answer.

            Best regards,
            HARK Support Team

            in reply to: 音源分離について #1098
            nterakado
            Moderator

              繰り返しになりますが、
              写真では分かりませんので、
              追加の写真を添付いただいても回答できません。

              また、一次解析も行っておりませんので、
              原因が使用されているマイクにあるのか(HW要因)、または設定にあるのかを判断することもできません。

              ただ、ご使用の環境(OS、HARKバージョン、使用マイクアレイ等)についての情報とネットワークファイル(添付の写真では、bunri2という名前で保存されているようです)を提供いただけるなら、こちらで再現実験を行うことができるかもしれません。

              申し訳ありませんが、HARKはオープンソースとしてソースコードをすべて開示しており、必要な情報はご自分で調査いただくことを前提としています。
              お力添えできず大変申し訳ございませんが、以上ご了承願います。

              HARKサポートチーム

              in reply to: 音源分離について #1085
              nterakado
              Moderator

                お問い合わせありがとうございます。

                まず、以前にもお伝えしたように、写真だけでは設定がわかりませんので
                ネットワークファイルを添付いただけない場合は回答いたしかねます。

                そのうえで、現状の確認をさせていただきますと、INITW_FILENAMEの役割をご理解できていないように見受けられます。
                詳細はノードリファレンス の 6.3.6.5.4 分離行列の更新式 にある 分離行列の推定 にありますが、
                簡単に説明しますと、INITW_FILENAME を指定しない場合、音声の最初の部分は分離精度があまりよくないですが、処理を続けていくうちに精度がよくなっていきます。
                適切な初期値を指定した場合、精度がよくなるまでの時間が短縮できますが、適切でない場合は指定していない場合と同様に時間がかかるというものです。

                また、作成方法については、ノードリファレンスにも記載してありますが、
                EXPORT_W にtrueを設定し、EXPORT_W_FILENAME に作成したいファイル名を指定してください。
                ネットワーク実行後にファイルが作成されます。

                以上、よろしくお願いいたします。

                • This reply was modified 6 years, 8 months ago by nterakado.
                in reply to: Incorrect SemiBlindICA work on my network #1075
                nterakado
                Moderator

                  Hello

                  It is difficult to answer immediately because the previous moderator is busy at other work.
                  Sorry, please wait for a while.

                  Sincerely,
                  HARK Support Team

                  in reply to: 音源分離について #1071
                  nterakado
                  Moderator

                    お問い合わせありがとうございます。

                    短い音声ファイルが大量に作成されるとのことですが、
                    大きく二つの原因がございます。

                    1. 小さな音声がノイズと認識されてしまう場合
                    この場合、発話の最中に声が小さくなるような音声は、別の音声として分割されてしまいます。
                    SourceTracker ノードのパラメータ THRESH の値を小さくすることで改善する可能性がありますが、ノイズを拾いやすくなります。

                    2. 無音区間と認識する時間が短い場合
                    この場合、発話の最中の息継ぎなどで音声が分割されてしまいます。
                    SourceTracker ノードのパラメータ PAUSE_LENGTH の値を大きくすることで無音区間があっても同一の音声と認識されます。
                    問題点としては、発話前後に録音される無音区間が長くなります。

                    どちらも、実際の録音環境に応じて調整が必要となります。
                    ノードの詳細については、以下を参照してください。

                    https://www.hark.jp/document/3.0.0/hark-document-ja/subsec-SourceTracker.html

                    以上、よろしくお願いいたします。

                    • This reply was modified 6 years, 8 months ago by nterakado.
                    in reply to: 音源定位のグラフについて #1069
                    nterakado
                    Moderator

                      定位した音源のIDを区別するために、表示ごとに色わけしています。
                      詳細は以下のHARKドキュメントに記載しています。

                      https://www.hark.jp/document/3.0.0/hark-document-ja/subsec-DisplayLocalization.html

                      基本的な情報は、Webサイトのドキュメント、クックブックに記載していますので、一読をお勧めします。

                      以上、よろしくお願いいたします。

                      nterakado
                      Moderator

                        > sep_rec_offline.nで表示されるということは自分の送った画像のノードの何か設定が間違っているのでしょうか?
                        画像からでは判断できませんので、HARK-Designer上でsaveを押して保存したファイルが必要になります。
                        これをネットワークファイルと呼びます。sep_rec_offline.nも同様にして作成されています。

                        音源ファイルとは、音源定位させたい音声が含まれるwavファイルを指しています。
                        Supported HardwareのBy Geometrically Calculationで提供しておりますのは、
                        TAMAGOの伝達関数ファイルになります。
                        wavファイルがTAMAGOで録音した音源である場合に使用します。
                        音声ファイルセットに含まれる2SPK-jp.wavであれば問題ありませんが、
                        別のマイクアレイで録音したwavファイルを定位させたい場合は、
                        録音したマイクアレイでの伝達関数を作成する必要があります。

                        Attachments:
                        nterakado
                        Moderator

                          お力添えできず、大変申し訳ございません。
                          画像の情報だけでは、原因を特定できません。

                          よろしければ、ご使用の環境一式を添付いただけると
                          こちらでの再現と調査が可能でございますが、いかがでしょうか。

                          最低限必要なファイル
                          ・ネットワークファイル
                          ・音源ファイル
                           (もし独自の伝達関数を作成しているようならそちらも)

                          その他、OS・使用したマイクロホンや音源ファイルの情報もあれば調査に役立ちます。

                          以上、よろしくお願いいたします。

                          nterakado
                          Moderator

                            クックブックの記述が分かりにくい点、申し訳ございません。
                            お問い合わせの件、ご説明いたします。

                            ・batchflowについて
                            batchflowは、HARK-Designerで作成したネットワークファイル(解凍したディレクトリにある拡張子が.nのファイル)を実行するコマンドになります。
                            HARK-Designer上でExecuteボタンをクリックしたことと同義です。

                            HARKをインストールしたWindows環境であれば、Anaconda Promptを起動してbatchflowと入力してEnterを押してみてください。
                            添付画像のように表示されるはずです。

                            したがって、クックブックの説明は、sep_rec_offline.n2SPK-jp.wav のあるディレクトリでbatchflowコマンドを実行するという意味になります。
                            これは、ネットワークファイルsep_rec_offline.nを引数2SPK-jp.wavで実行するということになります。

                            また、batchflowはHARK 2.5以前で使用していたコマンドです。HARK 3.0以降はharkmwというコマンドになりますが、同じ動作をします。

                            ・LocalizeMUSICのA_MATRIXについて
                            こちらに設定するのは定位用伝達関数ファイルのパスになります。
                            詳細については、以下のリンクをご参照ください。
                            その際、harktool4と記載していますが、現在のharktoolはバージョンが5になっていますので、
                            harktool5のドキュメントをご参照願います。

                            LocalizeMUSICノードの説明:
                            https://www.hark.jp/document/3.0.0/hark-document-ja/subsec-LocalizeMUSIC.html

                            HARKTOOL5の説明:
                            https://www.hark.jp/document/packages/harktool5-gui-ja/index.html

                            ・マイクロホンの設定について
                            クックブックの2.1 はじめての録音 に記載の内容はお試しいただけているでしょうか?
                            マイクロホンを正しく認識できていませんと、その後の処理が正常に働きませんので
                            お手数ですが、ご使用のデバイスが正常に動作することを確認いただければと思います。
                            (ご確認ずみであれば失礼いたしました。)

                            最後に、HARKはUbuntu版を優先して開発していることもあり、ドキュメントやFORUMの投稿内容もUbuntu版の方が充実しております。
                            お手間でなければ、Ubuntu版の使用もご検討いただけますと幸いです。

                            以上、よろしくお願いいたします。

                            • This reply was modified 6 years, 9 months ago by nterakado.
                            Attachments:
                            in reply to: harktool5の設定について #989
                            nterakado
                            Moderator

                              お問い合わせありがとうございます。

                              TF Calculation Type の設定から、録音したTSP信号を用いて伝達関数を作成していることと推測されます。
                              その場合、録音したファイルをSound source positionsWave File Pathに指定する必要がございます。
                              また、TSP信号の代わりに幾何計算(シミュレーション)で伝達関数を作成することが可能です。
                              TF Calculation TypeUse Geometric Calculationに設定することで、幾何計算による伝達関数が作成されます。

                              詳細については下記ドキュメントに記載してありますので、ご参照いただければ幸いです。

                              https://www.hark.jp/document/packages/harktool5-gui-ja/harktool5-gui.html

                              また、過去に同様のお問い合わせがありましたので、こちらもご参考までに。

                              https://wp.hark.jp/forums/topic/伝達関数の生成について/

                              以上、よろしくお願いいたします。

                              • This reply was modified 6 years, 9 months ago by nterakado.
                              • This reply was modified 6 years, 9 months ago by nterakado.
                              in reply to: マイクロホンからのリアルタイム音源定位 #968
                              nterakado
                              Moderator

                                お問い合わせありがとうございます。
                                HARKサポートチームです。

                                添付画像を拝見したところ、
                                エラーログに “No output terminal in network ‘MAIN'” と表示されており、
                                LOOP0シートにてAudioStreamFromMicノードのNOT_EOF端子と
                                DisplayLocailzationノードのOUTPUT端子が設定されていないことが原因のように見受けられます。
                                各端子部分を右クリックして、NOT_EOF端子をCondition、OUTPUT端子をOutputに設定してください。

                                また、以前に同様のお問い合わせがございましたので、そちらもご参照いただければと思います。

                                https://wp.hark.jp/forums/topic/音源定位について/

                                以上、よろしくお願いいたします。

                                in reply to: hark-python3のチュートリアルでエラー #907
                                nterakado
                                Moderator

                                  お問い合わせありがとうございます。

                                  ネットワークファイルを確認させていただきましたが、
                                  PyCodeExecutor3ノードで設定している端子名が大文字になっておりました。
                                  チュートリアルで例示しているPythonのsamplecodeでは端子名を小文字としておりますので、
                                  そのまま記述していた場合は定義されていない端子にアクセスしようとしてエラーとなります。
                                  以前に回答させていただいたように、Pythonファイルの記述とネットワークファイルのPyCodeExecutor3ノードに追加した端子名は一致させてください。

                                  また、
                                  Node::addFactory : The factory (ノード名) already exists. Ignoring the new one.
                                  というメッセージが多発しているようですが、
                                  こちらは以前のバージョンのHARKとパスが競合している場合に発生します。
                                  flowdesigner-0.9.1-harkをアンインストールして頂くことで、改善するかと存じます。
                                  ソースからコンパイルしていた場合は、$ sudo make uninstallでアンインストール可能です。

                                  以上、よろしくお願いいたします。

                                  • This reply was modified 6 years, 9 months ago by nterakado.
                                  • This reply was modified 6 years, 9 months ago by nterakado.
                                  • This reply was modified 6 years, 9 months ago by nterakado.
                                Viewing 15 posts - 76 through 90 (of 96 total)