nterakado

Forum Replies Created

Viewing 15 posts - 61 through 75 (of 88 total)
  • Author
    Posts
  • in reply to: 音源までの距離推定について #1284
    nterakado
    Moderator

      LocalizeMUSICの出力は、角度に変換せずそのまま他ノードに入力されます。

      ただし、この時点ではIDが全て0になっているために他のノードで使用できません。
      そのため、LocalizeMUSICの出力は、SourceTrackerノードもしくはSourceTrackerPFノードに入力して、音源にIDを付与してから他ノードに入力するようにしてください。

      以上、よろしくお願いいたします。
      HARKサポート

      in reply to: 音源までの距離推定について #1282
      nterakado
      Moderator

        お問い合わせありがとうございます。

        過去に同様の投稿がございますので、
        ご参照いただければと思います。

        また、以下もご参考になるかと思いますので、一読いただければ幸いです。
        https://wp.hark.jp/forums/topic/ノードの作成方法について/#post-871

        以上、よろしくお願いいたします。
        HARKサポート

        in reply to: How to receive data from HarkDataStreamSender #1275
        nterakado
        Moderator

          回答が遅くなり、申し訳ありません。

          添付いただいたネットワーファイルですが、
          HarkDataStreamSenderノードのInput/Outputが適切に設定されていませんでした。

          詳細についてはこちらに記載してありますが、
          SRC_WAVEを入力する場合、SRC_INFOも入力する必要がございます。

          6.1.6.5
          SRC_WAVE, SRC_FFT, SRC_FEATURE, SRC_RELIABILITY の4つの入力端子については, 音源 ID ごとの情報になるため,SRC_INFO の情報が必須である. もし,SRC_INFO を接続せずに,上記4つの入力端子を接続したとしても,何も送信されない. その場合,type は2進数で 0000000000 となる.

          こちらで修正したネットワークファイルを添付しますので、
          ご参照いただければと思います。
          修正点は以下の通りです。
          HarkDataStreamSenderノードをMAIN_LOOPシートに移動
          ・sub_localizationシートの出力をHarkDataStreamSenderSRC_INFOに入力
          ・sub_separationシートの出力をHarkDataStreamSenderSRC_WAVEに入力
          HarkDataStreamSenderの出力端子を設定

          以上、よろしくお願いいたします。
          HARKサポート

          • This reply was modified 4 years, 4 months ago by nterakado.
          • This reply was modified 4 years, 4 months ago by nterakado.
          • This reply was modified 4 years, 4 months ago by nterakado.
          • This reply was modified 4 years, 4 months ago by nterakado.
          • This reply was modified 4 years, 4 months ago by nterakado.
          in reply to: Invalid number of channelsで録音ができない #1232
          nterakado
          Moderator

            お問い合わせありがとうございます。

            HARKサポートチームです。

            添付画像を拝見したところ、
            CHANNEL_COUNTを1、SAMPLING_RATEを16000 と設定されているようですが
            ご使用のマイクデバイスは1ch、16kHzに対応しておりますでしょうか?
            マイクデバイスの対応しているチャンネル数、サンプリングレートは
            デバイスのプロパティから確認できます。
            こちらで添付しました画像を例にしますと、
            以下のように設定します。

            CHANNEL_COUNT:2
            SAMPLING_RATE:48000
            DEVICE :Realtek(R) Audio

            お手数ですが、今一度マイクデバイスの設定をご確認いただけますでしょうか。

            以上、よろしくお願いいたします。

            • This reply was modified 4 years, 5 months ago by nterakado.
            • This reply was modified 4 years, 5 months ago by nterakado.
            in reply to: fail to create separation transfer function #1154
            nterakado
            Moderator

              Thank you for your inquiry.

              There are similar post in the past,
              please refer.

              Best regards,
              HARK support team.

              in reply to: HARKのHarkDataStreamSenderについて #1153
              nterakado
              Moderator

                波形情報を取得するためにHARKを使用しているということは、
                音源を定位して個別の波形を取得することを想定されていると思いますが、
                ConstantLocalization を削除すると目的音源の方向がわからなくなってしまいます。
                その場合、LocalizeMUSIC で音源方向を定位させ、その方向データを使用する必要があります。

                HarkDataStreamSender は、パラメータHOSTおよびPORTで指定したポートから外部にデータを送信しますので、
                外部プログラムでは、そのポート番号にアクセスするような実装をしてください。
                申し訳ありませんが、サンプルコードは用意しておりませんのでご了承願います。

                ただし、過去の投稿でデータ通信に関するやりとりを行っています。
                何らかの参考になれば幸いです。

                以上、宜しくお願い致します。
                HARKサポートチーム

                in reply to: Recording audio stream from ROS – data type error #1152
                nterakado
                Moderator

                  Hi Thomas.

                  Is the sheet with AUdioSreamFromRos and SaveWavePCM set to iterator?
                  If it is a subnet, it will only be executed once.

                  Best regards,
                  HARK support team.

                  • This reply was modified 4 years, 7 months ago by nterakado.
                  in reply to: HARKのHarkDataStreamSenderについて #1141
                  nterakado
                  Moderator

                    添付のネットワークであれば、
                    ConstantLocalization からの出力をSRC_INFOに接続してください。

                    それ以外のノードを使用しており、音源の定位方向が不定の場合は、
                    LocalizaMUSIC で定位させた音源情報などを接続するようにしてください。

                    以上、宜しくお願い致します。
                    HARKサポートチーム

                    in reply to: Recording audio stream from ROS – data type error #1136
                    nterakado
                    Moderator

                      Please see previous answer on how to convert Structure.

                      For frame proccessing, refer to the AudioStreamFromWave source code.
                      The source code can be obtained with the following command on Ubuntu.
                      apt source hark-core

                      Best regards,
                      HARK Support

                      • This reply was modified 4 years, 7 months ago by nterakado.
                      • This reply was modified 4 years, 7 months ago by nterakado.
                      in reply to: HARKのHarkDataStreamSenderについて #1134
                      nterakado
                      Moderator

                        お問い合わせありがとうございます。

                        HarkDataStreamSenderノードの使い方については、下記リファレンスをご参照ください。
                        https://www.hark.jp/document/hark-document-ja/subsec-HarkDataStreamSender.html

                        別の投稿ですがHarkDataStreamSenderについて解説しておりますので、参考までに。

                        また、添付画像ではSRC_WAVEしか入力されていませんが、
                        SRC_INFOに元となるSource情報を入力する必要があります。

                        以上、宜しくお願い致します。
                        HARKサポートチーム

                        in reply to: Understanding Recording Time equation #1104
                        nterakado
                        Moderator

                          Thank you for your inquiry.

                          We will answer to the following.

                          1.
                          Yes, you can set arbitrarily.
                          But sample network files and transfer functions are based on 512 / 160 settings.

                          The value for LENGTH is derived by:
                          32 ms = 0.032 seconds
                          16000 Hz * 0.032 seconds = 512

                          The value for ADVANCE is derived by:
                          10 ms = 0.01 seconds
                          16000 Hz * 0.01 seconds = 160

                          Why use the values 32ms and 10ms?
                          In, https://www.hark.jp/document/3.0.0/hark-document-en/subsec-AudioStreamFromWave.html – see “Rough indication of parameters”.

                          2.
                          A brief description is in the cookbook.
                          https://www.hark.jp/document/hark-cookbook-en/subsec-Others-001.html

                          It is another inquiry, but the explanation document about the frame is in the following.
                          https://wp.hark.jp/wp-content/uploads/2019/04/frames_revised.png

                          3.
                          For the same reason as the second answer.

                          Best regards,
                          HARK Support Team

                          in reply to: 音源分離について #1098
                          nterakado
                          Moderator

                            繰り返しになりますが、
                            写真では分かりませんので、
                            追加の写真を添付いただいても回答できません。

                            また、一次解析も行っておりませんので、
                            原因が使用されているマイクにあるのか(HW要因)、または設定にあるのかを判断することもできません。

                            ただ、ご使用の環境(OS、HARKバージョン、使用マイクアレイ等)についての情報とネットワークファイル(添付の写真では、bunri2という名前で保存されているようです)を提供いただけるなら、こちらで再現実験を行うことができるかもしれません。

                            申し訳ありませんが、HARKはオープンソースとしてソースコードをすべて開示しており、必要な情報はご自分で調査いただくことを前提としています。
                            お力添えできず大変申し訳ございませんが、以上ご了承願います。

                            HARKサポートチーム

                            in reply to: 音源分離について #1085
                            nterakado
                            Moderator

                              お問い合わせありがとうございます。

                              まず、以前にもお伝えしたように、写真だけでは設定がわかりませんので
                              ネットワークファイルを添付いただけない場合は回答いたしかねます。

                              そのうえで、現状の確認をさせていただきますと、INITW_FILENAMEの役割をご理解できていないように見受けられます。
                              詳細はノードリファレンス の 6.3.6.5.4 分離行列の更新式 にある 分離行列の推定 にありますが、
                              簡単に説明しますと、INITW_FILENAME を指定しない場合、音声の最初の部分は分離精度があまりよくないですが、処理を続けていくうちに精度がよくなっていきます。
                              適切な初期値を指定した場合、精度がよくなるまでの時間が短縮できますが、適切でない場合は指定していない場合と同様に時間がかかるというものです。

                              また、作成方法については、ノードリファレンスにも記載してありますが、
                              EXPORT_W にtrueを設定し、EXPORT_W_FILENAME に作成したいファイル名を指定してください。
                              ネットワーク実行後にファイルが作成されます。

                              以上、よろしくお願いいたします。

                              • This reply was modified 4 years, 8 months ago by nterakado.
                              in reply to: Incorrect SemiBlindICA work on my network #1075
                              nterakado
                              Moderator

                                Hello

                                It is difficult to answer immediately because the previous moderator is busy at other work.
                                Sorry, please wait for a while.

                                Sincerely,
                                HARK Support Team

                                in reply to: 音源分離について #1071
                                nterakado
                                Moderator

                                  お問い合わせありがとうございます。

                                  短い音声ファイルが大量に作成されるとのことですが、
                                  大きく二つの原因がございます。

                                  1. 小さな音声がノイズと認識されてしまう場合
                                  この場合、発話の最中に声が小さくなるような音声は、別の音声として分割されてしまいます。
                                  SourceTracker ノードのパラメータ THRESH の値を小さくすることで改善する可能性がありますが、ノイズを拾いやすくなります。

                                  2. 無音区間と認識する時間が短い場合
                                  この場合、発話の最中の息継ぎなどで音声が分割されてしまいます。
                                  SourceTracker ノードのパラメータ PAUSE_LENGTH の値を大きくすることで無音区間があっても同一の音声と認識されます。
                                  問題点としては、発話前後に録音される無音区間が長くなります。

                                  どちらも、実際の録音環境に応じて調整が必要となります。
                                  ノードの詳細については、以下を参照してください。

                                  https://www.hark.jp/document/3.0.0/hark-document-ja/subsec-SourceTracker.html

                                  以上、よろしくお願いいたします。

                                  • This reply was modified 4 years, 9 months ago by nterakado.
                                Viewing 15 posts - 61 through 75 (of 88 total)