Forum Replies Created
-
AuthorPosts
-
LocalizeMUSICの出力は、角度に変換せずそのまま他ノードに入力されます。
ただし、この時点ではIDが全て0になっているために他のノードで使用できません。
そのため、LocalizeMUSICの出力は、SourceTrackerノードもしくはSourceTrackerPFノードに入力して、音源にIDを付与してから他ノードに入力するようにしてください。以上、よろしくお願いいたします。
HARKサポートお問い合わせありがとうございます。
過去に同様の投稿がございますので、
ご参照いただければと思います。また、以下もご参考になるかと思いますので、一読いただければ幸いです。
https://wp.hark.jp/forums/topic/ノードの作成方法について/#post-871以上、よろしくお願いいたします。
HARKサポート回答が遅くなり、申し訳ありません。
添付いただいたネットワーファイルですが、
HarkDataStreamSender
ノードのInput/Outputが適切に設定されていませんでした。詳細についてはこちらに記載してありますが、
SRC_WAVE
を入力する場合、SRC_INFO
も入力する必要がございます。6.1.6.5
SRC_WAVE, SRC_FFT, SRC_FEATURE, SRC_RELIABILITY の4つの入力端子については, 音源 ID ごとの情報になるため,SRC_INFO の情報が必須である. もし,SRC_INFO を接続せずに,上記4つの入力端子を接続したとしても,何も送信されない. その場合,type は2進数で 0000000000 となる.
こちらで修正したネットワークファイルを添付しますので、
ご参照いただければと思います。
修正点は以下の通りです。
・HarkDataStreamSender
ノードをMAIN_LOOPシートに移動
・sub_localizationシートの出力をHarkDataStreamSender
のSRC_INFO
に入力
・sub_separationシートの出力をHarkDataStreamSender
のSRC_WAVE
に入力
・HarkDataStreamSender
の出力端子を設定以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 4 months ago by nterakado.
- This reply was modified 4 years, 4 months ago by nterakado.
- This reply was modified 4 years, 4 months ago by nterakado.
- This reply was modified 4 years, 4 months ago by nterakado.
- This reply was modified 4 years, 4 months ago by nterakado.
Attachments:
お問い合わせありがとうございます。
HARKサポートチームです。
添付画像を拝見したところ、
CHANNEL_COUNT
を1、SAMPLING_RATE
を16000 と設定されているようですが
ご使用のマイクデバイスは1ch、16kHzに対応しておりますでしょうか?
マイクデバイスの対応しているチャンネル数、サンプリングレートは
デバイスのプロパティから確認できます。
こちらで添付しました画像を例にしますと、
以下のように設定します。CHANNEL_COUNT:2
SAMPLING_RATE:48000
DEVICE :Realtek(R) Audioお手数ですが、今一度マイクデバイスの設定をご確認いただけますでしょうか。
以上、よろしくお願いいたします。
- This reply was modified 4 years, 5 months ago by nterakado.
- This reply was modified 4 years, 5 months ago by nterakado.
Attachments:
Thank you for your inquiry.
There are similar post in the past,
please refer.Best regards,
HARK support team.波形情報を取得するためにHARKを使用しているということは、
音源を定位して個別の波形を取得することを想定されていると思いますが、
ConstantLocalization
を削除すると目的音源の方向がわからなくなってしまいます。
その場合、LocalizeMUSIC
で音源方向を定位させ、その方向データを使用する必要があります。HarkDataStreamSender
は、パラメータHOSTおよびPORTで指定したポートから外部にデータを送信しますので、
外部プログラムでは、そのポート番号にアクセスするような実装をしてください。
申し訳ありませんが、サンプルコードは用意しておりませんのでご了承願います。ただし、過去の投稿でデータ通信に関するやりとりを行っています。
何らかの参考になれば幸いです。以上、宜しくお願い致します。
HARKサポートチームHi Thomas.
Is the sheet with
AUdioSreamFromRos
andSaveWavePCM
set to iterator?
If it is a subnet, it will only be executed once.Best regards,
HARK support team.- This reply was modified 4 years, 7 months ago by nterakado.
添付のネットワークであれば、
ConstantLocalization
からの出力をSRC_INFOに接続してください。それ以外のノードを使用しており、音源の定位方向が不定の場合は、
LocalizaMUSIC
で定位させた音源情報などを接続するようにしてください。以上、宜しくお願い致します。
HARKサポートチームPlease see previous answer on how to convert Structure.
For frame proccessing, refer to the
AudioStreamFromWave
source code.
The source code can be obtained with the following command on Ubuntu.
apt source hark-core
Best regards,
HARK Supportお問い合わせありがとうございます。
HarkDataStreamSender
ノードの使い方については、下記リファレンスをご参照ください。
https://www.hark.jp/document/hark-document-ja/subsec-HarkDataStreamSender.html別の投稿ですがHarkDataStreamSenderについて解説しておりますので、参考までに。
また、添付画像ではSRC_WAVEしか入力されていませんが、
SRC_INFOに元となるSource情報を入力する必要があります。以上、宜しくお願い致します。
HARKサポートチームThank you for your inquiry.
We will answer to the following.
1.
Yes, you can set arbitrarily.
But sample network files and transfer functions are based on 512 / 160 settings.The value for LENGTH is derived by:
32 ms = 0.032 seconds
16000 Hz * 0.032 seconds = 512The value for ADVANCE is derived by:
10 ms = 0.01 seconds
16000 Hz * 0.01 seconds = 160Why use the values 32ms and 10ms?
In, https://www.hark.jp/document/3.0.0/hark-document-en/subsec-AudioStreamFromWave.html – see “Rough indication of parameters”.2.
A brief description is in the cookbook.
https://www.hark.jp/document/hark-cookbook-en/subsec-Others-001.htmlIt is another inquiry, but the explanation document about the frame is in the following.
https://wp.hark.jp/wp-content/uploads/2019/04/frames_revised.png3.
For the same reason as the second answer.Best regards,
HARK Support Team繰り返しになりますが、
写真では分かりませんので、
追加の写真を添付いただいても回答できません。また、一次解析も行っておりませんので、
原因が使用されているマイクにあるのか(HW要因)、または設定にあるのかを判断することもできません。ただ、ご使用の環境(OS、HARKバージョン、使用マイクアレイ等)についての情報とネットワークファイル(添付の写真では、bunri2という名前で保存されているようです)を提供いただけるなら、こちらで再現実験を行うことができるかもしれません。
申し訳ありませんが、HARKはオープンソースとしてソースコードをすべて開示しており、必要な情報はご自分で調査いただくことを前提としています。
お力添えできず大変申し訳ございませんが、以上ご了承願います。HARKサポートチーム
お問い合わせありがとうございます。
まず、以前にもお伝えしたように、写真だけでは設定がわかりませんので
ネットワークファイルを添付いただけない場合は回答いたしかねます。そのうえで、現状の確認をさせていただきますと、
INITW_FILENAME
の役割をご理解できていないように見受けられます。
詳細はノードリファレンス の 6.3.6.5.4 分離行列の更新式 にある分離行列の推定
にありますが、
簡単に説明しますと、INITW_FILENAME
を指定しない場合、音声の最初の部分は分離精度があまりよくないですが、処理を続けていくうちに精度がよくなっていきます。
適切な初期値を指定した場合、精度がよくなるまでの時間が短縮できますが、適切でない場合は指定していない場合と同様に時間がかかるというものです。また、作成方法については、ノードリファレンスにも記載してありますが、
EXPORT_W
にtrueを設定し、EXPORT_W_FILENAME
に作成したいファイル名を指定してください。
ネットワーク実行後にファイルが作成されます。以上、よろしくお願いいたします。
- This reply was modified 4 years, 8 months ago by nterakado.
Attachments:
Hello
It is difficult to answer immediately because the previous moderator is busy at other work.
Sorry, please wait for a while.Sincerely,
HARK Support Teamお問い合わせありがとうございます。
短い音声ファイルが大量に作成されるとのことですが、
大きく二つの原因がございます。1. 小さな音声がノイズと認識されてしまう場合
この場合、発話の最中に声が小さくなるような音声は、別の音声として分割されてしまいます。
SourceTracker
ノードのパラメータTHRESH
の値を小さくすることで改善する可能性がありますが、ノイズを拾いやすくなります。2. 無音区間と認識する時間が短い場合
この場合、発話の最中の息継ぎなどで音声が分割されてしまいます。
SourceTracker
ノードのパラメータPAUSE_LENGTH
の値を大きくすることで無音区間があっても同一の音声と認識されます。
問題点としては、発話前後に録音される無音区間が長くなります。どちらも、実際の録音環境に応じて調整が必要となります。
ノードの詳細については、以下を参照してください。https://www.hark.jp/document/3.0.0/hark-document-ja/subsec-SourceTracker.html
以上、よろしくお願いいたします。
- This reply was modified 4 years, 9 months ago by nterakado.
-
AuthorPosts