Forum Replies Created
-
AuthorPosts
-
お問い合わせありがとうございます。
HARKでは、音源分離を周波数領域で行うよう実装していますので、
変換せずに分離することはできません。
また、MapSelectorBySource
ノードへの入力は分離処理後の音源を想定していますので、
ご提示の構成ではフィルタリングできないかと思います。HARKに関しては、少し先になりますが無料の講習会がございます。
音響処理の理論を解説しながら、HARKの機能・技術を紹介する場となっておりますので
HARKをご理解いただくための一助となれば幸いです。以上、よろしくお願いいたします。
HARKサポートチームお問い合わせありがとうございます。
VirtualBox上でUSB接続したデバイスがカード番号0に割り当てられることは少ないと思いますので、
ご使用のTAMAGOがplughw:0,0
に割り当てられているか、
今一度ご確認いただけますでしょうか。以上、よろしくお願いいたします。
HARKサポートチームお問い合わせありがとうございます。
外部から音源方向を含むSOURCE情報を渡すのであれば、
その時点で音源定位が完了しているものとして処理できますので、
具体的には、以下のようなネットワーク構成になるかと思います。AudioStreamFromMic ↓ MultiFFT ↓ GHDSS ← 独自ノード(動的にSOURCE情報を渡す) ↓ Synthsize ↓ SaveWavePCM
以上、よろしくお願いいたします。
HARKサポートチームお問い合わせありがとうございます。
エラーメッセージだけでは詳細が分かりませんが、
はじめての録音を参照してTAMAGOからの録音ができる状態でしょうか?
もし、録音できる状態でエラーとなっている場合、
各ノードのパラメータを再度ご確認ください。また、差し支えなければご使用のネットワークファイルをご提供いただくことで
こちらでパラメータ等の確認をすることも可能です。以上、よろしくお願いいたします。
HARKサポートチームお問い合わせありがとうございます。
申し訳ございませんが、
MultiAudioStreamFromMic
ノードはデバイスの制御にALSAドライバを使用しているため、
Linux版のみの提供となっております。お手数ですが、該当ノードを使用される場合はLinux版をご利用願います。
HARKサポートチーム
Thank you for your inquiry.
Sorry, ASIO Plugin is only compatible with HARK 2.x.
There are plans to release it in the 3.x series, but it is not supported at this time.If you really want to use ASIO, I’m sorry to trouble you, but I would like to use it with the HARK 2.x series.
2.x series can be downloaded from here.
https://www.hark.jp/install/windowsold/Please note that the required tool version is different from the 3.x series.
お問い合わせありがとうございます。
参照手順の通りにインストールしていた場合、hark-desigenrの最新版がインストールされているかと思います。
hark-desigenrは3.0以降でdefファイルからjsonファイルへと変更しており、互換性がございません。お手数ですが、下記手順でhark-desigenrのバージョンを確認していただき、3.0.0以降であった場合は一度削除して、2.5.0をインストールしてください。
dpkg -l hark-designer # バージョンが3.0.0以降の場合、以下を実行 sudo apt purge hark-designer sudo apt install hark-designer=2.5.0
以上、よろしくお願いいたします。
HARKサポートチームお手数おかけしております。
v2.x系については、こちらよりダウンロード可能です。
https://www.hark.jp/install/windowsold/3.x系とは必要なツールのバージョンも異なりますので、ご注意ください。
HARKサポートチーム
お問い合わせありがとうございます。
申し訳ございませんが、ASIO Plugin は HARK 2.x 系のみの対応となっております。
3.x 系でのリリース予定はあるのですが、現時点では未対応です。どうしてもASIOを使用したい場合は、お手数ですがHARK 2.x 系列にてご利用いただければと思います。
HARKサポートチーム
お問い合わせありがとうございます。
新しい語彙を追加とありますが、
wavファイルを音響モデルの学習データに追加した場合は、再学習が必要となります。
そうではなく、評価で使用する言語モデルに語彙ファイルを追加した場合は再学習は不要です。また、音響モデルの学習に追加するデータですが、
CSJのデータ(520時間)に対して小さい(数時間程度)ものであるならば、
再学習をしてもほとんど効果が見られませんので、
言語モデルの評価データのみ追加したほうが効率はよいかと思います。以上、よろしくお願いいたします。
HARKサポートHi Riya,
If you use HARK for speech recognition, please input the wav file format instead of MP3, as described here.
Sincerely,
HARK Support Teamお問い合わせありがとうございます。
申し訳ございませんが、サーバー側の問題により添付ファイルが登録されていないようです。
お手数ですが、再度登録をお願いします。HARKサポート
お問い合わせありがとうございます。
ご指摘の現象ですが、最新のChromium Browserにて発生しているようです。
お手数ですが、別のブラウザを使用して頂くようお願いいたします。コマンドラインからhark-designerを実行する際にfオプションを指定することで、
Firefoxでの起動が可能です。
$ hark_designer f
以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 9 months ago by nterakado.
ご提供いただいたネットワークファイルと伝達関数を用いて、こちらで検証を行いました。
結論としては、THRESHの設定が音源定位の環境とマッチしていないということになります。
こちらでMUSICパワーを確認したところ、
SourceTrackerノードのTHRESHが測定されたパワーよりも高めに設定されていましたので、
21~22程度に変更したところ定位結果が表示されるようになりました。精度よく定位させるためには、お使いの環境に応じてTHRESHを設定する必要がございます。
判定に使用しているMUSICパワーはLocalizeMUSICノードで計算された結果ですので、
実際の環境でどのようなパワーが出力されているかをDEBUG出力等で確認しながらの調整になるかと思います。
LocalizeMUSICの出力を確認するには、こちらに記載してあるSPECTRUM端子を追加して、DEBUGをtrueに設定してください。参考までに、こちらで動作させた際のMUSICパワーを添付します。
特に雑音のない状態で19~20程度、発話時のピークで22程度となっています。
実際の環境では、周囲の雑音や定位させたい音声の大きさ等に左右されますのでご注意ください以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 10 months ago by nterakado.
Attachments:
お問い合わせありがとうございます。
ご参照いただいた記述ですが、
X_AXIS ( 単位 mm ) となっている箇所は誤記になります。
誤解を招く表現をしてしまい、申し訳ありませんでした。また、伝達関数を添付いただいていますが、
これだけでは定位しない原因はわかりかねます。
差し障りがないようでしたら、
使用した音源ファイルとネットワークファイルを添付いただければ、
こちらでの検証も可能となります。以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 10 months ago by nterakado.
-
AuthorPosts