Forum Replies Created
-
AuthorPosts
-
お問い合わせありがとうございます。
参照手順の通りにインストールしていた場合、hark-desigenrの最新版がインストールされているかと思います。
hark-desigenrは3.0以降でdefファイルからjsonファイルへと変更しており、互換性がございません。お手数ですが、下記手順でhark-desigenrのバージョンを確認していただき、3.0.0以降であった場合は一度削除して、2.5.0をインストールしてください。
dpkg -l hark-designer # バージョンが3.0.0以降の場合、以下を実行 sudo apt purge hark-designer sudo apt install hark-designer=2.5.0
以上、よろしくお願いいたします。
HARKサポートチームお手数おかけしております。
v2.x系については、こちらよりダウンロード可能です。
https://www.hark.jp/install/windowsold/3.x系とは必要なツールのバージョンも異なりますので、ご注意ください。
HARKサポートチーム
お問い合わせありがとうございます。
申し訳ございませんが、ASIO Plugin は HARK 2.x 系のみの対応となっております。
3.x 系でのリリース予定はあるのですが、現時点では未対応です。どうしてもASIOを使用したい場合は、お手数ですがHARK 2.x 系列にてご利用いただければと思います。
HARKサポートチーム
お問い合わせありがとうございます。
新しい語彙を追加とありますが、
wavファイルを音響モデルの学習データに追加した場合は、再学習が必要となります。
そうではなく、評価で使用する言語モデルに語彙ファイルを追加した場合は再学習は不要です。また、音響モデルの学習に追加するデータですが、
CSJのデータ(520時間)に対して小さい(数時間程度)ものであるならば、
再学習をしてもほとんど効果が見られませんので、
言語モデルの評価データのみ追加したほうが効率はよいかと思います。以上、よろしくお願いいたします。
HARKサポートHi Riya,
If you use HARK for speech recognition, please input the wav file format instead of MP3, as described here.
Sincerely,
HARK Support Teamお問い合わせありがとうございます。
申し訳ございませんが、サーバー側の問題により添付ファイルが登録されていないようです。
お手数ですが、再度登録をお願いします。HARKサポート
お問い合わせありがとうございます。
ご指摘の現象ですが、最新のChromium Browserにて発生しているようです。
お手数ですが、別のブラウザを使用して頂くようお願いいたします。コマンドラインからhark-designerを実行する際にfオプションを指定することで、
Firefoxでの起動が可能です。
$ hark_designer f
以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 1 month ago by nterakado.
ご提供いただいたネットワークファイルと伝達関数を用いて、こちらで検証を行いました。
結論としては、THRESHの設定が音源定位の環境とマッチしていないということになります。
こちらでMUSICパワーを確認したところ、
SourceTrackerノードのTHRESHが測定されたパワーよりも高めに設定されていましたので、
21~22程度に変更したところ定位結果が表示されるようになりました。精度よく定位させるためには、お使いの環境に応じてTHRESHを設定する必要がございます。
判定に使用しているMUSICパワーはLocalizeMUSICノードで計算された結果ですので、
実際の環境でどのようなパワーが出力されているかをDEBUG出力等で確認しながらの調整になるかと思います。
LocalizeMUSICの出力を確認するには、こちらに記載してあるSPECTRUM端子を追加して、DEBUGをtrueに設定してください。参考までに、こちらで動作させた際のMUSICパワーを添付します。
特に雑音のない状態で19~20程度、発話時のピークで22程度となっています。
実際の環境では、周囲の雑音や定位させたい音声の大きさ等に左右されますのでご注意ください以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 1 month ago by nterakado.
Attachments:
お問い合わせありがとうございます。
ご参照いただいた記述ですが、
X_AXIS ( 単位 mm ) となっている箇所は誤記になります。
誤解を招く表現をしてしまい、申し訳ありませんでした。また、伝達関数を添付いただいていますが、
これだけでは定位しない原因はわかりかねます。
差し障りがないようでしたら、
使用した音源ファイルとネットワークファイルを添付いただければ、
こちらでの検証も可能となります。以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 2 months ago by nterakado.
お問い合わせありがとうございます。
実際にどのようなスペクトルパワーが出力されているかを確認するために、
以下をお願いできますでしょうか。1.LocalizeMUSICのパラメータ設定で、DEBUGをtrueに設定
2.LocalizeMUSICに出力端子SPECTRUMを追加
手順はこちらを参照ください
3.SPECTRUM端子の出力をSaveVectorFramesノードで保存
4.ネットワーク実行時に、発話して音源のある状況にする上記手順にて取得したスペクトルから、何が起こっているか解析できるかもしれません。
以上、よろしくお願いいたします。
HARKサポート回答が遅くなり申し訳ありません。。
不動話者の分離が主目的で、その他の移動する話者を個別に分離する必要はないとの前提で簡単に回答いたします。
回答1:可能です
回答2:不動話者の位置だけでは、その他の話者の位置が話者1か話者2に引き込まれてしまいます。添付した図のように、不動話者の両脇でも測定してください。また、話者1と2は等距離が望ましいです。その他の話者が両脇に引き込まれ、不動話者と分離可能になります。ただし、その他の話者の音声を分離したい場合、測定位置の間隔はある程度広くても構いませんが全方向(360度)の測定が必要となります。
回答3:下記手順にて音源座標ファイルを作成後、初期画面の「Sound source positions」の「Visualize」メニューで不要な音源座標を削除してください。https://www.hark.jp/document/packages/harktool5-gui-ja/harktool5-gui.html#create-source-label
回答4:ConstantoLocaizaitonノードを使用して特定方向からの音源のみを対象とすることが可能です。
以上となりますが、伝達関数の測定については他にも考慮すべき点が多々ありますので、
実際に測定してみないと分からないというのが実情です。
大変申し訳ございませんが、上記をご留意いただけますようお願いします。以上、よろしくお願いいたします。
HARKサポート- This reply was modified 4 years, 4 months ago by nterakado.
Attachments:
お問い合わせありがとうございます。
ユーザーからの入力を必要とするダイアログウィンドウが起動されておりませんでしょうか?
起動されたウィンドウがバックグラウンドに隠れていて、
入力待ち状態になっている可能性がございます。また、「Removing backup files」が表示されるとのことですが、
以前のバージョンのHARKをインストールしていませんでしょうか?
その場合、以前のバージョンをアンインストールしてから3.0.2.1をインストールしてください。以上、よろしくお願いいたします。
HARKサポートお問い合わせありがとうございます。
Debianでインストールされたいとのことですが、
リポジトリを登録することはお勧めいたしません。公開しているHARKのパッケージは、Ubuntuの公式パッケージに依存しておりますので
apt updateにより、必要とするパッケージを更新しようとします。
そうなると、安定性重視のDebianでは公式にサポートしていないバージョンに更新される可能性があります。また、debパッケージを直接ダウンロードしてインストールした場合も、
依存パッケージのバージョンがUbuntuを想定しているため、Debian環境では動作しない場合がございます。確実なインストール方法としては、
こちらよりソースコードをダウンロードしていただき、debuild
コマンドを使用してコンパイルしていただく方法になります。
その際、必要なパッケージについてはご自分でインストールもしくはビルドして頂くことになりますので、ご注意ください。以上、よろしくお願いいたします。
HARKサポート表記が分かりづらく申し訳ありません。
第3ビットはSRC_INFO入力端子が接続されていることを示します。
第4ビットはSRC_WAVE入力端子が接続されていることを示しますが、先の投稿で引用したようにSRC_INFOが接続されていない場合、何も送信されない
ため SRC_INFOと併記しています。
したがって、type=0x0cで問題ありません。以上、よろしくお願いいたします。
HARKサポート -
AuthorPosts