nterakado

Forum Replies Created

Viewing 15 posts - 1 through 15 (of 40 total)
  • Author
    Posts
  • in reply to: HARKへの新規語彙追加方法 #1481
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    新しい語彙を追加とありますが、
    wavファイルを音響モデルの学習データに追加した場合は、再学習が必要となります。
    そうではなく、評価で使用する言語モデルに語彙ファイルを追加した場合は再学習は不要です。

    また、音響モデルの学習に追加するデータですが、
    CSJのデータ(520時間)に対して小さい(数時間程度)ものであるならば、
    再学習をしてもほとんど効果が見られませんので、
    言語モデルの評価データのみ追加したほうが効率はよいかと思います。

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: HARK error with KALDI decoder #1478
    Avatarnterakado
    Moderator

    Hi Riya,

    If you use HARK for speech recognition, please input the wav file format instead of MP3, as described here.

    Sincerely,
    HARK Support Team

    • This reply was modified 1 week, 4 days ago by Avatarnterakado.
    • This reply was modified 1 week, 4 days ago by Avatarnterakado.
    • This reply was modified 1 week, 4 days ago by Avatarnterakado.
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    申し訳ございませんが、サーバー側の問題により添付ファイルが登録されていないようです。
    お手数ですが、再度登録をお願いします。

    HARKサポート

    in reply to: hark_designerの背景が真っ黒 #1467
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    ご指摘の現象ですが、最新のChromium Browserにて発生しているようです。
    お手数ですが、別のブラウザを使用して頂くようお願いいたします。

    コマンドラインからhark-designerを実行する際にfオプションを指定することで、
    Firefoxでの起動が可能です。
    $ hark_designer f

    以上、よろしくお願いいたします。
    HARKサポート

    • This reply was modified 2 weeks, 1 day ago by Avatarnterakado.
    in reply to: RASP-ZXでの伝達関数測定 #1365
    Avatarnterakado
    Moderator

    ご提供いただいたネットワークファイルと伝達関数を用いて、こちらで検証を行いました。

    結論としては、THRESHの設定が音源定位の環境とマッチしていないということになります。

    こちらでMUSICパワーを確認したところ、
    SourceTrackerノードのTHRESHが測定されたパワーよりも高めに設定されていましたので、
    21~22程度に変更したところ定位結果が表示されるようになりました。

    精度よく定位させるためには、お使いの環境に応じてTHRESHを設定する必要がございます。
    判定に使用しているMUSICパワーはLocalizeMUSICノードで計算された結果ですので、
    実際の環境でどのようなパワーが出力されているかをDEBUG出力等で確認しながらの調整になるかと思います。
    LocalizeMUSICの出力を確認するには、こちらに記載してあるSPECTRUM端子を追加して、DEBUGをtrueに設定してください。

    参考までに、こちらで動作させた際のMUSICパワーを添付します。
    特に雑音のない状態で19~20程度、発話時のピークで22程度となっています。
    実際の環境では、周囲の雑音や定位させたい音声の大きさ等に左右されますのでご注意ください

    以上、よろしくお願いいたします。
    HARKサポート

    • This reply was modified 1 month, 1 week ago by Avatarnterakado.
    in reply to: RASP-ZXでの伝達関数測定 #1326
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    ご参照いただいた記述ですが、
    X_AXIS ( 単位 mm ) となっている箇所は誤記になります。
    誤解を招く表現をしてしまい、申し訳ありませんでした。

    また、伝達関数を添付いただいていますが、
    これだけでは定位しない原因はわかりかねます。
    差し障りがないようでしたら、
    使用した音源ファイルとネットワークファイルを添付いただければ、
    こちらでの検証も可能となります。

    以上、よろしくお願いいたします。
    HARKサポート

    • This reply was modified 1 month, 3 weeks ago by Avatarnterakado.
    in reply to: 音源定位が全くできない #1311
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    実際にどのようなスペクトルパワーが出力されているかを確認するために、
    以下をお願いできますでしょうか。

    1.LocalizeMUSICのパラメータ設定で、DEBUGをtrueに設定
    2.LocalizeMUSICに出力端子SPECTRUMを追加
     手順はこちらを参照ください
    3.SPECTRUM端子の出力をSaveVectorFramesノードで保存
    4.ネットワーク実行時に、発話して音源のある状況にする

    上記手順にて取得したスペクトルから、何が起こっているか解析できるかもしれません。

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: 変則的な伝達関数およびそれによる音源分離 #1302
    Avatarnterakado
    Moderator

    回答が遅くなり申し訳ありません。

    詳細はこちら2.2.1.2. Sound Source Positions XML に記載していますが、
    音源ファイルの名称については、特に制限はございません。
    音源ソース位置を記載したXMLファイル上で音源座標とファイルパスが紐づけられますので、
    そこでわかりやすい名称にしておくことが多いかと思います。

    その観点から申し上げれば、ご提示のファイル名で問題ありません。

    以上、よろしくお願いいたします。
    HARKサポート

    • This reply was modified 3 months, 1 week ago by Avatarnterakado.
    in reply to: 変則的な伝達関数およびそれによる音源分離 #1296
    Avatarnterakado
    Moderator

    回答が遅くなり申し訳ありません。。

    不動話者の分離が主目的で、その他の移動する話者を個別に分離する必要はないとの前提で簡単に回答いたします。

    回答1:可能です
    回答2:不動話者の位置だけでは、その他の話者の位置が話者1か話者2に引き込まれてしまいます。添付した図のように、不動話者の両脇でも測定してください。また、話者1と2は等距離が望ましいです。その他の話者が両脇に引き込まれ、不動話者と分離可能になります。ただし、その他の話者の音声を分離したい場合、測定位置の間隔はある程度広くても構いませんが全方向(360度)の測定が必要となります。
    回答3:下記手順にて音源座標ファイルを作成後、初期画面の「Sound source positions」の「Visualize」メニューで不要な音源座標を削除してください。

    https://www.hark.jp/document/packages/harktool5-gui-ja/harktool5-gui.html#create-source-label

    回答4:ConstantoLocaizaitonノードを使用して特定方向からの音源のみを対象とすることが可能です。

    以上となりますが、伝達関数の測定については他にも考慮すべき点が多々ありますので、
    実際に測定してみないと分からないというのが実情です。
    大変申し訳ございませんが、上記をご留意いただけますようお願いします。

    以上、よろしくお願いいたします。
    HARKサポート

    • This reply was modified 3 months, 3 weeks ago by Avatarnterakado.
    Attachments:
    in reply to: Win10でHARKインストールが進みません #1295
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    ユーザーからの入力を必要とするダイアログウィンドウが起動されておりませんでしょうか?
    起動されたウィンドウがバックグラウンドに隠れていて、
    入力待ち状態になっている可能性がございます。

    また、「Removing backup files」が表示されるとのことですが、
    以前のバージョンのHARKをインストールしていませんでしょうか?
    その場合、以前のバージョンをアンインストールしてから3.0.2.1をインストールしてください。

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: Debianでのインストール方法 #1293
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    Debianでインストールされたいとのことですが、
    リポジトリを登録することはお勧めいたしません。

    公開しているHARKのパッケージは、Ubuntuの公式パッケージに依存しておりますので
    apt updateにより、必要とするパッケージを更新しようとします。
    そうなると、安定性重視のDebianでは公式にサポートしていないバージョンに更新される可能性があります。

    また、debパッケージを直接ダウンロードしてインストールした場合も、
    依存パッケージのバージョンがUbuntuを想定しているため、Debian環境では動作しない場合がございます。

    確実なインストール方法としては、
    こちらよりソースコードをダウンロードしていただき、debuildコマンドを使用してコンパイルしていただく方法になります。
    その際、必要なパッケージについてはご自分でインストールもしくはビルドして頂くことになりますので、ご注意ください。

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: How to receive data from HarkDataStreamSender #1286
    Avatarnterakado
    Moderator

    表記が分かりづらく申し訳ありません。

    第3ビットはSRC_INFO入力端子が接続されていることを示します。
    第4ビットはSRC_WAVE入力端子が接続されていることを示しますが、先の投稿で引用したようにSRC_INFOが接続されていない場合、何も送信されないため SRC_INFOと併記しています。
    したがって、type=0x0cで問題ありません。

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: 音源までの距離推定について #1284
    Avatarnterakado
    Moderator

    LocalizeMUSICの出力は、角度に変換せずそのまま他ノードに入力されます。

    ただし、この時点ではIDが全て0になっているために他のノードで使用できません。
    そのため、LocalizeMUSICの出力は、SourceTrackerノードもしくはSourceTrackerPFノードに入力して、音源にIDを付与してから他ノードに入力するようにしてください。

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: 音源までの距離推定について #1282
    Avatarnterakado
    Moderator

    お問い合わせありがとうございます。

    過去に同様の投稿がございますので、
    ご参照いただければと思います。

    また、以下もご参考になるかと思いますので、一読いただければ幸いです。
    https://wp.hark.jp/forums/topic/ノードの作成方法について/#post-871

    以上、よろしくお願いいたします。
    HARKサポート

    in reply to: How to receive data from HarkDataStreamSender #1275
    Avatarnterakado
    Moderator

    回答が遅くなり、申し訳ありません。

    添付いただいたネットワーファイルですが、
    HarkDataStreamSenderノードのInput/Outputが適切に設定されていませんでした。

    詳細についてはこちらに記載してありますが、
    SRC_WAVEを入力する場合、SRC_INFOも入力する必要がございます。

    6.1.6.5
    SRC_WAVE, SRC_FFT, SRC_FEATURE, SRC_RELIABILITY の4つの入力端子については, 音源 ID ごとの情報になるため,SRC_INFO の情報が必須である. もし,SRC_INFO を接続せずに,上記4つの入力端子を接続したとしても,何も送信されない. その場合,type は2進数で 0000000000 となる.

    こちらで修正したネットワークファイルを添付しますので、
    ご参照いただければと思います。
    修正点は以下の通りです。
    HarkDataStreamSenderノードをMAIN_LOOPシートに移動
    ・sub_localizationシートの出力をHarkDataStreamSenderSRC_INFOに入力
    ・sub_separationシートの出力をHarkDataStreamSenderSRC_WAVEに入力
    HarkDataStreamSenderの出力端子を設定

    以上、よろしくお願いいたします。
    HARKサポート

    • This reply was modified 4 months ago by Avatarnterakado.
    • This reply was modified 4 months ago by Avatarnterakado.
    • This reply was modified 4 months ago by Avatarnterakado.
    • This reply was modified 4 months ago by Avatarnterakado.
    • This reply was modified 4 months ago by Avatarnterakado.
Viewing 15 posts - 1 through 15 (of 40 total)