HARK FORUM › KaldiDecoder(v2.4.0)で認識結果が返って来ない
KaldiDecoder(v2.4.0)の動作で質問があります。
Ubuntu14.04をクリーン・インストールした直後に、 apt-get installでHARK 2.4.0の各パッケージをインストールしました。 その上で、HARKのウェブページからダウンロードした、 HARK_recog_2.3.0.1_practice2.zipを使用して動作の確認をしたのですが、 音声認識結果(sentence)が返って来ません。 なお、scoreは内容が存在するため、デコーダ自体は動作しているように見えます。
実行環境は下記の通りです、またデコーダのログを添付します。 OS: Ubuntu14.04×64 CPU: i7-3740QM(2.70GHz×4コア) ※ノートパソコン メモリ: 8GB ※確認したPCには、HARK以外のアプリをまだ入れていません。
ちなみに、sourceからビルドを試してみたが、同じくsentenceは表示されませんでした。
何かしらの情報をご教示いただけると助かります。 以上、よろしくお願いいたします。
添付ファイルですが、 Upload Errors: kaldidecorder.log: Sorry, this file type is not permitted for security reasons. と表示されております。 おそらく、拡張子 “.log” が許可されていないと思われますので、お手数ですが “.txt” に変更して再度アップロードしていただけますでしょうか? なお、ファイルのMax Size は512KBです。
質問の内容に関しては、別途返信いたします。
お問い合わせ、ありがとう御座います。
こちらの環境でも同様な条件で確認させて頂きましたところ 負荷が高くなる環境では同様の事象が発生する事を確認致しました。
次期バージョンで修正を予定しておりますが ご提供までに暫く掛かってしまいますので ワークアラウンドをご紹介させて頂きます。
HARKの特徴量送信ノードSpeechRecognitionSMNClientを SpeechRecognitionClientに置き換えて頂く事で 同じPC環境でも認識結果を得られる事を確認しております。
SpeechRecognitionSMNClientではSMN処理を行うために 定位結果の該当発話区間における特徴量を一度バッファし、 SMN処理後に一気に送信する処理を行っております。 一方SpeechRecognitionClientではフレーム毎に特徴量を 送信しており、KaldiDecoderの負荷が分散します。
次期バージョンのリリースまでの期間、 こちらのワークアラウンドにて対応をお願い致します。 お手数をお掛けしてしまいますが宜しくお願い致します。
以上、ご確認のほど宜しくお願い致します。 瀧ヶ平
mfukuda様。
返信ありがとうございます。
添付ファイルの拡張子を”.txt”に変更して、アップロードいたします。
瀧ヶ平様。
回避策のご教示ありがとうございます。 早速試させていただき、動作することを確認いたしました。
>負荷が高くなる環境では同様の事象が発生する事を確認致しました。
パッケージの動作確認をされていると思うのですが、 KaldiDecoderが正常に動作する構成の基準(Ubuntuのバージョン、CPU、メモリ、など) があるようでしたらご教示いただけると助かります。
次期バージョンで修正とのことですので、 いつになるのかわかりませんが(1年後の来年12月になるのでしょうか。。。) それまではご提示の回避策で対応させていただきたいと思います。
最小構成ではありませんが、私が動作している事を確認出来ているPC環境について記載させて頂きます。
OS : Ubuntu 16.04.03 CPU : Intel Core i7-7700@3.60GHz [Turbo Boost:4.2GHz], 4 cores(8 threads) Mem : 64GB
以上、宜しくお願い致します。 瀧ヶ平
瀧ヶ平様
PC環境のご教示ありがとうございます。 ネットワーク越しだと動作するのかもしれないですね。
送信側のノードのsleep値を増やして確認したところ、 sentenceが表示されるようになりました。
KaldiDecorderの次期バージョンの修正を期待したいと思います。
SENTENCCEが表示されない件、kadidecoderの不具合を修正しました。 kaldidecoder-hark_2.4.1-openblas になります。
以上、よろしくお願いします。
Log In