« ドラゴンスピーチの認識率の上げ方(ボキャブラリエディタについて) | トップページ | ドラゴンスピーチの認識率の上げ方(音響モデルの最適化について) »

ドラゴンスピーチの認識率の上げ方(ボキャブラリビルダー編)

さて、今回はhiroさんのブログ「音声認識ソフト ドラゴンスピーチ」で紹介されていたボキャブラリビルダーについて、書いてみたいと思います。

まず、率直な感想です。「すばらしい\(^o^)/」…これにつきます。hiroさんありがとうございます。

この「ボキャブラリビルダー」は以前紹介した、ドラゴンバーから「ツール」→「認識率向上センター」→「文書からの単語の追加」でできる単語の追加と、言語モデルの最適化を行うツールです。

「ボキャブラリビルダー」の使い方ですが、まずドラゴンスピーチを立ち上げます。
他のツールはドラゴンバーのメニューにあるのですが、「ボキャブラリビルダー」はメニューにはでていません。

ではどのように立ち上げるのかというと、Windowsの「メニュー」→「ファイル名を指定して実行」に、これ→"C:\Program Files\Dragon\DragonSpeech\Program\vocbldr.exe"をコピー&ペーストして立ち上げます。(ここをクリックしてもたちあがるはず…)(…と思ったら、今のIEは、ウィルス対策でブラウザ上から直接プログラムを立ち上げることはできない仕様に変更になったの忘れてました。ウィルスのお蔭で便利な機能がどんどん潰されていく…(T.T))

ただしこのパスはドラゴンスピーチを普通にインストールした場合です。インストールの際に独自のフォルダを指定した場合はそのフォルダ内で「vocbldr.exe」を探すか、「メニュー」→「検索」→「ファイルやフォルダ」で「ファイルまたはフォルダの名前」に「vocbldr.exe」を入力して「検索開始」をクリックしてください。
表示されたアイコンをダブルクリックして立ち上げるか、右クリックでドラッグし、任意の場所で「ショートカットをここに作成」でショートカットアイコンを作ることもできます。
(ここらへんの一連の動作は「Windowsの便利な使い方教室」ですね)

「ボキャブラリビルダー」が立ち上がったら、「ようこそ」の画面で「次へ」をクリック。
「リストからの単語の追加」は今回は必要ないので「次へ」をクリック。
「文書の分析」で「追加」をクリックし、分析させたいテキストファイルを指定し「文書の分析」をクリック。
「お待ちください」の表示がでますので、分析が終わるのを待ち「次へ」をクリック。
「ボキャブラリの学習」で、ここが重要ですが「詳細表示」をクリック
まだ登録されていない語句が一覧表示されますので、登録する語句をひとつクリックして反転し「編集」をクリックします。
すると、登録する語句の「つづり」だけではなく「入力音(読み)」も同時に登録することができます。
これが「文書からの単語の追加」にはない、たいへん優れた機能です。
順次「編集」で「入力音」を入れていきます。

また一覧表示されている語句の中で登録の必要がない語句はチェックボックスをクリアします。
その際、一覧を見て、クリアする語句の方が多いなぁと思えば、先に「すべてクリア」をクリックして、いったんすべてクリアし、必要な語句にチェックをつけた方が楽に作業を進めることができます。
これも「文書からの単語の追加」にはない、優れた機能です。

登録する語句を選択し、その語句に「編集」で「入力音」を入れたら「OK」をクリックし更に「次へ」をクリック。
「文章スタイルの再構成」で「次へ」をクリック。
「完了」で最後の確認をされたら「はい」をクリックします。

これで、その文章に含まれる語句が「アクティブボキャブラリ」に登録され、更に「バックアップ辞書」にもなかった語句は「入力音(読み)」とともに登録することができました。さらに語句の使い方、文章の傾向も学習され、そのユーザーの要望により近い「認識・変換」ができるようになります。

この「ボキャブラリビルダー」は「文書からの単語の追加」と比べ、とても視覚的にも、メニュー的にも使いやすい感じがします。
ぜひ皆さんも使ってみてください(^。^)

こんな素晴らしいツールがなぜ、メニューから外れているのでしょうね。
制作者は気に入っていたのに、上に反対されてしまい、泣く泣く内緒でしのばせたのかな?

|

« ドラゴンスピーチの認識率の上げ方(ボキャブラリエディタについて) | トップページ | ドラゴンスピーチの認識率の上げ方(音響モデルの最適化について) »

コメント

ひろりんさん、ご心配をおかけしまして申し訳ありません。

早速、修正してみました。

こんな感じでは、いかがでしょうか。

投稿: 井上秀喜 | 2007年1月 7日 (日) 21時39分

いのっちさんへ

修正ご苦労様です。
しかしながら、四角い枠で囲った中に私の文章がありますと、私がそのようにまとめて書いたような印象を受けまし、私の書いた文章の約6割がそのまま記載されております。

法的なことは全くの無知ですので、実際はまったく問題ないことなのかもしれませんが、実は、私があまりいい気が致しておりません。

あぁ、とても心が狭いのだなぁと、かなり自己嫌悪になっておりますが、URLの紹介だけにしてはいただけませんでしょうか。

ネットの世界では、実際に書籍を探さなくても、「クリックひとつ」ですぐに該当ページを参照できますので、それでよいのではないかと私自身は思っております。

御理解いただけますと幸いです。

投稿: ひろりん | 2007年1月 7日 (日) 20時15分

ひろりんさん、早速のアドバイスありがとうございました。

ひろりんさんの記事を抜粋する形に編集してみました。この形ではいかがでしょうか。

投稿: いのっち | 2007年1月 6日 (土) 22時57分

いのっちさん

大変よくまとめられておりますね。

ただ、ちょっと気になるのが、私の記事の「転載」です。
「引用」ではなく、丸ごと「転載」のように感じるのは、私の思い過ごしでしょうか?

参考URL
http://www.geocities.jp/smile03yi/quotation.html

投稿: ひろりん | 2007年1月 6日 (土) 21時24分

ひろりんさんのボキャブラリビルダーの活用法を応用して、単語リストからの登録方法をまとめてみました。

ドラゴンスピーチ(音声認識)のススメ
http://www.geocities.jp/ino_hideki55/dragonspeech.htm

お読みいただき、アドバイスをいただければ、ありがたいです。

投稿: いのっち | 2007年1月 6日 (土) 17時34分

hiro@音声認識 さん

いつもコメントありがとうございます。
私の方こそ、いつも参考にさせていただいております。
これからもよろしくお願いします。

投稿: ひろりん | 2005年11月28日 (月) 08時40分

こんばんは。記事、わかりやすくて、説明が丁寧で、すばらしいですね。
「とりあえず試しに全部使ってみて、自分に合うものを使えばよいんじゃないでしょうか。」などどいう私のサイトのなげやりな態度と大違いです(汗)。

ひろりんさんの記事で、きっと私の知らない便利な使い方とかあると思いますので、これからも、楽しみにしています。

投稿: hiro@音声認識 | 2005年11月26日 (土) 00時22分

success_unoさん、書き込みありがとうございます

普通は、手作業で修正してしまいますよね。
でもそれで認識率はあがらないなんて、気がつきませんよね。

上手にドラゴンスピーチとつき合ってみてください。
これからも、よろしくお願いします。

投稿: ひろりん | 2005年11月21日 (月) 08時31分

ドラゴンスピーチの認識率の上げ方を読んで、感動しました。

このソフトを1年ほど使っているのですが、使い方は、言葉をまず入力
そして変換、その後、手作業で訂正をしていました。

今は、ICレコーダーの音声データを文書化しようとしていますので、
認識率を上げることは重要だと思っています。

また、訪問させていただきます。ありがとうございました。

投稿: success_uno | 2005年11月20日 (日) 11時17分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/148756/7065059

この記事へのトラックバック一覧です: ドラゴンスピーチの認識率の上げ方(ボキャブラリビルダー編):

« ドラゴンスピーチの認識率の上げ方(ボキャブラリエディタについて) | トップページ | ドラゴンスピーチの認識率の上げ方(音響モデルの最適化について) »