« ドラゴンスピーチの認識率の上げ方(ボキャブラリビルダー編) | トップページ | ドラゴンスピーチのオプション設定ついて(その1) »

ドラゴンスピーチの認識率の上げ方(音響モデルの最適化について)

ドラゴンスピーチの鍛えはだいぶ進みましたか?
「クイック修正」や「修正ダイアログボックス」を使って誤認識・誤変換を修正していくことにより、実際の使用頻度の高い語句が「アクティブボキャブラリ」に登録されますし、またユーザーの語句の使い方の特徴も学習されます。このようにして「辞書」の面が充実することにより、認識率・変換率がだいぶ向上してきたことと思います。

また以前紹介した「トレーニングの追加」では、ユーザーの声の特徴を登録させることができますので、「音響」の面からも認識率を高めることができます。
しかしこの「トレーニングの追加」は、ユーザーの声の全般的な特徴を登録させるものなので、特定の語句の発声・発音にユーザーの特徴がある場合、その語句の正しい認識・変換は難しいのです。
さらに「トレーニングの追加」の文章に出てこない語句は、実際に読みあげて登録しているわけではないので、正しい認識・変換は余計に困難になります。

そこで今回は、ユーザー特有の声の特徴を登録して、認識・変換率を高めてみましょう。
でも、そのために特別なことをする必要はありません。誰にでも簡単にできます。

実はドラゴンスピーチは、「クイック修正」や「修正ダイアログボックス」を使って修正した際には、その語句とユーザーの声(発声・発音)の特徴を、自動的に蓄積しているのです。
その蓄積された情報を、ユーザーファイルに登録すればよいのです。

方法は簡単です。
「ドラゴンバー」から「ツール」→「認識率向上センター」→「音響モデルの最適化」をクリックし、「音響モデルの最適化」ダイアログボックスで「実行」をクリックするだけです。
あとはドラゴンスピーチが蓄積された声の特徴を解析し、ユーザーファイルに登録し更新してくれます。

ただし、これにはかなりの時間がかかります。パソコンのスペック(プロセッサの速度やメモリーの容量)や蓄積された情報の量にもよりますが、10数分から1時間ほどかかります。また他のアプリと同時に使用すると更に時間がかかってしまいますので、他の作業のない時、例えば夜中などに行うのがよいと思います。
「認識率向上センター」→「スケジュール設定(音響モデルの最適化)」で、日時を指定して自動的に開始することもできます。至れり尽くせりですね(^。^)

情報の蓄積量が少ないときに「音響モデルの最適化」を行っても、満足のいく状況は期待できません。
ドラゴンスピーチを使い始めの頃は、一日の使用時間にもよりますが2週間ほど使用し修正していくと、十分な情報が蓄積されるようです。
すでにそれくらい経過している方は、ぜひ一度「音響モデルの最適化」を実行してみてください。
また、2度目以降は1ヶ月に1回程度をめどに実行するのが良いようです。

このように、ドラゴンスピーチはあらゆる面から認識・変換率の向上が為されるように作られています。実にすばらしいソフト(アプリ)だと感心しています。

しかし、あくまで個人的な感想ですが、その仕組みを十分に理解し、認識・変換率を効率的に向上させているユーザーは少ないのではないかと感じます。
マニュアルには、そのあたりがもっとわかりやすく書かれているといいのになぁと思います。
インストールして使えばすぐに「ほにゃらら%の認識率」が出るものと勘違いしやすいですよね。
自分のイメージと掛け離れた結果しか出ないアプリは、たいがいのユーザーはすぐに手放してしまいますよね。
鍛え上げる「手間」と「時間」が必要であることを納得して使えば、とても便利で良いアプリだと思います。
その点をわかりやすく書いておけば、もっとユーザーを取り込めるように思いますし、ユーザーの満足度も格段に上がることと思います。

なお、ドラゴンスピーチ(に限らずすべてのアプリ)は、ある意味ブラックボックスです。中の仕組みはわかりません。ですから今回の書き込みに限らず、これまでの書き込み、及びこれ以降の書き込みも、あくまで私個人がアプリを使用してみて、その体験から感じたことや、体験の中からブラックボックスの中身を推測して書き込んでいます。
もちろん「ウソ」や「でまかせ」は書いていないつもりですが、体験上からの推測の範疇を越えるものではありませんことを御理解ください。
ですから実際の仕組みとは違う部分もたくさんあることと思います。大目に見てやってくださいますようお願いいたします。

さあ、みんなでどんどん使って、どんどん認識率を上げて、どんどん利用しましょう\(^o^)/
もっともっとドラゴンスピーチユーザーが増えますように(^。^)

|

« ドラゴンスピーチの認識率の上げ方(ボキャブラリビルダー編) | トップページ | ドラゴンスピーチのオプション設定ついて(その1) »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/148756/7243916

この記事へのトラックバック一覧です: ドラゴンスピーチの認識率の上げ方(音響モデルの最適化について):

« ドラゴンスピーチの認識率の上げ方(ボキャブラリビルダー編) | トップページ | ドラゴンスピーチのオプション設定ついて(その1) »