すみませんm(_ _)m
完全に放置状態になってしまいました…
実は、最近こんなところに出入りするようになってしまいましてm(_ _)m
よろしければご覧くださいませ。
ここです(^^)
| 固定リンク
完全に放置状態になってしまいました…
実は、最近こんなところに出入りするようになってしまいましてm(_ _)m
よろしければご覧くださいませ。
ここです(^^)
| 固定リンク
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/148756/41170243
この記事へのトラックバック一覧です: すみませんm(_ _)m:
コメント
ひろりん様
お返事頂きありがとうございます!
アドバイス通り、いろいろ検証してみました。
まず、全くトレーニングをしていない物も含め、下記5種の比較をしてみました
12MB:トレーニングしてない
19MB:トレーニング1
54MB:トレーニング1+2
91MB:トレーニング1+2+3
127MB:トレーニング1+2+3+4
結論から申し上げると、ますます解らなくなってしまいました...
まず、ある程度の文章をマイクで喋り比較してみましたが
トレーニング量が多い物ほど、どんどん認識率が下がってしまいました。
喋るのが疲れてきてるのかと思い
トレーニング量が少ない物を試してみましたが
今度は、それらも認識率が下がってました。
この時点で、トレーニング量より、発声状況の影響の方がよっぽど大きいと気づきました。
次に、これでは比較にならないと思いボイスレコーダーを用い、同じ音声により試してみました
結果は、これも微妙でした。
まず、ボイスレコーダ、マイクの位置、音量、室内環境をまったく同じにしているはずなのに
トレーニング量が同じもの同士でも認識率が変わってくるのです。
たぶん、レコーダとマイクの距離や角度がmm単位とか変わってしまうからだと思いました。
実際、mm単位で変えると、本当に全然、別の文章になったりしてしまいます。
やはり、トレーニング量より、発声状況の影響の方が強いと更に実感しましたが
もう一つ、疑問が沸いてきました。
それは、各ユーザのフォルダサイズの変化です。
ドラゴンエディタやDNSの再起動の度に、データを保存するか問われますが
私は、必ず毎回、いいえを選択しています。
認識率を試しているだけなので、いちいち修正していないから
変なものを覚えさせたくないからです。
よって、ほとんどサイズは変わっていないと思っていましたが
これらを繰り返せば繰り返すだけ
毎回、いいえを選択しても、どんどんサイズは増えてしまっていました。
これは、その都度エクスポートしていた物を残し続けていますので、明らかです。
まず、下記のサイズは毎回増えています。
DragonSpeech\Users\***\current\標準_-_大\general.voc
あと、下記のフォルダが増えている場合もあります。
DragonSpeech\Users\***\current\drafiles\DRA34.dra
DragonSpeech\Users\***\current\drafiles.ini
素人目で気づく違いはコレ位であり、他は構造、サイズともに全く一緒でした。
つまり
いくら発声状況を同じにしても
上記のようにファイルやサイズがが増えてしまう事が、微妙に影響しているのだろうと思いました。
よって、完璧に同一のユーザ状況を試すべきと思い
エクスポートしたものを、更にインポートし試してみましたが
やはり微妙に出来る文章は違いました。
繰り返しになりますが
こんなことよりも、やはり発声状況の影響の方が強いらしいです。
まぁ当然と言えば当然なのですが...
DNSでは、インスコ時にも、何処ででもトレーニングが重要との情報がありますが
正直、全く実感できなくなってしまいました。
やはり、トレーニング量より、発声状況の影響の方が強いと更に実感しました
まったくトレーニングしてないものも、3時間近く発声トレーニングしたユーザも
認識率は殆ど変わらないので、正直、空しさを覚えました。
私見では、発声トレーニングより
ボキャブラリエディタの"つづり"や"入力音"の方が効果絶大だと感じました。
特に、この"入力音"が良いのかなぁと思っています。
(すべて、単なる素人考えなので、まったく自信はありませんが...)
ついでに言うと、ボキャブラリビルダで言うと
"文書の分析"だと一語づつ入力音を記入するのが面倒なので
"つづり":"入力音"をすべて記入したファイルを
"リストからの単語の追加"で読み込ませれば、一括でかなりの量を覚えさせられるので
現状は、コレが一番有効なのではないかと思っています。
つまり、このファイルに日常使う言葉をどんどん追加させて
定期的に"リストからの単語の追加"で読み込ませる事が
一番簡単にDNSを成長させる近道なのではないかと思うのです。
ちなみに、"リストからの単語の追加"の際にも"トレーニング"を行えますが
もうわざわざ行う"トレーニング"にはあまり信用がおけませんので
相当、余裕が無ければやるつもりはありません。
日常の音声筆記の際の誤変換を、きっちり正しく修正し、毎回覚えさせる事だけでも
かなりのトレーニングになると思うからです。
バックアップやエクスポートの使い分けや
上記に示した、サイズの肥大化に関し防止、解消する方法も気になりますが
これ以上、長文になるのも、毎回本当にご迷惑ですので
少し、時間を置いて、改めて質問をさせて頂きたく思います。
現段階での上記の考えも完全にあってるわけでは無いと思いますし
単なる"私の場合"って感じですが、
ひろりん様のおかげで
文章にしてみることにより、自分の考えがどんどん整理されてきていることには気づきました。
本当にありがとうございました。
また、後で質問させてくださいませ。m(_ _)m
投稿: ぽん | 2009年9月24日 (木) 04時11分
ぽんさま
認識速度の件ですが、せっかく4種作成したのであれば、それを使用して実際に比べてみてはいかがでしょうか?
ワタシのブログの内容は、全て自分で確かめたことと、長い経験から閃いたことの組み合わせです。
せっかく貴殿が閃いたのですから、あとは検証すれば答えは一発で出ると思います。
いかがですか?
投稿: ひろりん | 2009年9月24日 (木) 00時00分
先コメント中の1つめの質問についての補足がございました。
"どこかで、重くなるからトレーニング?はあまりしない方がいいような事を見たような、見なかったような記憶があるのです"についてですが
ヘルプ>パフォーマンスアシスト>"スリムなボキャブラリを使う"の欄の事でした。
これによると「入力音声の文字化において、Dragon NaturallySpeaking で検索するボキャブラリのサイズが小さいほど、処理速度は速くなります...」とあります。
これは、下記ひろりん様のブログでも記述があるとおりです。
http://andf.cocolog-nifty.com/nikki/2006/12/post_0012.html
まず、ここで、私が気になったのが、ボキャブラリサイズとは何か?ということです。
先コメントで私が記載したサイズとは
Users直下の各ユーザのフォルダのサイズであり
主にacarchive.nwvのサイズそのものでもあります。
また、ユーザ1~4は、acarchive.nwv以外は、ほとんど同サイズのファイルばかりですので
私の予想では
DragonSpeech\Users\各ユーザ\current
上記フォルダ直下の "標準_-_大"フォルダのサイズが
ボキャブラリサイズそのものなのではないか?と至りました。
何故なら1~4のボキャブラリエディタには、カスタマイズした語句は今現在は一つも無いからです
このカスタマイズした語句が増える=ボキャブラリサイズが増えるのは確かなのはわかりますが
私の一つ目の質問は
先コメントの1~4のユーザのサイズ、主にacarchive.nwvのサイズも
ボキャブラリサイズと同様に
処理速度と関係あるのかどうかと言う事です。
もし関係するのであれば、せっかく全4つのトレーニングを行いましたが
認識率の低下との兼ね合いでしょうが
一番小さいサイズのユーザで始める事も視野に入れております。
最後に
そもそも、私の考えていること自体が、本来のDNSの成長度合いに関して
取るに足らない程の小さいことなのかどうかも気になります。
つまり、はじめのトレーニングなどは、どうでもよく
ボキャブラリエディタの"つづり"と"入力音"が
自分の環境にそくしていればいるだけ認識率が上がり
音声でのトレーニングも、はじめのトレーニングより
後から追加するトレーニングの方が重要なのではないか等...
また、認識率の向上と処理速度の関係まで考えると
やはり"ええ加減"で考えないときりがなさそうな気もしてます
ひろりん様も最初、私のような考えを持たれなかったのか気になります。
私がおかしいのでしょうか...
他に聞ける方もおりませんが
ひろりん様ほどのお詳しい方であれば、何かしらのお考えをお持ちではなかろうか
との想いで、今に至っておりります。
誠に勝手ながら
なにとぞ、よろしくお願い致します。m(_ _)m
ぽん
OS:XP SP3
バージョン:DNS2005 Select 7.00.400.379
投稿: ぽん | 2009年9月23日 (水) 03時52分
お返事、どうもありがとうございます!
すごく嬉しいです。
一人で、本当に心細い状態でした。
ちょうど一年前に購入し、諦めてたのですが
ここ2,3日で、またやりだしてるところです。
ひろりんさんや、いろいろなブログ等を拝見し
どうしても諦めきれなくなったのです
なんとか、使いこなしたい一心です!
昨日はかなりショボっていましたが
今日は、ユーザの新規作成>音量CH>音質CH>読み合せ>ライティングスタイル学習>トレーニングの追加(全4種類)をやりきりました!
出来るところからやっていこうと思いました
実は、ひろりんさんに2つほど質問があります
まず、インストールディレクトリのUsersに、念のため、4種類のユーザーを作成しました
トレーニングの各1、2、3、4作成と同時に作ってみました
なぜなら、トレーニングが4種類ありましたが、全部やったほうがいいのかどうかわからなかったからです。
1 18.9MB 題名:音声認識の基本
2 54.3MB 題名:アウトドアベーシック
3 91.8MB 題名:本の未来?
4 127MB 題名:野口教授の...
どこかで、重くなるからトレーニング?はあまりしない方がいいような事を見たような、見なかったような記憶があるのです。
1つ終わった位の18.9MB位のユーザを成長させていった方が良いのか
4つ終わった127MBのユーザを育てるべきなのか教えてくださいませ!
もう一つの質問は
エクスポートとバックアップはどう使い分けたらよいのでしょうか?
・バックアップ
オプションでバックアップ場所が指定可能なのでバックアップ作業が簡単
backupとbackup2フォルダって構造
・エクスポート
場所の指定が必要だが、本体のUsersとそっくりな構造
自分なりには、上記位しか気づかなかったのですが
エクスポートの場合、新PCへDNSをインスコした直後でも、ユーザをインポート出来そうですが
バックアップからは復元不可の気もします。
現状は、データがなくなったら怖いので、各段階でエクスポートをちょいちょい作っていこうと思っていますが
バックアップの存在理由って何なんでしょうか?
お忙しいでしょうから、お時間があるときにでも、本当に簡単な感じでいいので、どうか教えてくださいませ。m(_ _)m
DNSマスターになりたい!です!
投稿: ぽん | 2009年9月23日 (水) 01時24分
ぽんさん
はじめまして、コメントありがとうございます(^^)
あの…無理して使わなければいいのではありませんか?
ワタシは必要なときに必要な環境で、自分の使い方にあった方法で使っています。
無理だったり、あわないと思うのでしたら、無理をしない方がストレスがたまりませんよ(^^)
投稿: ひろりん | 2009年9月23日 (水) 00時09分
はじめまして
ドラゴンスピーチ絡みでたどり着かせてもらいました
最近使ってますか?
なんだか、ぜんぜんやってることに自信がなくて
正直、私の場合、もうショボりそうです...
もう、いっその事、このソフトの存在自体を
すっからかんに忘れてしまおうかなんて考えてもいます。
やる気は十分なのに
空回りしすぎて
何が何だか、ぜんぜんわからんのです...
そこで、いっそ
ひろりんさんのような方から
「しばらく使ってたが、今はもう全然使ってないよ」
なんて聞けたら、諦められるのに
なんて思っています。
正直なところ、今でも使っていますか?
また、今後はどうですか?
藁にもすがる思いで
質問させて頂いております。
どうか、教えてくださいませ。
投稿: ぽん | 2009年9月21日 (月) 21時34分
N~jȂ猩鏗̃Aw܂ւ[(*LtM*)n@n@
}~R܂r߂璴őqNqNĂ悗
ςN~j͂[H
Ȃ݂ɍ̏̓iJoĂSRCÂĂȂ@oJX
http://ketsu.arctries.com/21hj-us/
投稿: N~j}X^[IIIII | 2009年9月 9日 (水) 04時06分