ドラゴンスピーチを買ってみた
入力速度を考えればキー入力より音声認識の方が圧倒的に早いはずだ。
そこで、音声認識入力ソフトで認識率が1番高そうであったドラゴンスピーチを購入してみた。
購入したのは、ダブルマイク版。ヘッドセットは使いにくそうなので、卓上マイクが同梱されているものにした。
とりあえず購入して、トレーニングをしばらくやってみて、認識精度を見てみたものの、卓上マイクではノイズが多く認識率があまり上がらない模様だった。
そこでヘッドセットに替えてみると、オーディオテストのノイズレベルの判定が明らかに改善した。
やはり、卓上マイクでは口との距離があるためにノイズが乗り出しのかもしれない。
机の上にあることでPCの振動などによるノイズも多いのかも。
登録されてない単語については、ほとんど認識を失敗する。
しかし、それ以外についてはなかなかの精度で判定し、認識速度もかなり良い感じ。
3、4年前にIBMのViaVoiceを試した時には、精度がイマイチでとても使えないと思ったものだったけど、ドラゴンスピーチのレベルであれば実用になるかもしれない。
というわけで、この記事は、ドラゴンスピーチによる音声入力で書いていました。
ただ、欠点としては、句読点の種類を選べないことと、対応しているソフトに限りがあり、MSNメッセンジャーでは、まったく入力できないようだ。
CHOCOAでも、修正コマンドに1部制限があったりして、実用的に使うにはちょっと厳しいかもしれない。
認識精度をこれで高いので、対応ソフトが少ないのはかなり残念。
喋らなければいけないので使える場面は限られそうだけど、今後もっと進化していくとキーボード入力の代わりとして主流になる可能性もあるかもしれないと思った。
まだ学習が少ないせいかそれなりに誤判定があるものの、少し鍛えれば便利に使えるかも。
The comments to this entry are closed.
Comments
机上マイクですと、「マイクとの距離が一定に保てないので入力レベルが安定しない」とか「マイクの真正面から発声してしまい、ブレスノイズが乗る」という問題があるはず…で、ヘッドセットの方が有利らしいです。
ボイスチャットでもその辺は同じらしく、聞き手の事を考えると(それが人か機械かによらず)ヘッドセットタイプの方が良いと思います。
うちでは東芝ノートについてきたLaLa Voiceを使ってみたことがありますが、やっぱりアレもダメです。使い物になりませんでした。
ドラゴンスピーチですか、乗り換え版で\9,030円…微妙な額かも。
ところで、そちらの環境ですとどのくらいの速度で入力可能でしょうか。
Posted by: かえで(yfi) | Monday, June 20, 2005 10:50 AM
こんにちは。
私も机上マイクは明らかに認識率が下がると思います。
音声認識は、登録されてない単語があると、急にやる気がなくなってしまいますね。
そこをがんばって学習させられるかどうかが重要だと思います。
音声認識のブログやってます。
Posted by: hiro@音声認識 | Monday, June 20, 2005 10:37 PM
To かえでさん
やはりヘッドセットがいいのですね...
スピードですが,動画を撮ってみました.
こんな感じです.
http://www.mikage.to/~mikage/tmp/dragonspeech.wmv
途中,ダイアログがみえないですが,音声入力で修正内容をいれています.
単語の選択なども音声でできるのですが,マウスの方が速いので,選択はマウスで行って,その後「修正」と言って直してます.
To hiroさん
購入前にブログ拝見させていただいておりました.
IMEと同じで,ある程度鍛えないとだめそうですね.誤変換と違い,誤認識はインパクトが大きいので,やる気への影響も大きそうですね.
Posted by: みかげ | Tuesday, June 21, 2005 12:29 AM
動画を撮影いただきありがとうございます!
うーん、私から見ると十分に速いですね…漢かな混じりで80文字/分というと、私が普段考えつつ打っている速度よりも速いです(^^;。
しかも誤謬修正が一通りマウスで済むとなると、携帯電話の予測入力と同じで「一般ウケ」はかなり良さそうです。
細かな操作がPCライクな点は気になりますが、この辺のインタフェースが練られれば、もっと「初心者にも優しい」いい製品になるのではないかな…という気がしました。
しかし、「恥ずかしいので」に接続しての「温泉入れませんが(音声は入れませんが)」や、「速度緩和(速度感は)」、「最高制度(精度)設計」…って、今回の例ではほとんどが「音声誤認」ではなく「誤変換」なのが興味深いですね。
昔のVoiceATOKではありませんが、こんどはドラゴンスピーチと共にやって欲しい気がしてきました…そちらのテキストを素で打ち直したところ、ATOKでの誤変換はゼロでしたから、両者をきちんと融合させれば、かなりの変換精度向上が期待できる気がします。
現状ですと、訂正候補が多すぎて「入力半分、修正半分」という感じでしょうか?普段のキー入力とはだいぶ違ったタイミングですよね…自分のところでも追試してみたくなりました(^^;)。
Posted by: かえで(yfi) | Tuesday, June 21, 2005 02:25 PM
確かに誤変換は多いですね.
速い/早い,などは前後を見て直してくれるのですが,全体的に見てATOKのようにはいってない感じですね...
誤変換の選択はマウスでもできますが,その後「修正」と発音する必要はあります.
候補になければ音声認識で入れ直すか,キーボードから入れてしまうかですね.
修正にかなり時間がかかる,ということは逆に考えれば精度をあけられればかなり速くなる,ということですしね.
もう少し鍛えてみるつもりです.
% 今日は風邪で喉が痛いのでキーボードです.
Posted by: みかげ | Thursday, June 23, 2005 10:18 PM