« 喫煙モラル向上サイト | Main | 職場の喫煙問題 »

Sunday, August 21, 2005

音声入力のインターフェイス

音声認識ソフトに改善を望む点へのコメント

みかログさんの「音声認識」という記事で、音声認識で不満を感じるのは、誤認識時の修正のユーザインターフェースに問題がある点だと書かれていましたが、私も同感ではあるものの、ドラゴンスピーチの修正機能は現状でも意外と良く考えられたインターフェイスだと感じます。これ以上良いインターフェイスとは、なかなか難しい。

わたしはかなり非効率なインターフェイスと感じています.

キーボード入力と違い,音声入力は違った特性があります.

・音声入力は誤判定が起こることを予測できず,誤判定の率がかたり高い.
 キーボード入力では一度変換した単語なら,前回と同じ結果になることが予想できます.
 従って,誤判定の予測がある程度つきます.
 しかし,音声入力ではそういった予想がつぎません.
 その上,誤判定の確率もかなり高くなります.

・音声入力の誤判定はキーボード入力と違い誤判定内容が予測できない.
 キーボードなら,同音異義語の間違いのみです.
 音声入力では,音そのものが異なったり,文字が抜ける・余分に入るといったことがよく起きます.

・音声入力は判定があるまでにタイムラグがある.
 キーボードなら,変換キーを押せば,最近のPCなら即座に結果を返します.
 音声入力では,結果がでるまでにタイムラグがあります.
 このため,音声入力では一度に長い文章を入力する傾向が強くなります.

この特性が考慮されてないように思います.

音声入力等のために,IMEの出来ることが拡張され,確定文字列に対しても付随する情報を記録しておき,後から利用できるようになっています.
これを何も考えずに利用しているだけに思えてしまいます.

次のように改良したら使いやすくはならないでしょうか?

・認識した文字列はいったん未確定状態とします.(キーボードでかな入力中のように)

・未確定状態の文字列は,変換候補を常に表示し,文節変換,文節再入力を容易に出来るようにします.
 画面イメージは以下のような感じです.
 一定数を上限として画面に変換候補を一度にだしてしまいます.


 ▼ □ ▼ □ ▼    □     ○
  音声 入力の インターフェイス
  温水 入力 
     入浴の

 - 変換候補をクリックするとそれが採用され,位置が入れ替わります.
 - ▼をドラッグすると文節変換の位置が変わります.
 - ▼を右クリックするとその文節区切りは無くなり前後がつながります.
 - 文字列上で右クリックすると,その場所で文節が分かれます.
 - ○をクリックすると,文章を確定します.
 - □をクリックすると,その単語を差し替えるためのダイアログが開きます.
  そこで音声入力で入力するか,キーボードで入力するか,画面に表示しきれなかった候補から選択します.
  ここでの訂正内容は自動学習します.

この方法であれば,確定済みの文章に情報を結びつける必要が無くなるので,対応ソフトは大幅に増えるはずです.
また,メモリ消費なども減るので,レスポンスの改善も期待できます.

頻繁に行う修正には,コストの高い操作は向きません.
「修正」と発声したり,小さい文字を正確にドラッグする操作はコストがかなり高く付くと思います.

「現状のインターフェイスの改善と言う点で言えば、マウス操作だけで文字入力の修正ができるように」とかかれているので,たぶん同じようなものを想像はされているのではと思いますが...
コレが出来るのと出来ないのではかなり大きな違いがあるように感じます.

あとは,まだまだ動作速度が遅いので,そこの改善でしょうか.
特にViaVoiceは修正時によく固まったようになります.
(PCのスペックはよい方なのですが...)


ともあれ,とりあえず何らかの形で進化はつづけてほしいですね.
ここで終わってしまうのは残念です.

ドラゴンスピーチ8がでるとよいのですが...

|

« 喫煙モラル向上サイト | Main | 職場の喫煙問題 »

Comments

はじめまして
ドラゴンスピーチは、鍛えれば鍛えるほど賢くなるかわいいやつです。
どんどん使ってあげてくださいね。
うちのブログに、鍛え方を書き込んでますので、よろしければのぞきに来てやってください。
では

Posted by: ひろりん | Thursday, December 01, 2005 12:28 PM

最近はあまり文章入力することが無くて,出番が無かったりします(^^;
そろそろ次バージョンとかでないんですかねえ.(エンジン自体の改良付きで)

Posted by: みかげ | Tuesday, December 06, 2005 11:30 PM

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack


Listed below are links to weblogs that reference 音声入力のインターフェイス:

» 音声入力のインターフェイス [音声認識ソフト ドラゴンスピーチ]
 「みかログ」さんのところで「音声入力のインターフェイス」という記事で、効率的な音声入力のインターフェイルについて(認識した文字列を未確定状態として常に複数表示される候補語句を選択して確定する)の提案がされていました。  音声認識ソフトへの期待としては... [Read More]

Tracked on Thursday, August 25, 2005 09:20 PM

« 喫煙モラル向上サイト | Main | 職場の喫煙問題 »