« ViaVoice & VoiceATOK | Main | 評価結果の見方 »

Thursday, July 28, 2005

音声入力

明日は~~どぉっちだぁ~~♪ (再び音声入力を考える)へのコメント

>途中から音声入力と音声会話がごっちゃになっていないだろうか?    いや、何十回も推敲しているのですから「わざとごっちゃにしている」んです!    つまり、発声という作業が気心の知れた相手とするか、仕事など必要上どうしても  会話しなくてはならない状況以外では、やる気にならないほど面倒だと言うことです。 

わたしはそうは感じていないので,人によって違うのでしょうね.
機械に対して発声するのが面倒というのが理解できません.

発声することのどこに面倒くささを感じるのかが違うのかもしれませんね.
わたしは対人が面倒と感じる方なので...

もしみんなが発声自体が面倒と思っているならば,カラオケなんて流行らないはずです.
音楽を聴いて,思わず歌詞を口ずさむ行為などもありますが,このような行為も説明がつかなくなります.

少なくとも,発声に対して,そこまで面倒と思う人はそう多くないのではと考えます.


だって、打鍵なんてチンパンジーでも言葉が分かれば、大きめのキーボードを 
与えればできそうなくらい粗雑な作業で、人間が数十万年とか前から持っていた 
能力できっと十分なんです。 

キーが10個程度なら出来るかもしれませんが,1つの指に4~10個のキーを割り当てて,タッチタイプするのは無理でしょう.

キーボードをタッチタイピングすることも,それなりに大変ですよね.
出来ない人が多くいることがそのことを証明しています.

難しいからこそ、赤ちゃんの最初の仕事は「音声母語の獲得」になっていて、  それで人類は繁栄できたのです。  つまり、音声言語の習得を本能にする必要があるほど発声は難しいものなんです。 
 

音声によるコミュニケーションが無ければ生きていけないからでしょう.
本能にしているのは,発声が難しいからではなく,生存に必要だからです.

キーボードが打てなくても生きていけますし,タイピングは生物的な生存とは関係がありません.

実際、留守番電話などは出力も音声ですが、それとは関係なく  不特定の他人に向けて機械相手にやるのですから、十秒の  メッセージでも入れるのは面倒でたまらなかった経験は誰にでも  あるでしょう。 

留守電を聞くのは人間です.
したがって,気を遣いますし,相手のリアクションがすぐ聞けず,時間制限もあるので面倒なのです.
間に機械が入るのは関係ありませんし,出力がテキストの音声入力の否定材料にはなりません.

では、その頃のIMEよりははるかに優れている今売っている音声入力が  普及しない理由は何でしょう? 
 

アプリケーションとして使いやすくないからでしょう.
使ってみればわかりますが,まだまだ完成度が低すぎます.

入力作業は長時間にわたってすることですから,この辺のできの悪さはストレスに直結します.
ドラゴンスピーチとViaVoiceの両方を試しましたが,一番ストレスがたまるのが修正のしにくさです.
ここがもっと使いやすくなれば,今の精度でももう少し普及すると思いますけどね.
(それなりに認知度を高める必要はありますが)

実用で使う気が起きない原因はまずそこにあると思っています.
ここが直って,認識精度も高いのに普及しなければ,発声が問題と言えるのでしょうが...

そのころのIME...というのがよくわかりませんが,ATOK6とか7の時代でも,修正などにストレスを感じることはありませんでした.
なので,今の音声入力はまだまだこれからでしょう....


今のユーザーが,なぜ音声入力を使いたくないと判断したか,その理由はどこでしょう?
一度使ってみればわかると思いますが,入力自体は非常に速くできますよ.
誤認識や,修正のやりにくさが利用されない原因でしょう.

これが快適になったら,いかに便利か...という夢はあると感じます.


同じことを大組織ができないはずがありません。それができないのは、 
五体満足な人で毎日数時間入力するほど言いたいことや書く必要がある 
人で、音声入力に乗り換えようとする人が見つからないからでしょう。 

ブログなんて最近出た媒体ですし,大企業がブログを書かせるというのも変な話です.
できないのではなく,やらないだけでしょう.


つまり、出力が音声であろうとテキストであろうと、「たかが機械」に向かって 
不特定多数に声で語りかけるという高級な「大作業」を孤独に長時間するのは 
人間に可能なのか、既に、キーボード入力という誰でも一応使える手段があるの 
を知っているのにも係わらず、という問いを私は前回投げかけていたのです。 
 

わたしは可能だという考えです.
音声入力なら10分で入力できる内容を,一応使えるキーボードで1時間かけと入力しようと思う人はすくないでしょう.
(十分タッチタイプが出来れば,そこまでの差は出ないとは思いますが)


人以外を相手に文脈の長い文章を何時間も「言う」のは無理なのではないのか? 
いや、人相手でも書いたら長文になるような複雑なことを言おうとする 
と支離滅裂になったりして、何度も言い返したり、面倒だから言うのを 
諦めた経験をした人が結構いるのではないか? 

1つ前の記事は音声入力で書いてます.
音声入力だから一発で入力しなければならないことはありません.
推敲もできますし,何度も入力し直せます.
そのあたりの条件はキーボード入力と変わりません.
(上の文章は,全然推敲しないで書いたものですが…)

推敲など細かいこともしなくてはならないテキスト作りで音声入力は原理的に  可能なのか、人間心理の面から検証する必要があると言っていたのです。 
 

自分では,心理的な負担など全く感じないので,正直なにを検証したいのか見えてこないのです.
これが一般的と主張するわけではないで,実際に使ってみた人の意見をもっと聞きたいですね.

「手を動かして言葉を固定する」ことなら、ギリシャ以来数千年の  「手書き」の歴史が実用性を証明しています。   別に99.9%(それ以上?)キーボード入力されている、ここ数年のネットの文章の  洪水を引き合いに出すまでもなく、「頭で考えて手で文字化して目で確認して推敲する」  という手書きやキーボード入力のプロセスの実用性は十分証明されていると言えます。 
 

昔は音声入力がなかったので,音声入力の歴史は始まったばかりです.
これから実用性が証明されていく分野なので,現時点で証明されてないのは当然です.

キーボード入力が実用的ではないと主張しているわけではないですよ?
キーボード入力も実用的ですが,それなりの練習が必要です.
手書きにしても,小学校あたりからかなりの時間をかけて読み書きを覚えます.

習得時間が短く,それなりに効率よい方法として,音声入力という選択肢が増えようとしているだけです.
音声入力も,声を出すという制約などがあるので,万能ではありません.
両方共存できるものだと思っています.
 

とにかく私は、音声入力は100%正確に入力できても、機械相手に人間は 
長時間喋れるものではないと確信したから飛鳥作りにはまったので、 
無気になって否定しているわけです。 
 

どうして確信したのでしょう?
実際に試して判断されたのでしょうか.
それとも,感覚的なものでしょうか.

わたしは,感覚的に,また実際に試してみて,音声入力は使えると感じて,反論しているわけです.

どちらも感覚的な意見であれば,これ以上議論しても答えは出なさそうですね.
人によっては音声入力は人気がないことはわかりましたが...
 

でも、みかさんも否定論に疑問を呈する以上試してみたらいいと思います。 
つまり、音声認識でなくてもマイクを前に自分のブログに書くことを 
「喋って」最低でも一時間くらいは録音が続けられるかどうか 
PCの録音ソフトでも使って実験されたらどうでしょうか。 

というわけで1時間はしてませんが,少し記事は書いてみました.
その後,ViaVoiceは強制終了して,おかしな状態になっていますが...
(ドラゴンスピーチの方が安定していますね.精度はいまいちですが...)

とくに打った方がいいとかは感じませんでしたが...
まあ,感嘆系の語句は減った感じがしますね.認識されにくいので...
話し言葉に近い入力にはまだ向かないかもしれません.


それで、「慣れたら簡単にできそうだ。100%近く正確に認識してくれるなら音声 
入力に乗り換えよう」と実感できるのなら、私の否定論は否定されるわけです。 
これまでの私を含めた新配列勢力の努力はパーになりますが、日本語 
入力の未来がそちらにあるなら、それもまた意味のあることと思います。 
 

安定入力できるなら,乗り換え...というか,音声入力しやすい環境なら使おうと思いますよ.
話し言葉の認識がもっと出来れば,チャットの入力も,お菓子食べながら出来るのでよさそうですし.

入力方法として制限があるので,音声入力が普及しても,キーボードは当面無くならないでしょうし,配列努力も無駄にはならないと思いますが...
わたしも,配列作って,キー配列変換ソフトまで作ろうとしていますし.


|

« ViaVoice & VoiceATOK | Main | 評価結果の見方 »

Comments

音声で作文するのはとても大変です。以前,私も試してみましたが,キーボードと同じレベルの文章を音声で作文するのは,とても困難なことが分かりました。音声は,基本的にすぐ消えてしまうので,思考のためのフィードバックが弱いですし,入力したその場から即座に編集できないので,どうしても億劫になってしまいがちです。やはり,生身の人間を相手にして,まったりと喋るのが気が楽だと思います。さらに突き進めて,頭で考えた文章をそのまま入力できれば,もっと楽ではなかろうかと思ったりもするのですが,これも音声と同じで,まともな文章にならないような予感がします。結局のところ,作文する手段としては,ペンを動かしたりキーボードを打ったりして体を使うことが,人間にとって一番自然な方法ではないかと思うのです。

Posted by: azuki | Thursday, July 28, 2005 10:38 PM

最近、右手はトラックボールの上に鎮座して、左手は団扇で忙しいので、文字を打つのにキーボードまで手を伸ばすのが億劫です。 ^^;;

音声入力できたら、もっと毎日、記事を書けるかも知れない、なんて思いました。(笑)


tos.

Posted by: tos | Friday, July 29, 2005 12:13 AM

昔、とある著明な作家が、「ワープロは不自然で推敲を妨げる億劫なデバイスである」とか、「頭の中で一度日本語からローマ字に変換するという作業が思考の障害になってろくな文章にならない」とか主張していた、と聞いたことがあります。

僕自身も今すぐ音声に乗り換えたいほど期待はしてませんが、いずれ使い易くなれば「慣れると天国」が待ってるのかもしれないな、と。
最初から完璧な文章は出てこないでしょうが、右手にマウス(カーソルとか修正用)、左手にお菓子、キーボードの代わりに口、というスタイルで、だらだら作った文章でも、編集さえちゃんとできれば何とかなりそうですし。

Posted by: naruto | Saturday, July 30, 2005 10:36 AM

To azukiさん

音声がすぐ消えてしまうというのはどういうことでしょうか?
音声認識ソフトによる音声入力の話ですので,文字は画面にすぐ出てきますし,すぐに修正できます.
(認識されるまでに多少のタイムラグはありますけど,1秒とかその程度です)

To totちゃん

キーボード無しで音声入力だけはまだ無理かなあ...
編集や修正にキーボードは必要なので..
もう少し精度があがれば,マウスだけで済みそうなのですけどねえ.

認識できなかったとき,音声で新しい単語を入れるのがかなり難しいです.
1音ずつ発音して,ちゃんと認識できるていどの精度があればだいぶ違うのでしょうけど.

あと1歩でそのレベルまでいけそうなきはするのですが,メーカー側がそろそろあきらめ気味?

To なるちゃん

そういえば,ワープロがだめっていう主張も昔ありましたねえ.
編集の形跡が残らないのがよくないとかも言われていた気がします.

今はほとんどの人がワープロorパソコンなことを考えると,人間とPCの接点である入力デバイスは受け入れられるのに時間がかかるんでしょうね...

現状のレベルでも,入力スピードはタイピング極めた人並みに速いので,精度さえ上がれば,と思ってしまいます.

Posted by: みかげ | Sunday, July 31, 2005 10:46 AM

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack


Listed below are links to weblogs that reference 音声入力:

» 音声認識ソフトに改善を望む点 [音声認識ソフト ドラゴンスピーチ]
 音声認識の問題点は、認識率とか認識速度、雑音に弱いなどの、音声認識の性能面での問題点と、口述では高水準の文章を作成するのが難しいとか、考える時間が追いつかないといった、人間側のボトルネックの2側面に分けられます。  後者については、現状の音声認識で明ら... [Read More]

Tracked on Saturday, August 20, 2005 01:21 AM

« ViaVoice & VoiceATOK | Main | 評価結果の見方 »