明日は~~どぉっちだぁ~~♪ (再び音声入力を考える)へのコメント
>途中から音声入力と音声会話がごっちゃになっていないだろうか?
いや、何十回も推敲しているのですから「わざとごっちゃにしている」んです!
つまり、発声という作業が気心の知れた相手とするか、仕事など必要上どうしても
会話しなくてはならない状況以外では、やる気にならないほど面倒だと言うことです。
わたしはそうは感じていないので,人によって違うのでしょうね.
機械に対して発声するのが面倒というのが理解できません.
発声することのどこに面倒くささを感じるのかが違うのかもしれませんね.
わたしは対人が面倒と感じる方なので...
もしみんなが発声自体が面倒と思っているならば,カラオケなんて流行らないはずです.
音楽を聴いて,思わず歌詞を口ずさむ行為などもありますが,このような行為も説明がつかなくなります.
少なくとも,発声に対して,そこまで面倒と思う人はそう多くないのではと考えます.
だって、打鍵なんてチンパンジーでも言葉が分かれば、大きめのキーボードを
与えればできそうなくらい粗雑な作業で、人間が数十万年とか前から持っていた
能力できっと十分なんです。
キーが10個程度なら出来るかもしれませんが,1つの指に4~10個のキーを割り当てて,タッチタイプするのは無理でしょう.
キーボードをタッチタイピングすることも,それなりに大変ですよね.
出来ない人が多くいることがそのことを証明しています.
難しいからこそ、赤ちゃんの最初の仕事は「音声母語の獲得」になっていて、
それで人類は繁栄できたのです。
つまり、音声言語の習得を本能にする必要があるほど発声は難しいものなんです。
音声によるコミュニケーションが無ければ生きていけないからでしょう.
本能にしているのは,発声が難しいからではなく,生存に必要だからです.
キーボードが打てなくても生きていけますし,タイピングは生物的な生存とは関係がありません.
実際、留守番電話などは出力も音声ですが、それとは関係なく
不特定の他人に向けて機械相手にやるのですから、十秒の
メッセージでも入れるのは面倒でたまらなかった経験は誰にでも
あるでしょう。
留守電を聞くのは人間です.
したがって,気を遣いますし,相手のリアクションがすぐ聞けず,時間制限もあるので面倒なのです.
間に機械が入るのは関係ありませんし,出力がテキストの音声入力の否定材料にはなりません.
では、その頃のIMEよりははるかに優れている今売っている音声入力が
普及しない理由は何でしょう?
アプリケーションとして使いやすくないからでしょう.
使ってみればわかりますが,まだまだ完成度が低すぎます.
入力作業は長時間にわたってすることですから,この辺のできの悪さはストレスに直結します.
ドラゴンスピーチとViaVoiceの両方を試しましたが,一番ストレスがたまるのが修正のしにくさです.
ここがもっと使いやすくなれば,今の精度でももう少し普及すると思いますけどね.
(それなりに認知度を高める必要はありますが)
実用で使う気が起きない原因はまずそこにあると思っています.
ここが直って,認識精度も高いのに普及しなければ,発声が問題と言えるのでしょうが...
そのころのIME...というのがよくわかりませんが,ATOK6とか7の時代でも,修正などにストレスを感じることはありませんでした.
なので,今の音声入力はまだまだこれからでしょう....
今のユーザーが,なぜ音声入力を使いたくないと判断したか,その理由はどこでしょう?
一度使ってみればわかると思いますが,入力自体は非常に速くできますよ.
誤認識や,修正のやりにくさが利用されない原因でしょう.
これが快適になったら,いかに便利か...という夢はあると感じます.
同じことを大組織ができないはずがありません。それができないのは、
五体満足な人で毎日数時間入力するほど言いたいことや書く必要がある
人で、音声入力に乗り換えようとする人が見つからないからでしょう。
ブログなんて最近出た媒体ですし,大企業がブログを書かせるというのも変な話です.
できないのではなく,やらないだけでしょう.
つまり、出力が音声であろうとテキストであろうと、「たかが機械」に向かって
不特定多数に声で語りかけるという高級な「大作業」を孤独に長時間するのは
人間に可能なのか、既に、キーボード入力という誰でも一応使える手段があるの
を知っているのにも係わらず、という問いを私は前回投げかけていたのです。
わたしは可能だという考えです.
音声入力なら10分で入力できる内容を,一応使えるキーボードで1時間かけと入力しようと思う人はすくないでしょう.
(十分タッチタイプが出来れば,そこまでの差は出ないとは思いますが)
人以外を相手に文脈の長い文章を何時間も「言う」のは無理なのではないのか?
いや、人相手でも書いたら長文になるような複雑なことを言おうとする
と支離滅裂になったりして、何度も言い返したり、面倒だから言うのを
諦めた経験をした人が結構いるのではないか?
1つ前の記事は音声入力で書いてます.
音声入力だから一発で入力しなければならないことはありません.
推敲もできますし,何度も入力し直せます.
そのあたりの条件はキーボード入力と変わりません.
(上の文章は,全然推敲しないで書いたものですが…)
推敲など細かいこともしなくてはならないテキスト作りで音声入力は原理的に
可能なのか、人間心理の面から検証する必要があると言っていたのです。
自分では,心理的な負担など全く感じないので,正直なにを検証したいのか見えてこないのです.
これが一般的と主張するわけではないで,実際に使ってみた人の意見をもっと聞きたいですね.
「手を動かして言葉を固定する」ことなら、ギリシャ以来数千年の
「手書き」の歴史が実用性を証明しています。
別に99.9%(それ以上?)キーボード入力されている、ここ数年のネットの文章の
洪水を引き合いに出すまでもなく、「頭で考えて手で文字化して目で確認して推敲する」
という手書きやキーボード入力のプロセスの実用性は十分証明されていると言えます。
昔は音声入力がなかったので,音声入力の歴史は始まったばかりです.
これから実用性が証明されていく分野なので,現時点で証明されてないのは当然です.
キーボード入力が実用的ではないと主張しているわけではないですよ?
キーボード入力も実用的ですが,それなりの練習が必要です.
手書きにしても,小学校あたりからかなりの時間をかけて読み書きを覚えます.
習得時間が短く,それなりに効率よい方法として,音声入力という選択肢が増えようとしているだけです.
音声入力も,声を出すという制約などがあるので,万能ではありません.
両方共存できるものだと思っています.
とにかく私は、音声入力は100%正確に入力できても、機械相手に人間は
長時間喋れるものではないと確信したから飛鳥作りにはまったので、
無気になって否定しているわけです。
どうして確信したのでしょう?
実際に試して判断されたのでしょうか.
それとも,感覚的なものでしょうか.
わたしは,感覚的に,また実際に試してみて,音声入力は使えると感じて,反論しているわけです.
どちらも感覚的な意見であれば,これ以上議論しても答えは出なさそうですね.
人によっては音声入力は人気がないことはわかりましたが...
でも、みかさんも否定論に疑問を呈する以上試してみたらいいと思います。
つまり、音声認識でなくてもマイクを前に自分のブログに書くことを
「喋って」最低でも一時間くらいは録音が続けられるかどうか
PCの録音ソフトでも使って実験されたらどうでしょうか。
というわけで1時間はしてませんが,少し記事は書いてみました.
その後,ViaVoiceは強制終了して,おかしな状態になっていますが...
(ドラゴンスピーチの方が安定していますね.精度はいまいちですが...)
とくに打った方がいいとかは感じませんでしたが...
まあ,感嘆系の語句は減った感じがしますね.認識されにくいので...
話し言葉に近い入力にはまだ向かないかもしれません.
それで、「慣れたら簡単にできそうだ。100%近く正確に認識してくれるなら音声
入力に乗り換えよう」と実感できるのなら、私の否定論は否定されるわけです。
これまでの私を含めた新配列勢力の努力はパーになりますが、日本語
入力の未来がそちらにあるなら、それもまた意味のあることと思います。
安定入力できるなら,乗り換え...というか,音声入力しやすい環境なら使おうと思いますよ.
話し言葉の認識がもっと出来れば,チャットの入力も,お菓子食べながら出来るのでよさそうですし.
入力方法として制限があるので,音声入力が普及しても,キーボードは当面無くならないでしょうし,配列努力も無駄にはならないと思いますが...
わたしも,配列作って,キー配列変換ソフトまで作ろうとしていますし.
Recent Comments