« ACT配列(M1版) | Main | 姫踊子草配列 »

Tuesday, June 07, 2005

配列の評価方法とツール

2005/7/19追記:
配列の評価ツール改良
に改良版があります.
使ってみようと思った方はこちらをどうぞ.

----

kakasi等の形態素解析ツールも含め、配列界隈のツール集とFAQをまとめた「自作配列を始める人への手引き」ページみたいなのがあるとちょっと嬉しいかな~・・・と思う今日この頃。

手引きページは作れないですが,ツールは作ってみました.
いろいろな方が同種のスクリプトを作っているのですが,配列の定義をするのが大変なので,姫踊子草のコンフィグファイルベースで.

今までLinuxで解析していたスクリプトをまとめなおして,キー評価部分を強化して,Windows上向けにしたものです.
http://www.mikage.to/act/perlscript.lzh

Chasen for Windows をインストール後,添付ドキュメントに従って操作すれば,簡単にn-gramの頻出単語の一覧と,各配列でのキー評価が行えます.
SKYとか月配列の姫踊子草定義ファイルとか,誰か集めて置いておいてくれると解析に便利?

■スクリプトの処理内容

入力:http://www.mikage.to/act/data.txt
出力1:http://www.mikage.to/act/step1.txt
タイピングが消えているのは,Chasenで未知語扱いだったため
出力2:http://www.mikage.to/act/step2.txt
出力3:http://www.mikage.to/act/step3.html

出力内容はあまり検証してないので,一部間違っているかも.(^^;

他にこんなのを測定したいとか要望があれば,対応するかもしれないのでコメントorTBにてどうぞ.

2キーの時間からのタイピング時間を求めるとかもおもしろそうですが,同時打鍵系をどうするかの問題があってあきらめました.

|

« ACT配列(M1版) | Main | 姫踊子草配列 »

Comments

姫踊子草の定義ファイルから直接、呼び出せるのは使い勝手が良さそうですね。解析スクリプトごとに定義を書き換えるのは、今まで個人的には面倒に感じていたところなので、そうした工夫は有り難いです。

出力サンプルで、少し不思議に思ったのは、NICOLAに対する3方式の結果が、結構、違っているように見えるのですが、どうしてでしょうか?記号のあたりで結果が変わってしまうんですかね・・・。

ところでふと気付いたのですが、そういえば、姫踊子草の定義ファイルには、普通のローマ字入力やかな入力の定義ファイルは(当然ながら)ないんですよね(笑)。

Posted by: Uジロー | Tuesday, June 07, 2005 11:48 AM

>ところでふと気付いたのですが、そういえば、姫踊子草
>の定義ファイルには、普通のローマ字入力やかな入力
>の定義ファイルは(当然ながら)ないんですよね(笑)。

Qwertyローマ字はないですな(^^;
旧JISかなの方は練習ソフト対応機能の関係でちゃんとあるわけですが。

Posted by: 鈴見咲君高 | Wednesday, June 08, 2005 12:32 AM

Qwerty と付けたけど Dvorak ローマ字とかがあるわけではないです。一般に通常のローマ字はなし。すんません。

Posted by: 鈴見咲君高 | Wednesday, June 08, 2005 12:34 AM

大変、失礼いたしました・・・。
姫踊子草には、新旧JISカナ配列そろい踏みしていましたね。適当なことを書いてしまって申し訳ありません。

Posted by: Uジロー | Wednesday, June 08, 2005 08:20 PM

あ,確かにありましたね….
(わたしも今気づきました(^^;
ということはローマ字だけ作ればそろうのかな.

Posted by: みかげ | Wednesday, June 08, 2005 10:21 PM

かな系配列だと打鍵と出た文字が1対1の対応だから簡単ですが,
ローマ字拡張系だと定義ファイルから直接評価スクリプトを作るのは,
省打鍵拡張があるせいで打鍵と文字の1対1対応が崩れているので.
厳しくないですかね?

Posted by: GOTO | Sunday, July 03, 2005 09:38 PM

はい,結構めんどくさかったです.
上のスクリプトはその辺の処理も入っています.(いろいろなパターンを考慮し,打鍵数の最も少ないもののうち1つを採用します.)

http://blog.mikage.to/mika/2005/07/post_fa18.html

の方で,手軽に試せるCGIも作成してみました.

Posted by: みかげ | Sunday, July 03, 2005 10:41 PM

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack


Listed below are links to weblogs that reference 配列の評価方法とツール:

» 下駄配列ver.1.03を解析 [ローマ字入力でもなく、かな入力でもなく]
 下駄配列ver.1.03は、私としては満足して使っているのですが、客観的に見てどうなのよ? というのは当然気になるわけですです。  そこで、『みかログ』「配列の評価方法とツール」を使って下駄配列を分析してみました。分かりやすく、使いやすく、面白いツールを提供して下さっているみかげさんに感謝。  解析するテキストは「キーボードによるかな入力効率の比較」に置いてある「日本国憲法前文」と「めくらぶどうと虹」を合わせたものにしました。  比較対象も無いと結果が良いのか悪いのか分からないので、... [Read More]

Tracked on Sunday, July 17, 2005 05:23 PM

« ACT配列(M1版) | Main | 姫踊子草配列 »