« パズル | Main | JLOD配列 »

Saturday, March 04, 2006

配列の評価ツール改良その3

配列の評価方法とツール改良その2に書いたツールを改良しました.

porteさん,バグ報告ありがとうございます.
左右交互などの判定がおかしかったのを修正しました.

また,READMEとして間違ったファイルが入っていたので,それも修正.

http://www.mikage.to/keytool/perlscript.zip

Chasen for Windows をインストール後,添付ドキュメントに従って操作すれば,簡単にn-gramの頻出単語の一覧と,各配列でのキー評価が行えます.
SKYとか月配列の姫踊子草定義ファイルとか,誰か集めて置いておいてくれると解析に便利?

■スクリプトの処理内容

入力:http://www.mikage.to/keytool/data.txt
出力1:http://www.mikage.to/keytool/step1.txt
出力2:http://www.mikage.to/keytool/step2.txt
出力3:http://www.mikage.to/keytool/step3.html

結果の値が正しくないとか,他にこんなのを測定したいとか要望があれば,対応しようと思いますのでコメントorTBにてどうぞ.

|

« パズル | Main | JLOD配列 »

Comments

 改定お疲れ様です~。

 「濁点・半濁点」込みでの文字を定義している「同時打鍵」扱いな配列のなかに、いくつか「濁点・半濁点」を別打ちしている例があるようです。
 「゛゜」を表[step3.html]の中から探した限りでは
--------
NICOLA(Japanist).hmo_kana
NICOLA(J型).hmo_kana
Nicolatter.hmo_kana
TRON.hmo_kana (※半濁点はもともと別打ち)
--------
あたりが該当するようです。
 一方では
--------
NICOLA(ひゅんQ).hmo_kana
飛鳥21-158改(数字除く).hmo_kana
飛鳥21-158改.hmo_kana
飛鳥21-180(数字除く).hmo_kana
飛鳥21-180.hmo_kana
姫踊子草配列CS.hmo_kana
姫踊子草配列六版六案.hmo_kana
--------
にはこの現象は現れていないようです。
 取り急ぎご報告まで。

Posted by: かえで(yfi) | Monday, March 06, 2006 at 12:09 AM

 すみません……濁点の件、配列定義側で対応してみます。

Posted by: かえで(yfi) | Saturday, March 11, 2006 at 11:32 AM

濁点ですが,ツールがキータイプの候補を選択するときに,打鍵数のみでベストなものを選んでいるのが原因でした.
(同ランクの候補が複数あるときは,適当に選ばれるので,それで結果に違いがでてしまったのかと...)

同時打鍵の場合,2ストローク2打より1ストローク2打の方がよいのは明らかですよね.
打鍵数が同じ候補があった場合は,ストローク数の小さい方を選択するようになおしました.

ファイルをアップロードし直しましたので,再度DLしてみてもらえますか?
step3.htmlを見る限りは,うまくいってそうな感じです.

Posted by: みかげ | Sunday, March 12, 2006 at 09:33 PM

 早速対応いただきありがとうございます!
 こちらでもテストしてみました。
  NICOLA(Japanist).hmo_kana
  NICOLA(J型).hmo_kana
  Nicolatter.hmo_kana
 これら3点はバッチリ問題が解消されました。

 一方で、なぜか
  TRON.hmo_kana (※半濁点はもともと別打ち)
だけは、手元で解析すると濁音がバラバラに解釈される部分が残っているようです。
 #解析結果全域ではなく、前半にのみ発生するようです。
 邪魔になるかも知れず恐縮ですが、バラけている濁点を【゛】で閉じなおしてみたものを貼ってみます(もしかすると再現性が無いかもしれないですし……)。

a(タ) j(イ) Lq(ヒ) R.(゜) ;(ン) i(ク) Lh【゛】 u(ノ) d(カ) j(イ) Lc(セ) y(キ) h(ヲ) Rh(オ) e(コ) b(ナ) j(イ) z(マ) n(ス)n(ス) i(ク) x(リ) Lg(フ) R.(゜) s(ト) s(ト) k(ウ) r(ハ) l(シ) Lh【゛】 Lv(ユ) k(ウ) c(ニ) d(カ) y(キ) d(カ) Ry(エ) f(テ) m(ツ) d(カ) /(ッ) f(テ) i(ク) a(タ) Lh【゛】 v(サ) j(イ)Lg(フ) i(ク) n(ス) k(ウ) u(ノ) y(キ) Rk(ー) c(ニ) Ld(ュ) k(ウ) x(リ) t(ョ) i(ク) Lt(ホ) k(ウ) Lt(ホ) k(ウ) Rd(ガ) o(ア) x(リ)d(カ) m(ツ) y(キ) Rk(ー) u(ノ) a(タ) j(イ) Lg(フ) R.(゜) n(ス) k(ウ) d(カ) Lh【゛】 d(カ) Rn(ワ) q(ラ) b(ナ) j(イ) r(ハ) Lh【゛】 o(ア) j(イ)e(コ) u(ノ) n(ス) i(ク) x(リ) Lg(フ) R.(゜) s(ト) f(テ) Lh【゛】 r(ハ) f(テ) y(キ) s(ト) k(ウ) c(ニ) k(ウ) Rj(チ) d(カ) a(タ) h(ヲ) Ru(ケ) /(ッ) f(テ) j(イ) l(シ) z(マ) n(ス)e(コ) p(レ) c(ニ) Lf(ヨ) x(リ)Lw(ソ) k(ウ) Re(ゴ) k(ウ) Lq(ヒ) t(ョ) k(ウ) d(カ) c(ニ) o(ア) i(ク) Ry(エ) j(イ) y(キ) t(ョ) k(ウ) h(ヲ) o(ア) a(タ) Ry(エ) w(ル) d(カ) u(ノ) k(ウ) Lc(セ) j(イ) Rd(ガ) o(ア) x(リ) z(マ) n(ス)Lc(セ) j(イ) d(カ) i(ク) b(ナ) d(カ) j(イ) Lc(セ) y(キ) h(ヲ) n(ス) w(ル) Rr(バ) o(ア) j(イ) r(ハ)f(テ) y(キ) Lc(セ) m(ツ) Rf(デ) r(ハ) b(ナ) j(イ) k(ウ) Rj(チ) d(カ) a(タ) r(ハ) f(テ) j(イ) Ly(ギ) Lg(フ) R,(ァ) j(イ) w(ル) d(カ) q(ラ) v(サ) i(ク) Ll(ジ) t(ョ) l(シ) f(テ) d(カ) q(ラ) d(カ) j(イ) Lc(セ) y(キ) l(シ) f(テ) i(ク) Ra(ダ) v(サ) j(イ)

 以上、ご報告まで。

Posted by: かえで(yfi) | Monday, March 13, 2006 at 02:34 AM

毎回チェックありがとうございます.

調べたところ,そもそも半濁点のみ独立する配列の存在を考慮していませんでした.
キー列に直すロジックを少し改良してみました.
再度試してみていただけますでしょうか...
(ほかの解析への影響がちょっと心配(^^;)

Posted by: みかげ | Tuesday, March 14, 2006 at 12:13 AM

 毎度お手数おかけしすみませんです^^;。
 濁点・半濁点絡みの解析はバッチリです。
 他の解析については……(とりあえず解る)AZIK-QWERTY.hmo_kanaと、自作系定義のストロークを追いかけてみましたが、怪しい解析をしている部分はおそらくないかと思います。
 対応いただきありがとうございます!

Posted by: かえで(yfi) | Wednesday, March 15, 2006 at 08:08 PM

http://pc7.2ch.net/test/read.cgi/pc/1139243753/251
 上記スレッドより。同指異鍵判定に問題があるようです……そのまま適応してよいかどうかが不明なため、できましたら判定をお願いします。

Posted by: かえで(yfi) | Monday, March 27, 2006 at 05:52 PM

内容確認しましたが,確かにその通りですね.
現状だと,同指異鍵,ではなく,同列異段,のような判定になってしまっているようです.

作るとき,あえてそうしたような気もしなくもないのですが・・・理由を失念.
ACT系で,縦の動きの少なさを確認したくてそうしたのかもしれないですが,同指異鍵のカウントとしては間違っていますね.

同指異鍵&同列異段の両方のカウントを乗せる形がよいでしょうかね...

Posted by: みかげ | Wednesday, March 29, 2006 at 10:16 PM

 「同列異段」のカウントが目的だったのですね。
 行段系配列では特に「うまく設計すれば確実に改善できる」所だと思いますし、この評価は(特に配列設計する人のために)重要ですね。
 できれば「同指異鍵」も別途カウント対象としていただけると嬉しいです。

Posted by: かえで(yfi) | Saturday, April 01, 2006 at 06:49 PM

hmo_kanaのドキュメントはないのでしょうか...
書き方がわかりません...

Posted by: アサメ | Sunday, May 27, 2007 at 07:35 PM

To アサメ さん

hmo_kanaファイルは,姫踊子草の変換ファイルです.

姫踊子草の説明書の,その他の情報-情報ファイルの書式仕様,
のところに説明がありますので,そちらを参照してください.

姫踊子草は以下の場所から入手できます.http://hp.vector.co.jp/authors/VA011751/software/himeodorikosou/

Posted by: みかげ | Sunday, May 27, 2007 at 10:28 PM

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/33589/8944702

Listed below are links to weblogs that reference 配列の評価ツール改良その3:

» 下駄配列の解析表を更新 [ローマ字入力でもなく、かな入力でもなく]
 『みかログ』の配列の評価ツールが改良されました。 配列の評価ツール改良その3  と言うわけで、新バージョンで解析し直して、『下駄配列って何だ?』に載せていた解析表を更新しました。  旧バージョンでは「交互打鍵」の算出がおかしかったらしく、新バージョンではかなり異なる数字がはじき出されています。順位が入れ替わるような変動もあります。  他にも、表の下の部分の数字は変化している部分がいくつかあります。特に月配列3種の変化が大きい。表の上の部分は変化していないようです。  あと... [Read More]

Tracked on Sunday, March 05, 2006 at 10:31 PM

« パズル | Main | JLOD配列 »