■2004-04-15
* [Perl] Encode::Guessの補助
JEncode.pm v.1.22。結局shiftjisとeuc-jpを正しく判定するための「補助判定」は以下のようになってしまいました。
$str =~ m/((?:
\p{InHiragana} | #
\p{InKatakana} | #
\p{InCJKUnifiedIdeographs} | #
\p{InHalfwidthAndFullwidthForms} | #
\p{InCJKSymbolsAndPunctuation} | #
\p{InArrows} | #
\p{InGeneralPunctuation} | #
\p{InGeometricShapes} | # ■▲など
\p{InMiscellaneousSymbols} | # ♂♀など
\p{InMathematicalOperators} | # ⊃∨など
\p{Greek} | #
\p{InCyrillic} | #
\p{InBoxDrawing} # 罫線
)+)/gx;
これで大抵の文字とマッチするでしょう(まる数字などの機種依存文字は含まれていません)。ところでギリシャ語のブロックを利用するため\p{InGreek}と書くと、「そんなものはない」とperlに怒られてしまいます。何故?
追記(2004-04-16)
原因がわからないので、ソースで確認。lib/unicore/Blocks.txt(perl5.8.3) をみると、ギリシア語ブロックの名前が'Greek and Coptic'となっていました。\p{InGreekandCoptic}とすれば解決。他のドキュメントではGreekとかInGreekで例が出ていたのに。
追記(2004-04-19)
って、perlunicodeに書いてあるじゃん! あ〜あ。
* [雑感] メモメモメモ
自作自演を検証するページ。まあ、そのまんまです。
Documents by Moondance Laboratory。どこかでみたことあるノリだと思ったら、「波動機関もえもえ」の人なのね。以前よりふっきれた感じで面白いかなあ。
人の生命をおもちゃにして遊ぶ人の顔をしたケダモノ。コメント欄をみますに、これは一種の「ゴキブリホイホイ」ということだったのかしら。
[]

