■2004-04-15
* [Perl] Encode::Guessの補助
JEncode.pm v.1.22。結局shiftjisとeuc-jpを正しく判定するための「補助判定」は以下のようになってしまいました。
$str =~ m/((?: \p{InHiragana} | # \p{InKatakana} | # \p{InCJKUnifiedIdeographs} | # \p{InHalfwidthAndFullwidthForms} | # \p{InCJKSymbolsAndPunctuation} | # \p{InArrows} | # \p{InGeneralPunctuation} | # \p{InGeometricShapes} | # ■▲など \p{InMiscellaneousSymbols} | # ♂♀など \p{InMathematicalOperators} | # ⊃∨など \p{Greek} | # \p{InCyrillic} | # \p{InBoxDrawing} # 罫線 )+)/gx;
これで大抵の文字とマッチするでしょう(まる数字などの機種依存文字は含まれていません)。ところでギリシャ語のブロックを利用するため\p{InGreek}
と書くと、「そんなものはない」とperlに怒られてしまいます。何故?
追記(2004-04-16)
原因がわからないので、ソースで確認。lib/unicore/Blocks.txt(perl5.8.3) をみると、ギリシア語ブロックの名前が'Greek and Coptic'となっていました。\p{InGreekandCoptic}
とすれば解決。他のドキュメントではGreekとかInGreekで例が出ていたのに。
追記(2004-04-19)
って、perlunicodeに書いてあるじゃん! あ〜あ。
* [雑感] メモメモメモ
自作自演を検証するページ。まあ、そのまんまです。
Documents by Moondance Laboratory。どこかでみたことあるノリだと思ったら、「波動機関もえもえ」の人なのね。以前よりふっきれた感じで面白いかなあ。
人の生命をおもちゃにして遊ぶ人の顔をしたケダモノ。コメント欄をみますに、これは一種の「ゴキブリホイホイ」ということだったのかしら。