■2004-03-14
* [Perl] はてなキーワードリンク高速化
2004-03-04の日記で書いたプラグインの件ですが、はてなスタイルの高速化について考えるの記述に基づいて実装して試してみました。まずはhashdump.plを使って全単語をハッシュ化します。Storableモジュールで保存して1.5Mになりました。Perl標準モジュールのData::Dumperでもインデント無しで保存すると1.4M強になります(インデントありだと10Mになります)。
今度はfind_keyword.plでデータをリストアしてから単語をマッチさせます。実験用に青空文庫の『我輩は猫である』一から九までをマッチングさせリストを返しました。「オリジナル」とあるのは約3万の単語を逐一マッチングさせている試作プラグインのものです。ついでにData::Dumper版も載せました。
オリジナル 16 (秒) Data::Dumper 7.4 Storable 3.2
う〜ん、こんなもんでしょうか。ハッシュデータの読み込みに関していいますと、さすがにStorableはCで実装されているだけあってリストアが早いです。Data::Dumperはきついですね。これをプラグインに組み込んで私が使っているレンタルサーバで試したところコアダンプしました。ログインして使う場合は動作するので、CGIのリソース制限にひっかかるようです。さらに、1.5kほどのデータに対してマッチングしてみたところ
オリジナル 0.8 Storable 0.8
となったため、よほど大きいデータでなければ現状のままでいいや、と思ってしまいました。のでこの件はとりあえず、お終い。
蒲鉾、最近おいしいものを食べてないなあ。<br>焼いてよし、醤油につけてそのまま頂くもよし。
そういえば焼いて食べることってやったことないです。<br>ああ、でもそれも美味しそう〜