【で、どうやる?】
大まかな処理の流れとしては、
- HTMLアーカイブ化メールの送信先をスクリプトにする。
これは、/etc/aliasesにスクリプトに食わせるアドレスを追記するか、
crontabの中で明示的にメール送信先を記述する。 - メールを受け取ったスクリプトは、新規追加URLだけを抜き出して
- そのURLからHTML化された記事をgetして
- getした記事から、rssに載せるべきフィールドを抜き出して
- rssを生成する。
- その際に、rss上の古い記事の情報を消す。
みたいな感じ。
【具体的には?】
- 上記1はすぐできる。
- 上記2はgrepでも、sedでも、awkでも、perlでも、何ででもすぐ出来そう。
- 上記3はperlのLWP::Simpleでさっくりできそうな気が。
- 上記4も、元のHTMLがMHonArcで生成された定型的なものなので、perlのTemplate::Extractでできそうな気が。
- 上記5もperlのXML::RSSの出番だな。
- 上記6もXML::RSSでできそうだけどよく知らないので(^^;、rssに載せる新着記事数をあらかじめ決めておいて、毎回生成すれば簡単そう。
つまり、ほとんどTemplate::Extract + XML::RSS でRSS 生成そのもの(^^;
がー、woodyにはTemplate::Extractが含まれているdebは無いのかな?
0 件のコメント:
コメントを投稿