2004年10月15日金曜日

MLへの新着メールのrssでの情報提供(その2)


MLへの新着メールのrssでの情報提供(その1)の続き。



【で、どうやる?】

大まかな処理の流れとしては、


  1. HTMLアーカイブ化メールの送信先をスクリプトにする。

    これは、/etc/aliasesにスクリプトに食わせるアドレスを追記するか、

    crontabの中で明示的にメール送信先を記述する。

  2. メールを受け取ったスクリプトは、新規追加URLだけを抜き出して

  3. そのURLからHTML化された記事をgetして

  4. getした記事から、rssに載せるべきフィールドを抜き出して

  5. rssを生成する。

  6. その際に、rss上の古い記事の情報を消す。


みたいな感じ。




【具体的には?】


  • 上記1はすぐできる。

  • 上記2はgrepでも、sedでも、awkでも、perlでも、何ででもすぐ出来そう。

  • 上記3はperlのLWP::Simpleでさっくりできそうな気が。

  • 上記4も、元のHTMLがMHonArcで生成された定型的なものなので、perlのTemplate::Extractでできそうな気が。

  • 上記5もperlのXML::RSSの出番だな。

  • 上記6もXML::RSSでできそうだけどよく知らないので(^^;、rssに載せる新着記事数をあらかじめ決めておいて、毎回生成すれば簡単そう。




つまり、ほとんどTemplate::Extract + XML::RSS でRSS 生成そのもの(^^;



がー、woodyにはTemplate::Extractが含まれているdebは無いのかな?


0 件のコメント:

コメントを投稿