2004年10月15日金曜日

MLへの新着メールのrssでの情報提供(その1)


��まだできていない(^^;



【やりたいことの整理】


  • search.luky.orgでは、Linux関係のMLに投稿された記事をMHonArcによりHTMLアーカイブ化し、namazuにより全文検索できるようにしている。

  • 当初は投稿都度アーカイブ化しようと思っていたが、かなりの流量がありマシンパワーがもたないこともあり、cronによりバッチでHTML化+namazuでの処理を行っている。

  • MLにはsubscribeしていないけど、search.luky.orgに新着記事を見に来る人もかなりいるようだ。

  • 私もsageを入れたこともあり、新着(と言うか新規アーカイブ化)記事があれば、
    rssで情報を得ることができると便利かなと思った。


つまり、やりたいことは上記である。



【現状】


  • cronによるHTMLアーカイブ化のバッチ結果は、管理人である私のところにメールで通知するようにしている。

  • 現時点で届くメールは下記のような形式である。


    [ヘッダは省略]

    Reading resource file: /hoge/mhonarc.rc .
    Converting messages to /hoge/obu/
    3087 new messages
    3087 total messages
    3085 http://search.luky.org/obu/msg03085.html
    3086 http://search.luky.org/obu/msg03086.html
    Added Files: 2 files
    Deleted Files: 0 files
    Updated Files: 0 files
    Total Files: 3,087 files
    Size: 9,662 bytes


  • 上記のうち、

    http://search.luky.org/obu/msg03085.html
    http://search.luky.org/obu/msg03086.html

    を抜き出して、そのURLの内容をrssに出せば何とかなりそうだ。



0 件のコメント:

コメントを投稿