��まだできていない(^^;
【やりたいことの整理】
- search.luky.orgでは、Linux関係のMLに投稿された記事をMHonArcによりHTMLアーカイブ化し、namazuにより全文検索できるようにしている。
- 当初は投稿都度アーカイブ化しようと思っていたが、かなりの流量がありマシンパワーがもたないこともあり、cronによりバッチでHTML化+namazuでの処理を行っている。
- MLにはsubscribeしていないけど、search.luky.orgに新着記事を見に来る人もかなりいるようだ。
- 私もsageを入れたこともあり、新着(と言うか新規アーカイブ化)記事があれば、
rssで情報を得ることができると便利かなと思った。
つまり、やりたいことは上記である。
【現状】
- cronによるHTMLアーカイブ化のバッチ結果は、管理人である私のところにメールで通知するようにしている。
- 現時点で届くメールは下記のような形式である。
[ヘッダは省略]
Reading resource file: /hoge/mhonarc.rc .
Converting messages to /hoge/obu/
3087 new messages
3087 total messages
3085 http://search.luky.org/obu/msg03085.html
3086 http://search.luky.org/obu/msg03086.html
Added Files: 2 files
Deleted Files: 0 files
Updated Files: 0 files
Total Files: 3,087 files
Size: 9,662 bytes - 上記のうち、
http://search.luky.org/obu/msg03085.html
http://search.luky.org/obu/msg03086.html
を抜き出して、そのURLの内容をrssに出せば何とかなりそうだ。
0 件のコメント:
コメントを投稿