12時頃から16時頃までダウンしていた。
正確に言うと、load averageが異常に上がっていて瀕死の状況だった。
なんとかアクセスできたときの状況はこんな感じ。
load averageは70を超えていた。
その割りに86%がidleなので、なんか沈み込んでいるようだ。
リモートからpingが返ってくるけど、sshでも入れない。
しかたなく、某所のデータセンタに入って調べると、HDDのアクセスランプが付きっぱなし。原因はHDD周りかなぁ。
コンソールからのloginを試みるが、できない。
logが取れないのが残念だけどリセット。
syslog上は、リセットする直前までcronで指定したジョブやhddtempの結果が残っていた。
返信削除しかし、どのプロセスが何を掴みっぱなしにしていたかは不明。