そんな我が家のサーバーですが、最近ストレージサーバーのSolarisが不安定です。症状としては起動から10日ほどするとフリーズします。syslog には全くログ出力もなく、さっぱり原因がつかめません。
わかっていることとしては、PCパーツ(CPU、マザーボード、メモリ)を一新してからということ。
交換パーツの内容は下記の通り。
- CPU: Core2duo E6300 → Celeron G530
- M/B: P5Q-EM → P8B75-M
- Mem: DDR2-800 2GB×4枚 → DDR3-1333 8GB×2枚
将来的にメモリを32GB載せる予定でパーツを入れ替えたのですが、正直なところ新しいパーツ過ぎた印象。
おそらくはマザーボード周りのドライバ関係がうまくいってないのではないかと思うのだけど、何の情報もなくフリーズするので追いようがありません。。
(パーツの初期不良も疑いたいところですが)
Solarisが停止するとマウントしている ESXi のゲストOS達もディスク参照できずに死ぬのでかなりの困り者。パーツ入れ替えから2か月がたって、約10日でフリーズするという規則性だけ見えているので、最近は1週間程度でリブートを入れる運用にしていますが、ずっとこんな状態でいるわけにもいきません。
ってことで、サーバーの構成を変えることにしました。
まぁ単純にiSCSIの使用はやめて、すべてのディスクをESXiに接続するだけです。
これで、常時稼働PCが1台減るので、節電にもなりますね。(現在100w→予想60w)
とはいえ、SolarisのiSCSI運用気に入っていたのでいつかは復活させたいところ。
また時間ができたときにでも考えますかな。