自宅サイト GCD の 2台のゲートウェイ (senri と asao) の NIC が同時に link down した。
Aug 18 10:31:30 senri [144077.315932] tg3: eth0: Link is down. Aug 18 10:33:57 senri [144201.921009] tg3: eth0: Link is up at 1000 Mbps, full duplex. Aug 18 10:33:57 senri [144201.921228] tg3: eth0: Flow control is on for TX and on for RX.
Aug 18 10:31:30 asao [894103.906436] tg3: eth0: Link is down. Aug 18 10:33:57 asao [894253.756472] tg3: eth0: Link is up at 1000 Mbps, full duplex. Aug 18 10:33:57 asao [894253.756472] tg3: eth0: Flow control is on for TX and on for RX.
この日 8/18 はたまたま早朝から出張だった (帰宅したのは翌日 8/19 23:00 近く) ので link down に気付かなかった (もちろんヘルスチェックは行なっているが自宅なのでタイムアウトは長め)。 留守中、 link down 後しばらくたつと link up (正常状態に復旧)、 という繰り返しが何度も起きたようだ。 ログから down 時間を集計してみるとこんな感じ:
|
|
3 秒で復旧することもあれば、 20分以上落ちたままのこともあり規則性がないが、 いったん link down/up すると、 down/up を何度か短時間に繰り返す傾向がある。 また次第に down する頻度が上がり、 down している時間も長くなる傾向にあった。 複数のマシンで同時に link down することから、 ハブの故障だと判断できる。 ハブは、 コレガ製 1000BASE-T/100BASE-TX/10BASE-T 8ポート スイッチングHUB CG-SW08GTV2。 2005年11月9日に購入したものなので1年の保証期間は切れているものの、 まだ3年弱しか経過しておらず自宅LAN の中では比較的新しいハブである。
ちょっと壊れるのが早すぎなんじゃないかと思いつつ、 とりあえず余っていた 100Mbps スイッチング・ハブと置き換えて急場をしのぎつつ、 秋葉原に新しいハブを買いに行った。 買ったのは同じくコレガ製の、 1000BASE-T/100BASE-TX/10BASE-T 8ポート スイッチングハブ CG-SW08GTR。 T-Zone で 3742円だった。 8 port の gigabit が 4000円以下とは、 ずいぶん安くなったものだ (標準価格は 9975円)。
というわけで故障したハブを新しいハブで置き換えて一件落着なのであるが、 3年たたずに故障し、 しかも断続的に down するという症状が腑に落ちなかったので、 壊れた CG-SW08GTV2 の筐体を開けてみた。 すると...
このハブは「ACアダプタを使用しない電源内蔵型」なので、 内部に電源基板 (写真上方) があって、 Switch 基板とケーブルでつながっているのだが、 そのケーブルのコネクタが ↑ の写真のように外れかかっていた。 このケーブルは元々ギリギリの長さしかなく常に若干の張力が働いていて、 2年以上かけて少しづつコネクタが浮いていき、 ついに接触不良を起こすほどに外れてしまったのだろう。 一応このコネクタには抜け防止のツメがあるのだが、 ケーブルが引っ張られる状態が続いたため、 ソケット側が徐々に変形してしまったのかも (設計ミス?)。
コネクタをはめ直して通電してみたら、 丸2日たった今も、 一度も link down を起こさずに正常動作し続けている。 コネクタが外れたことによる接触不良だけが link down の原因だったならば、 コネクタさえきちんと固定しておけば今後は安定して動作することが期待できる。 買い替えを早まったか...? ;-(