Kundenanfrage: Promise Pegasus RAID verursacht Serverausfälle

Ein Kunde fragte:

wir haben in letzter Zeit regelmäßige Ausfälle des Servers.
Das passiert alle 2 Wochen oder so. Plötzlich sind die Shares einfach weg.
Über Remote Access kommt man noch drauf, aber wenn man einen Neustart macht,
dann fährt er einfach nicht richtig hoch.
Erst wenn ich ihn mit Gewalt ausmache, und das RAID auch, dann geht es wieder.
Ich vermute, das RAID hängt sich auf – vielleicht sollten wir mal noch ein paar Platten tauschen.
Eine Platte im RAID zeigt eine PFA-Warnung.
Ich schrieb ihm auf die Schnelle zurück und dachte, die Antwort (auch wenn sie nicht sauber ausgearbeitet ist, wäre auch was für hier):
Du vermutest richtig: Dieses Verhalten konnte/musste ich zwischenzeitlich bei mehreren Kunden beobachten. Das RAID-Gesamtsystem bringt den angeschlossenen Server zum Freeze, bzw. dazu, nicht mehr herunter zu fahren. Auch nicht per Terminal. Nur ein Steckerziehen des Thunderbolt-Kabels konnte helfen, den Server sauber herunter zu fahren – in fast allen Fällen. Sonst half nur ein hartes Ausschalten beider Geräte (was zu einer meißt zerschossenen OD-Datenbank führte).
Es lag in allen Fälle immer an einer Festplatte, die entweder klar als defekt erkannt/vermerkt wurde, oder auch mal an einer HD, die im Log noch nicht als fehlerhaft erschien.
Einmal, bei einem anderen Dienstleister, war das RAID-Gehäuse für den Fehler verantwortlich. Hier konnte der Support helfen. … online Gerät registrieren und darauf über deren Ticketsystem einen Fall eröffnen… Promise entschied dabei sogar, das ganze Gehäuse zu tauschen – weit außerhalb der Garantie. Auch interessant.
Doch bei meinen Fälle half: Festplatten austauschen. Zu mindest die betroffene, doch wie du schreibst, die anderen sind auch alt …

Kundenanfrage: Promise Pegasus RAID verursacht Serverausfälle weiterlesen