Nichterreichbarkeit

Neue Frage »

Thomas Auf diesen Beitrag antworten »
Nichterreichbarkeit
Gestern mittag um ca. 14 Uhr hat ein Ausfall der USV (unterbrechungsfreie Stromversorgung) einen Neustart aller Server im Rechenzentrum verursacht.

Der Großteil der Rechner (auch der von Matheboard.de) konnte dann nicht mehr von alleine booten, so dass die Techniker bis tief in die Nacht an der Wiederherstellung der Server arbeiteten. Wir sind zurück!

Wir möchten uns für den Ausfall entschuldigen, der in seinem Ausmaß hoffentlich einmalig bleiben wird und wünschen euch weiterhin viel Spass mit Matheboard.de!

Thomas im Namen des Matheboard.de Teams
20_Cent Auf diesen Beitrag antworten »
RE: Nichterreichbarkeit
Zitat:
Original von Thomas
ein Ausfall der USV (unterbrechungsfreie Stromversorgung)


verwirrt
hab nur ich mich gefragt, wieso die so heißt? Big Laugh
mYthos Auf diesen Beitrag antworten »

Die heisst deswegen so, weil sich jeder Ausfall der (externen) Stromversorgung nicht auf das USV-versorgte Gerät auswirkt, indem innerhalb einer bestimmt definierten Zeitspanne die redundante SV einspringt und es für das Gerät so aussieht, als hätte keine Unterbrechung der SV stattgefunden.

Gr
mYthos

P.S: Ungewöhnlich ist die lange Zeit des Serverausfalles, das dürfte eigentlich in einem RZ nicht passieren! Auch die Erkärung des Fehlers ist nicht ganz nachvollziehbar ...
Thomas Auf diesen Beitrag antworten »

Hi,

sorry dass ich heute früh nicht mehr ausführlich erklären konnte.

Nicht der Strom scheint ausgefallen zu sein, sondern ein Fehler in der USV hat einen Neustart aller Server im Rechenzentrum verursacht (warum auch immer, wieso auch immer - das weiß ich nicht).

Viele der Server brauchten aber "manuelle Betreuung", wegen "hängen" beim Filesystemcheck beim Booten oder Kernel Panic.
Da das einige 100 Server waren, hat dies so lange gedauert (und wir nach Murphys Law natürlich als einer der letzten drankamen). Dass das normalerweise nicht passieren dürfte, ist klar. Buschmann
War auch kein gewöhnlicher Ausfall eines einzelnen Servers.

Ich hoffe, dass es nun nachvollziehbarer ist.

Gruß,
Thomas
jama Auf diesen Beitrag antworten »

Hier die offizielle Begründung seitens des Providers:

Zitat:
RZ6 hatte eben einen Ausfall der USV, weshalb sämtliche Server neu gestartet wurden. Wir sind dabei den Vorfall zu untersuchen. Falls Ihr Server im Moment nicht zu erreichen ist, senden Sie bitte eine Mail an [email protected]. Bitte nicht anrufen, da die Telefonleitungen überlastet sind.


Zitat:
Nach wie vor sind alle unsere Techniker im Einsatz um die restlichen Server wieder online zu bringen. Eine Überpruefung der USV nach der Wiederinbetriebnahme (ohne Last) ergab keine Fehlfunktion. Der Techniker von Emmerson kann keine Fehler in der Anlage feststellen, die zu dem Ausfall hätte führen können. Da wir eine zweite Anlage selber Bauart bereits vor Ort haben, haben wir kurzfristig beschlossen, die zweite Anlage am Freitag vorzeitig in Betrieb zu nehmen. Das gibt uns Gelegenheit die bestehende Anlage auf Herz und Nieren zu testen, bevor sie wieder in den Lastbetrieb gehen wird. Die zweite Anlage war eigentlich Teil der Expansion von RZ6.


Eine abschließende Erklärung steht meines Erachtens nach noch aus...

Gruß,

Jama
sqrt(2) Auf diesen Beitrag antworten »

Zitat:
Original von Thomas
Viele der Server brauchten aber "manuelle Betreuung", wegen "hängen" beim Filesystemcheck beim Booten oder Kernel Panic.

Die haben ganz definitiv eine ziemlich kaputte Konfiguration...
 
 
jama Auf diesen Beitrag antworten »

Die anderen Nachhilfeforen sind seit 9:46 Uhr nicht erreichbar. Grund: Server wurde von einem Dritten benutzt, um andere Server zu attackieren.

Wir sind seitdem dabei, dem beizukommen.

Neuigkeiten dazu werden hier zeitnah bekannt gegeben.

Grüße,

Jama
Thomas Auf diesen Beitrag antworten »

Server vorläufig wieder up & running.

Gruß,
Thomas
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »