Wichtig: Downtimes
geschrieben von Jens, 08.12.2007 17:16 Uhr

Die aktuellen Probleme begangen bereits vor 1 Woche, am 01.12.07, als Abload von Roubaix (FR) nach Nürnberg (DE) zog. Bei der Synchronisation des neuen Servers mit dem alten begannen bereits im so genannten "Rescue Modus" die ersten Probleme, die den jetzigen sehr ähnlich sind. Das System verabschiedete sich immer wieder nach maximal 1h Betrieb, sodass nur noch ein Hardwarereset das System kurzzeitig wieder auf die Beine kriegen konnte. Diese Beobachtung schließt einen softwareseitigen Fehler aus.
Konsequenz 1: Da das System zuvor für einen anderen Kunden über längere Zeit problemlos lief, tauschte man die für uns zuvor eingebauten Festplatten aus. Das Problem konnte dadurch jedoch nicht behoben werden!
Konsequenz 2: Man beschloss, unsere neuen Festplatten in ein anderes, baugleiches System einzubauen und erhoffte sich damit einen fortan reibungslosen Betrieb.
Vier Tage lang gab es nun - seltsamerweise - keine Probleme, das Problem schien gelöst bzw. umgangen! Am 05.12.07 jedoch stürzte das Hauptsystem wieder unnachvollziehbar ab. Einige Sicherheitslogs ließen vermuten, dass es an der Netzwerkkarte liegt; ein Mitarbeiter der Hetzner AG war sich sogar "ziemlich sicher".
Konsequenz 3: Der Server bekam eine hochwertige 1 gbit/s Netzwerkkarte eingebaut, mit der es laut Hetzner AG bisher nahezu nie Probleme gab. Das Problem schien endgültig gelöst, doch dem war nicht so.
Nach einer Flood-Attacke auf einen Server in unserem Netzsegment (am Abend des 07.12.07), die und der rein gar nichts mit uns oder unserem Hauptproblem zu tun hatte, trotzdem aber für eine schlechte Erreichbarkeit sorgte, verabschiedete sich unser Hauptsystem heute nachmittag erneut mit denselben Symptomen wie vor einigen Tagen. Eine Ursache oder ein veränderter Zustand unseres Servers konnte und kann nach wie vor weder von der Hetzner AG noch von uns festgestellt werden. Nach einem Hardware-Reset stürzte der Server erneut binnen weniger als 1 Stunde vollständig ab, sodass nur ein weiterer übrig blieb.
Konsequenz 4: Wir werden uns voraussichtlich am 10.12.07 ein komplett neues System zusammenbauen lassen, das weder Sockel noch Netzwerkkarte noch sonst irgendetwas mit dem alten System gemein hat. Dummerweise beginnt für Hetzner Samstags ab 17 Uhr das Wochenende, sodass die entsprechenden Leute, die dafür zuständig sind, nicht mehr vor Ort sind. Weder die, die darüber entscheiden können noch die, die das System zur Verfügung stellen und anpassen müssten.
Das Hauptproblem ist aber, dass ab jetzt (bis Montag) auch niemand mehr im Rechenzentrum ist, der den Server kostenfrei neustarten könnte; jeder manuelle Neustart würde uns pauschal 119€ kosten.
Konkret heißt das, dass wir jetzt nur hoffen können, dass das Haupt-System von jetzt bis Montag durchläuft. Alles, was grundsätzlich Fehlerquelle sein könnte, wurde temporär deaktiviert (davon bekommst Du nichts mit). Die Netzwerklast wurde auf ein Minimum gesenkt (=> sämtliche Downloads/Mirror usw. wurden deaktiviert).
Wir bitten Dich um Verständnis; wir sind einfach machtlos im Moment.
0 Kommentare
Bisher sind noch keine Kommentare vorhanden. Vielleicht möchtest du ja den ersten schreiben?Kommentieren
Um kommentieren zu können musst du dich einloggen oder registrieren.