Hi zusammen,
mein eigentlich zuverlässiges WG hat ein Problem... Was habe ich gemacht?
Ich habe gestern Abend versucht, ein Backup (wie hier beschrieben https://redaktion.knx-user-forum.de/...bakcuprestore/) durchzuführen - nachdem das per USB-Stick nicht geklappt hat - wurde nicht erkannt - habe ich das script dann so angepasst, dass die Sicherung auf mein NAS erfolgt (DIRNAME angepasst). Dazu habe ich einen fstab-Eintrag hinzugfügt. Hat auch alles funktioniert, zwar langsam, aber nach ca. 3 Stunden war das Backup laut Log um 22:23 fertig. Die gz-Files sind auch OK.
Ich bin vorher schon ins Bett und habe dann heute Morgen gemerkt, dass einige auf dem Wiregate laufenden Logiken nichts tun - ein Check per Webmin ergab dann, dass der Wiregated- und der Monit-Prozess nicht liefen, ein Neustart der Dienste war nicht möglich. Die Verbindungen per Putty und WinSCP waren noch möglich, die CometVisu lief auch noch. Ich habe dann kurz die wiregate_plugin.log angeschaut - um 22:00 war der letzte Eintrag eines Plugins, danach folgen endlose binäre Nullen (so zeigt mir das zumindest Notepad++...)...
OK, ich dachte, vielleicht hat das Backup-Script das System einfach überlastet und habe einen Neustart versucht - ein Fehler... Das System landete in einer Endlos-Boot-Schleife. Nachdem ich dann das Netzteil gezogen, etwas gewartet und wieder gesteckt habe, gab's beim ersten mal eine Sirenen-Melodie, danach wieder die Endlos-Boot-Schleife.
Ich habe also das WG ausgebaut, Monitor und Tastatur vom Rechner gemopst und am WG angeschlossen....
Die Reboot-Schleife wird dadurch ausgelöst, dass er beim Filesystem-Check zuviele Fehler findet. Teilweiße, wenn kein Netzwerkkabel agesteckt ist, fällt der Reboot aus, es kommen dennoch massenweiße IO-Fehler und Fehlermeldungen wegen "Filesystem ist Readonly" etc... Einmal habe ich es geschafft, mich auf der Console anzumelden, teils kommt die Tonfolge wie beim Erfolgreichen Boot... Aber nutzbar ist nichts, ich bekomme nichtmal eth0 zum laufen. Auch beim navigieren im Dateisystem auf der Console hagelt es fehler, z.b. schon bei "cd etc".
Ich hänge mal ein paar "Handy-Screenshots" und das modifizierte Backup-Script an.
Wegen der IO-Fehler riecht das für mich nach Hardware-Fehler, aber warum sollte das Backup-Script dazu führen? Ich hatte vor einigen Monaten schon mal das Problem, dass das Wiregate nicht mehr booten wollte, da gings aber irgendwann wieder.... Hat evtl. der Lesezugriff auf die ganze Karte durchs Backup "schlafende Hunde" geweckt?
Was meint ihr? Hardware-Fehler? Oder eher doch nur ein kaputtes Dateisystem (aber warum dann? Habe ich das Script "verhunzt"? und wie fixen?)
Verzweifelte Grüße,
Chris
mein eigentlich zuverlässiges WG hat ein Problem... Was habe ich gemacht?
Ich habe gestern Abend versucht, ein Backup (wie hier beschrieben https://redaktion.knx-user-forum.de/...bakcuprestore/) durchzuführen - nachdem das per USB-Stick nicht geklappt hat - wurde nicht erkannt - habe ich das script dann so angepasst, dass die Sicherung auf mein NAS erfolgt (DIRNAME angepasst). Dazu habe ich einen fstab-Eintrag hinzugfügt. Hat auch alles funktioniert, zwar langsam, aber nach ca. 3 Stunden war das Backup laut Log um 22:23 fertig. Die gz-Files sind auch OK.
Ich bin vorher schon ins Bett und habe dann heute Morgen gemerkt, dass einige auf dem Wiregate laufenden Logiken nichts tun - ein Check per Webmin ergab dann, dass der Wiregated- und der Monit-Prozess nicht liefen, ein Neustart der Dienste war nicht möglich. Die Verbindungen per Putty und WinSCP waren noch möglich, die CometVisu lief auch noch. Ich habe dann kurz die wiregate_plugin.log angeschaut - um 22:00 war der letzte Eintrag eines Plugins, danach folgen endlose binäre Nullen (so zeigt mir das zumindest Notepad++...)...
OK, ich dachte, vielleicht hat das Backup-Script das System einfach überlastet und habe einen Neustart versucht - ein Fehler... Das System landete in einer Endlos-Boot-Schleife. Nachdem ich dann das Netzteil gezogen, etwas gewartet und wieder gesteckt habe, gab's beim ersten mal eine Sirenen-Melodie, danach wieder die Endlos-Boot-Schleife.
Ich habe also das WG ausgebaut, Monitor und Tastatur vom Rechner gemopst und am WG angeschlossen....
Die Reboot-Schleife wird dadurch ausgelöst, dass er beim Filesystem-Check zuviele Fehler findet. Teilweiße, wenn kein Netzwerkkabel agesteckt ist, fällt der Reboot aus, es kommen dennoch massenweiße IO-Fehler und Fehlermeldungen wegen "Filesystem ist Readonly" etc... Einmal habe ich es geschafft, mich auf der Console anzumelden, teils kommt die Tonfolge wie beim Erfolgreichen Boot... Aber nutzbar ist nichts, ich bekomme nichtmal eth0 zum laufen. Auch beim navigieren im Dateisystem auf der Console hagelt es fehler, z.b. schon bei "cd etc".
Ich hänge mal ein paar "Handy-Screenshots" und das modifizierte Backup-Script an.
Wegen der IO-Fehler riecht das für mich nach Hardware-Fehler, aber warum sollte das Backup-Script dazu führen? Ich hatte vor einigen Monaten schon mal das Problem, dass das Wiregate nicht mehr booten wollte, da gings aber irgendwann wieder.... Hat evtl. der Lesezugriff auf die ganze Karte durchs Backup "schlafende Hunde" geweckt?
Was meint ihr? Hardware-Fehler? Oder eher doch nur ein kaputtes Dateisystem (aber warum dann? Habe ich das Script "verhunzt"? und wie fixen?)
Verzweifelte Grüße,
Chris
Code:
#!/bin/bash export PATH=/usr/sbin:/usr/bin:/sbin:/bin export DIRNAME=/mnt/xxx/zzz nowdate=`date +%F_%H-%M` host=`hostname` echo "Backup started $nowdate" > $DIRNAME/wg-image.log dd if=/dev/hda of=$DIRNAME/MBR-Backup bs=512 count=1 dd if=/dev/hda1 bs=1M | gzip -9 > $DIRNAME/$host-hda1-$nowdate.img.gz dd if=/dev/hda2 bs=1M | gzip -9 > $DIRNAME/$host-hda2-$nowdate.img.gz fdisk -l /dev/hda > $DIRNAME/$host-hda_fdisk.info nowdate=`date +%F_%H-%M` echo "Backup ended $nowdate" >> $DIRNAME/wg-image.log sync sync beep -r 5
Kommentar