Ankündigung

Einklappen
Keine Ankündigung bisher.

Wiederholter Absturz des WG

Einklappen
Dieses Thema ist geschlossen.
X
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    [wiregate] Wiederholter Absturz des WG

    Hallo zusammen,

    mir ist heute Nach zum zweiten Mal innerhalb von drei Wochen das WG "abgestürzt". Symptome: IP-Routing (vom EibPC und ETS) funktioniert nicht mehr, Webmin/SSH/usw. nicht mehr erreichbar.
    Letzte Änderung dürfte das Update auf PL33 (?) Ende September/Anfang Oktober gewesen sein.

    Gibt es Empfehlungen zur Forensik? Kann man im Nachgang noch feststellen, woran es gelegen hat? Mich irritiert, dass das WG lange Zeit stabil lief und nun plötzlich direkt zwei Mal ausgestiegen ist.

    Danke
    Christian

    #2
    Hallo Christian,

    am hilfsreichsten ist, wenn wir uns das direkt per Fernwartung ansehen können, weil das Lesen in den Logs ist mit tieferen Systemkenntnissen am sinnvollsten.

    Wenn möglich, bitte Wartungs-VPN freigeben und uns hier die WG-Nummer schreiben.

    Merci

    Stefan

    Kommentar


      #3
      Hallo Stefan,

      die Ampel für die Wartungsverbindung steht auf grün, mein WG hat die Nr. 159.
      Schonmal besten Dank vorab.

      Christian

      Kommentar


        #4
        Ich würde aus dem Bauch an eine Unterversorgung am USB tippen, da hängt ne Menge lustiges Zeug dran - kann man ja machen - aber dann muss alles 100% passen..

        Code:
        root@wiregate159:~# lsusb 
        Bus 002 Device 002: ID 03eb:204b Atmel Corp. 
        Bus 002 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub
        Bus 001 Device 011: ID 03eb:2018 Atmel Corp. at90usbkey sample firmware (CDC ACM)
        Bus 001 Device 008: ID 04fa:2490 Dallas Semiconductor DS1490F 2-in-1 Fob, 1-Wire adapter
        Bus 001 Device 007: ID 04d8:000a Microchip Technology, Inc. 
        Bus 001 Device 006: ID 04fa:2490 Dallas Semiconductor DS1490F 2-in-1 Fob, 1-Wire adapter
        Bus 001 Device 005: ID 04fa:2490 Dallas Semiconductor DS1490F 2-in-1 Fob, 1-Wire adapter
        Bus 001 Device 004: ID 04fa:2490 Dallas Semiconductor DS1490F 2-in-1 Fob, 1-Wire adapter
        Bus 001 Device 003: ID 0409:0050 NEC Corp. 
        Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
        root@wiregate159:~# lsusb -t
        Bus#  2
        `-Dev#   1 Vendor 0x1d6b Product 0x0001
          `-Dev#   2 Vendor 0x03eb Product 0x204b
        Bus#  1
        `-Dev#   1 Vendor 0x1d6b Product 0x0002
          `-Dev#   3 Vendor 0x0409 Product 0x0050
            |-Dev#   4 Vendor 0x04fa Product 0x2490
            |-Dev#   5 Vendor 0x04fa Product 0x2490
            |-Dev#   6 Vendor 0x04fa Product 0x2490
            |-Dev#   7 Vendor 0x04d8 Product 0x000a
            |-Dev#   8 Vendor 0x04fa Product 0x2490
            `-Dev#  11 Vendor 0x03eb Product 0x2018
        Makki
        EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
        -> Bitte KEINE PNs!

        Kommentar


          #5
          Hallo Makki,

          Zitat von makki Beitrag anzeigen
          Ich würde aus dem Bauch an eine Unterversorgung am USB tippen, da hängt ne Menge lustiges Zeug dran
          das würde mich wundern, denn der Kram (4x 1W-Busmaster, 1x Nano-DMX, 1x CUL868, 1x CAN-IF) hängt bis auf das CUL an dem powered USB-Hub aus Eurem Shop. Das CAN-Interface ist vor ~3Monaten dazu gekommen, der Rest ist seit >1 Jahr gesteckt. Probleme gab es bisher nicht. Und ja, der USB-Hub ist auch mit Strom versorgt

          Kommentar


            #6
            Hallo Stefan, Makki,

            habt Ihr noch Hinweise finden können, was das Problem ist? Wie gesagt, das Bauchgefühl trügt an der Stelle.

            Danke
            Christian

            Kommentar


              #7
              Selbe vage Vermutung wie hier, selbe Massnahme
              Bitte selbst - wenns passt rebooten und in einigen Wochen berichten..

              Makki
              EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
              -> Bitte KEINE PNs!

              Kommentar


                #8
                Hallo Makki,
                Gut, ich werde am Wochenende neu starten und beobachten. Ein paar andere Phänomene (Seiten im Webmin wurdennur zum Teil übertragen usw.) hatte ich übrigens auch.

                Erstmal schönen Dank fürs ansehen
                Christian

                Kommentar


                  #9
                  Zitat von chriss1980 Beitrag anzeigen
                  Ein paar andere Phänomene (Seiten im Webmin wurdennur zum Teil übertragen usw.) hatte ich übrigens auch.
                  Das klingt 99,9% nach anderen Problemen im LAN/WAN (meist sowas wie MTU, STP, ...), die ich auch primär, 90% vermute..
                  Welcher 1st-level support kennt sich damit schon aus und "riecht" sowas anhand der Beschreibung; also landet es halt hier..
                  soll nicht arrogant klingen - aber Stolz: was hatten wir nicht schon alles an Pferden kotzen sehen, es war eigentlich fast nie das WG sondern was ganz anderes..

                  -> Aber die eine Sache an der ich was ändern kann, kann ich damit ausschliessen

                  Makki
                  EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                  -> Bitte KEINE PNs!

                  Kommentar


                    #10
                    Hallo Makki,

                    Zitat von makki Beitrag anzeigen
                    -> Aber die eine Sache an der ich was ändern kann, kann ich damit ausschliessen
                    das ist schön für Dich, vor allem da niemand weiß, was Du überhaupt als potentielle Notwendigkeit für den neuen Kernel identifiziert hast. Wie gesagt, ich bedanke mich für das Anschauen und Installieren des neuen Kernels. Alles andere ist aber sinnlose Spekulation, die weder mir noch anderen hilft.

                    Schöne Grüße
                    Christian

                    ps: oben geschildertes Problem tritt übrigens ausschließlich mit dem Wiregate-Webmin auf - auf verschiedenen Rechnern und mit verschiedenen Betriebssystemen. Das Netzwerk ist standard und läuft seit >2 Jahren stabil. Konfigurationsänderungen (außer dem WG-PL33) hat es nicht gegeben, und die Parameter verstellen sich ja nicht von selbst. BTW, für mich klingt das eher nach sterbenden Prozessen, die dann leider nicht mehr alle Daten (z.B. 1W-Sensorliste) übermitteln können.

                    Kommentar


                      #11
                      Hallo zusammen,

                      ich bin mir gerade nicht sicher, ob ich an diesen Thread den "gelöst"-Haken setzen sollte... nach dem Kernel-Update läuft das WG bei mir eigentlich wieder stabil durch.
                      Da ich gerade aber wieder vor dem Problem stand, dass der Webmin nur Bruchteile der Seiten ausliefert (Cometvisu und drraw machen keine Probleme) bin ich ein bisschen durch die Logs gegangen und habe u.a. das hier gefunden:

                      Code:
                      Nov 17 12:48:49 wiregate159 monit[2765]: 'localhost' loadavg(5min) of 2.3 matches resource limit [loadavg(5min)>2.0]
                      Nov 17 12:48:49 wiregate159 monit[2765]: 'lighttpd' total mem amount of 64048kB matches resource limit [total mem amount>51200kB]
                      Nov 17 12:49:49 wiregate159 monit[2765]: 'localhost' loadavg(5min) of 3.1 matches resource limit [loadavg(5min)>2.0]
                      Nov 17 12:49:49 wiregate159 monit[2765]: 'localhost' loadavg(1min) of 6.1 matches resource limit [loadavg(1min)>4.0]
                      Nov 17 12:49:49 wiregate159 monit[2765]: 'lighttpd' total mem amount of 60276kB matches resource limit [total mem amount>51200kB]
                      Nov 17 12:50:49 wiregate159 monit[2765]: 'localhost' loadavg(5min) of 3.6 matches resource limit [loadavg(5min)>2.0]
                      Nov 17 12:50:49 wiregate159 monit[2765]: 'localhost' loadavg(1min) of 5.6 matches resource limit [loadavg(1min)>4.0]
                      Nov 17 12:50:50 wiregate159 collectd[2426]: processes plugin: Failed to open `/proc/3245/cmdline': No such file or directory.
                      Bei Top konkurrieren eibd und owserver um den Spitzenplatz mit jeweils 10-40%.

                      Ein Neustart hat die Sache leider auch nicht verbessert.

                      Ideen? Tips?

                      Danke
                      Christian

                      Kommentar


                        #12
                        Erstmal: die loadavg ist mit dem neuen Kernel höher, vermutlich aber nur weil anders gerechnet wird.. Hatte da noch keine musse im Detail zu suchen..

                        Die Netzwerkthemen treten zwischen einem und 180 Tagen auf, also sollte man erstmal beobachten.
                        (und nochmal, nur so für die Mitleser: das ist ein sehr seltenes "Einzelschicksal" dessen Ursache - falls man keine DoS-Angriffe in seinem LAN fährt - teilw. unklar ist.. hunderte andere laufen mit dem ersten Kernel von 2007 jahrelang durch)

                        Der memuse des lighttpd (Webserver, nicht webmin!) ist allerdings bedenklich, hat aber wiederum nicht mitm Kernel zu tun.

                        Hast du zufällig
                        a) "leere" CV-Demo-configs, wo keine der GA's existiert?
                        b) drraw-Grafiken, viele davon?
                        c) wäre ansonsten interessant, wer den Speicher da frühstückt, gibts ein nettes Script

                        Makki
                        EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                        -> Bitte KEINE PNs!

                        Kommentar

                        Lädt...
                        X