Ankündigung

Einklappen
Keine Ankündigung bisher.

- √ - Wiregate unerreichbar übers Netzwerk

Einklappen
Dieses Thema ist geschlossen.
X
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    [wiregate] - √ - Wiregate unerreichbar übers Netzwerk

    Hallo,

    auch mir ist es jetzt zum 3. Mal passiert, dass das Wiregate plötzlich nicht mehr reagierte. Es ist nicht abgestürzt sondern war einfach über das Netz quasi so gut wie nicht mehr ansprechbar (wir sprechen von Ping-Zeiten > 10 Sekunden)

    Einloggen per SSH oder Aufruf des Webinterfaces waren aussichtslos, und da ich an der Stelle keinen Monitor verfügbar habe half nur das Ziehen des Steckers.
    Seitdem läuft es wieder normal. Das trat schon zweimal auf, jeweils mit ein paar Wochen uptime dazwischen.

    Das restliche Netz war einwandfrei verfügbar.

    Ich habe jetzt mal das Wartungs-VPN aktiviert, Wiregate Nummer 362, vielleicht könnt ihr ja etwas entdecken.

    Danke
    Michael

    #2
    Hallo Michael,

    das sehen wir uns an (kann möglicherweise ein paar Tage dauern, außer es ist SEHR dringend?).

    lg

    Stefan

    Kommentar


      #3
      Nun, wir sind ja immer ehrlich..
      Ich kenne das Phänomen zwar (extrem selten) aber es ist 0,0 greifbar und keine Ahnung wo das herkommt (kann genausogut der Switch uvm. sein..) - reproduzierbar - so ähnlich - nur mit einem massiven DoS

      Lange Rede, kurzer Sinn: ich hab deshalb (nur ein vager Verdacht!) einen neuen Kernel (3.5.1) gebacken, und soeben dort installiert weil der wird nicht automatisch ausgerollt (zu hohes Risiko, wenn während der Installation was schiefgeht.. und zuwenig Beweise das es wirklich das Problem ist..)

      Reboot ist noch notwendig -> bitte selbst wenns passt, schiefgehen tut nichts, die loadavg ist (angezeigt) etwas höher, läuft ansonsten aber seit Monaten..

      -> Es würde mich jedoch brennend interessien ob es damit weg ist, weil bisher konnte ich das nicht "beweisen" und damit macht der Rollout auch keinen Sinn..

      Makki

      P.S.: Ich vermute irgendwelche blöden packerl die irgendwie... Also nehme ich auch gerne Infos zur sonstigen Infrastruktur an, was läuft, wo, irgendwas "unübliches"?
      Ich würde gerne den Grund wissen..
      EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
      -> Bitte KEINE PNs!

      Kommentar


        #4
        Hallo Makki,

        exakt diesen Effekt hatte ich (wie in dem anderen Thread beschrieben) auch: Ping-Zeiten von weit über 1000ms, "Connection Reset" bei dem Versuch aufs Webmin zuzugreifen. Das ganze ist einmal letzte Woche passiert und vorher einmal ca. 6 Monate vorher.

        Switch war in beiden Fällen ein Cisco 2950, der ist jetzt aber rausgeflogen für einen TP-Link. Ansonsten: Du kannst gerne gucken (WG371), an Hardware sind nur Busmaster und der NanoDMX dran, software-mässig der Standard+OLA+knxdmxd, OLA+knxdmxd sind "neu".

        Gruss,

        der Jan
        KNX, DMX over E1.31, DALI, 1W, OpenHAB, MQTT

        Kommentar


          #5
          @Jan: selbe Massnahme, bitte rebooten wenns passt (*) und bei Zeiten berichten (das passiert nicht in wenigen Tagen..)
          Ich würde mich freuen wenns das ist, glaube aber nur 50:50 daran..

          Makki

          *) Nochmal: ist gefahrlos, kritisch ist nur das Update, der Kernel ist zwar sehr "frisch" aber auch sehr gut getestet - letztlich ist es in etwa das, was mit Ubuntu 12.10 gerade als Release geschippert wird
          EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
          -> Bitte KEINE PNs!

          Kommentar


            #6
            Hallo zusammen!

            Ein paar Kommentare:
            ich habe dass auch immer wieder mal (1x/Monat), PL32.

            Das WG ist dann nicht mehr erreichbar, der Router lässt mich aber über WLAN ins Internet.
            - Netzwerkkabel des WG ab/anstecken hilft nicht.
            - Neustart des Browsers hilft nicht
            - ABER: Neustart des PCs => alles läuft wieder!!! (Anmerkung: ich verwende sonst ausschließlich Ruhezustand).

            Soviel von meiner Seite, spricht durchaus für Makki's Theorie, dass das nicht am WG liegt.

            lg Robert

            Kommentar


              #7
              Zitat von makki Beitrag anzeigen
              P.S.: Ich vermute irgendwelche blöden packerl die irgendwie... Also nehme ich auch gerne Infos zur sonstigen Infrastruktur an, was läuft, wo, irgendwas "unübliches"?
              Ich würde gerne den Grund wissen..

              Hi makki,

              erstmal danke für die schnelle Hilfe.
              Was ich nachinstalliert habe weiss ich nicht mehr genau, ich nenne mal die Kandidaten, kann aber sein, dass da Pakete dabei sind, die schon standardmäßig installiert waren:

              - linknx
              - linphone (wird aber nicht mehr benutzt)
              - apache2 oder lighttpd (original war glaub ich nur einer der beiden drauf, richtig?)
              - Nagios3

              OpenVPN wird benutzt, da ist eigentlich immer ein Client verbunden

              Restliche Infrastruktur:
              - Switch: HP ProCurve
              - Fritzbox als Router + 2 weitere als W-LAN Accesspoints
              - Ein Server der ständig läuft mit VDR
              - Gigaset C610 VoIP DECT Basisstation


              Ich beobachte das ganze jetzt mal mit dem neuen Kernel, falls es wieder hängt, melde ich mich wieder.

              Kommentar


                #8
                Das mag jetzt blöd klingen, aber die SW kann ich hier komplett ausschliesen - es war aber in einigen Fällen schon ein HP-switch dabei (ich hab nichts gegen HP, ist halt nur stark aufgefallen) - und einmal konnte ich es sogar beweisen (hat NTP geschrottet)

                Das ist sehr diffus, ich wüsste aber brennend gerne, was die wirkliche Ursache ist!! (die NTP-Nummer der HP's ist bekannt, wenn man weis nach was man sucht..)

                Normalerweise beantworte ich das mit HW-Tausch, hats in 100% auch gebracht - nur finde ich bei den Rückläufern leider 0,0%-Problem und hab daher den Verdacht, das damit nur - vermutlich mehr oder minder zufällig - am Symptom gedoktert wurde, nicht das Problem gelöst - weil die HW ist i.O.. (Wir prüfen die ja auch vorher..)
                Also weg von HP, kann sein, muss nicht, glaub ich auch nicht..

                Ich hatte aber noch nie die Chance, das wirklich am Live-system zu sehen (entweder kein Zugang, keine Teile über die man nachdenkt, ob sie funktionieren können - oder keine verlässliche Info über die *gesamte* Infrastruktur..)

                -> Falls es mit dem neuen Kernel weg ist, würde ich trotzdem viel dafür geben, herauszufinden, wo eigentlich das Problem liegt; falls nicht: umso mehr. (zweites WG zum test oder so; ich kanns nach 4J abschiessen wenn ich will aber, ehrlich, da muss man schon echt wissen was man tut und im 100MBit LAN sitzen - und das kann mit jedem System wenn man nach viel Aufwand weiss - wie,,)

                Wir tauschens gerne, beim nächsten würde ich das alte aber dortlassen wenns geht - ich bin mir ziemlich sicher das es das nicht ist aber ich würde halt verdammt gerne wissen was es ist...

                Und nun gegen die Angst: ja da ist mal was kaputt, wir reden da aber von <<1%, der Rest ist Kulanz oder eben unverständlich und trotzdem Kulanz;
                Kulanz ist im Rahmen, unverständlich jedoch mag ich nicht Die anderen knapp 1000 funktionieren, wir sind nur aus Marketing-Sicht bestimmt einfach viel zu ehrlich

                Die Nummer "tot" kann ja mal vorkommen (wir reden über >0.1%) aber die Nummer würde ich echt gerne finden - wenn uch sehr selten..

                Makki
                EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                -> Bitte KEINE PNs!

                Kommentar


                  #9
                  Ist mal ne ehrliche Reaktion. Findet man selten.



                  PS: Bei mir gabs das noch nie. Uptime aktuell: 415 Tage.
                  Allerdings verwende ich hier im Haus, auch auf meinem Desktop, ausschließlich Linux. @Makki: Ich würde diese Fälle hinsichtlich des zugreifenden OS mal statistisch erfassen.
                  Kein Support per PN: Fragen bzw. Fehlermeldungen bitte im Forum posten.

                  Kommentar


                    #10
                    Ich auch + eine Wndows VM in der die ETS läuft

                    Kommentar


                      #11
                      Abhängigkeit vom Client-OS würde ich nahezu ausschliessen, die Masse verwendet Windoze, vielleicht 5-10% Mac, ich selbst Win/Linux - das wär schon lang deutlicher aufgefallen..

                      Meine beste Idee: mal testen obs nach einem Reset des Switch (nicht nur abstecken des LAN! ) auch weg ist;
                      Das ist nur einer von vielen Verdachtsmomenten aber..

                      Makki
                      EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                      -> Bitte KEINE PNs!

                      Kommentar


                        #12
                        Es gibt da noch einen (bekannten) Bug bei den HP 1810-48G-Switches, der dafür sorgt, dass nach einigen Tagen plötzlich bestimmte Ports keine Verbindung mehr aufbauen können (Link wird als aktiv angezeigt, allerdings ist daran nichts mehr erreichbar). Beschrieben wird der Bug hier:
                        HP 1810 Switch Series -  HP 1810 Switch Series - Switch May Become Unresponsive and/or Clients May Become Unreachable - c03476648 - HP Business Support Center

                        Bislang (16.10.2012) musste man sich an den Support wenden, um die korrigierte Firmware zu erhalten. Mittlerweile gibt es die PK 1.13 aber auch als Download: https://h10145.www1.hp.com/Downloads...riesId=3963985

                        Bei uns verschwanden immer wieder Rechner vom Netzwerk. Nach dem Einspielen der 1.13 trat das nicht mehr auf.
                        KNX: MDT, Gira TS3, Berker, Theben, PEAR, Preussen BWM, B.E.G., BMS Quadra, WireGate, Timberwolf 2500 | Baublog

                        Kommentar


                          #13
                          Guter Hinweis, ich tippe nämlich auch auf sowas in der Art (Switch, Mac-Address-table,..)
                          Nachm reboot vom Wiregate wird natürlich auch der Switchport resettet und nachdem ich definitiv zwei auf dem Schreibtisch habe, die seit Monaten einwandfrei funktionieren aber im Feld dieses Fehlerbild hatten - überkommen mich halt Zweifel das es am WG liegt..
                          In einem Fall wars ein HP-Switch, im zweiten weiss ich es nicht.. Bleibt ein: ?

                          Makki
                          EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                          -> Bitte KEINE PNs!

                          Kommentar


                            #14
                            Hi,

                            ich bin nur per Zufall hier gelandet. Allerdings könnte es wirklich am ARP Cache liegen, wenn z.B.: das WG per DHCP seine IP bekommt und die Lease ausläuft, der Switch vornedran das nicht schnallt, das WG sich keine neue Lease holt oder bekommt und schwupps isses "offline".

                            Das hatten wir hier mit kleinen Settopboxen mal. Meistens in Verbindung mit einem kleinen billigen Switch (Netgear wenn man das hier nennen darf). Switch reset und/oder per Konsole das Netzwerk stoppen/starten half damals. Mittlerweile haben wir die Switche alle rausgeschmissen und die Boxen auf feste IPs gesetzt.

                            Sporatische Fehler sind die schlimmsten..... da kann ich Euch (Makki) bei der Fehlersuche nachfühlen, damit hab ich auch fast täglich zu tun.

                            In solchen Fällen immer gleich "Buch" führen wann der Fehler wieder aufgetreten ist, ob es wirklich sporatisch oder zeitabhängig/Event abhängig ist.

                            Viel Glück bei der Suche!

                            Gruß

                            Thorsten

                            Kommentar


                              #15
                              Zitat von dombn Beitrag anzeigen
                              Es gibt da noch einen (bekannten) Bug bei den HP 1810-48G-Switches, der dafür sorgt, dass nach einigen Tagen plötzlich bestimmte Ports keine Verbindung mehr aufbauen können (Link wird als aktiv angezeigt, allerdings ist daran nichts mehr erreichbar).
                              [...]
                              Bei uns verschwanden immer wieder Rechner vom Netzwerk. Nach dem Einspielen der 1.13 trat das nicht mehr auf.
                              Naja, das Wiregate war ja noch pingbar. Allerdings mit grausamen Packet Losses und Pingzeiten > 10 Sekunden.

                              Ich werd den Patch trotzdem mal installieren.

                              Kommentar

                              Lädt...
                              X