Ankündigung

Einklappen
Keine Ankündigung bisher.

Wo sind die RRDs hin

Einklappen
Dieses Thema ist geschlossen.
X
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    [wiregate] Wo sind die RRDs hin

    Hallo zusammen,

    musste gerade erstaunt feststellen, dass sich der Werbserver beim Generieren der Graphen mit der graph.pl über fehlende RRDs wundert. Ein Blick in /var/rrd zeigt dann auch, dass dort (fast) alle RRDs fehlen. Es sind noch 1 Temperaturwert, die error RRDs für die beiden Busmaster und die per Plugin generierten RRDs da, der Rest fehlt.

    Die Sensoren tauchen aber vollständig im Webmin auf, Busfehler werden nicht gemeldet und die angezeigten Messwerte sind plausibel.

    Eingrenzen kann ich das ganze leider nur grob, im Backup vom 20.01. sind sie noch vorhanden (es halt also nicht mit dem Absturz von vor ein paar Wochen zu tun), im gestrigen Backup fehlen sie. Mein Fehler, ich wollte da schon längst ein rotierendes Backup einrichten... Mache ich jetzt direkt!

    Zur Ursache kann ich nicht viel beitragen, irgendwelche Abstürze oder Stromausfälle gab es nicht, das Wiregate wurde in der Zeit zwar neu gestartet, aber immer sauber über den Webmin.

    In den logs ist mir auf die schnelle nicht viel aufgefallen, gestolpert bin ich nur über über mehrere Segfaults beim OWS-Server im Kernellog:
    Code:
    owserver[2490]: segfault at b8014236 ip 0804e49f sp b749f348 error 4
    Außerdem gibt es Meldungen vom wiregate-ow.pl dieser Art:
    Code:
    Jan 16 19:38:08 wiregate198 /usr/sbin/wiregated-ow.pl: INFO - Created RRD for 26.4A6C29000000_VDD
    Diese RRD ist aber z.B. auch nicht mehr vorhanden.

    oder hier
    Code:
     23 08:44:56 wiregate198 /usr/sbin/wiregated-ow.pl: INFO - ALARM: 1-Wire adapter 81.D68D2D000000 disappeared!
    Jan 23 08:44:56 wiregate198 OWFS[21343]: DEFAULT: ow_daemon.c:(143) Entered background mode, quitting.
    Jan 23 08:44:56 wiregate198 OWFS[21343]: DEFAULT: ow_usb_msg.c:(333) Opened USB DS9490 bus master at 2:3.
    Jan 23 08:44:56 wiregate198 OWFS[21343]: DEFAULT: ow_usb_cycle.c:(191) Set DS9490 2:3 unique id to 81 D6 8D 2D 00 00 00 16
    Jan 23 08:44:56 wiregate198 OWFS[21343]: DEFAULT: ow_usb_msg.c:(333) Opened USB DS9490 bus master at 2:2.
    Jan 23 08:44:56 wiregate198 OWFS[21343]: DEFAULT: ow_usb_cycle.c:(191) Set DS9490 2:2 unique id to 81 78 9A 2D 00 00 00 74
    Jan 23 08:44:58 wiregate198 /usr/sbin/wiregated-ow.pl: INFO - No DS9490 found - owserver restart and fill cache..
    Jan 23 08:44:58 wiregate198 monit[2430]: 'owserver' process PID changed to 21343
    Jan 23 08:45:58 wiregate198 monit[2430]: 'owserver' PID has not changed
    (Aktuell werden aber beiude Busmaster angezeigt)

    Das Wiregate (198) hat PL 34 mit Kernel 3.5.1.


    Vor allem wäre ich natürlich an der Klärung der Ursache interessiert. Außerdem die Frage, ob ich das Backup einfach zurück sichern kann und die RRD mit der Lücke klar kommt (vermute ich mal)?.

    Außerdem hatte ich eigentlich vermutet, dass die RRDs neu generiert werden, wenn sie nicht da sind aber benötigt werden. Oder liege ich da falsch?

    Wenn ich noch irgend etwas beitragen kann oder das Wartungs-VPN gefragt ist, dann bitte einfach melden!

    Viele Grüße,
    Jockel

    #2
    Erstmal: die RRDs vom Backup kannste einfach zurückspielen, kein Problem.

    Passieren tut das eigentlich nur in uralten Versionen (2-3J) wenn man zu früh "Speichern" drückt, isnofern würde es mich interessieren, wie das zustande kam..

    Makki
    EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
    -> Bitte KEINE PNs!

    Kommentar


      #3
      Passieren tut das eigentlich nur in uralten Versionen (2-3J) wenn man zu früh "Speichern" drückt, isnofern würde es mich interessieren, wie das zustande kam..
      Das kann ich leider nicht mehr genau sagen. Im fraglichen Zeitraum habe ich jedenfalls den Dialog zur Konfiguration der Sensoren nicht angefasst.

      Am letzten Montag habe ich allerdings recht viel mit der openVPN Konfiguration herumgespielt und dabei das Wiregate auch 1 oder 2 mal neu gestartet, allerdings ausschließlich über das Webmin. Außerdem habe ich die KNX Adressen zur Freischaltung des VPNs geändert und ein überflüssiges Plugin gelöscht, dass hatte aber auch nichts mit den RRDs zu tun sondern hatte das PPTP VPN gestartet.

      Das Wiregate selbst ist aus 2010, allerdings ist es auf aktuellem PL 34. Ob ich das Update vorher oder nachher gemacht habe kann ich nicht genau sagen, da müsste ich in den Logs suchen, max war es aber der vorhergehende PL.

      Gibt es irgendwelche Hinweise in den Logs die Dir helfen würden? Auf jeden Fall hab ich die vorsichtshalber mal gesichert!

      Kommentar


        #4
        Noch ergänzend: Es war PL34, der ist am 14.01. drauf gekommen!

        Kommentar


          #5
          Zitat von Jockel Beitrag anzeigen
          Auf jeden Fall hab ich die vorsichtshalber mal gesichert!
          Das ist - Systemunabhähig - immer eine verdammt gute Idee
          Was wann installiert wurde, steht in /var/log/dpkg.log*

          Makki
          EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
          -> Bitte KEINE PNs!

          Kommentar


            #6
            Was wann installiert wurde, steht in /var/log/dpkg.log*
            Da ist der letzte Eintrag das Update auf PL 34 am 16.01., also bevor das Problem aufgetreten ist.

            Einen Punkt hatte ich noch vergessen: Am vergangenen Montag habe ich auch den exim konfiguriert, kann aber eigentlich auch nicht glauben, das es daran liegen sollte.

            Kommentar


              #7
              Und noch eine Ergänzung: Hatte nicht daran gedacht dass die GAs für das VPN auch in der Sensor-Konfiguration eingestellt werden. Damit wäre das im Moment mein heißester Kandidat, die habe ich vor einer Woche geändert!

              Kommentar


                #8
                So, die RRDs hab ich zurückgesichert und danach im Webmin kontrolliert, dass ich die Graphen wieder zu sehen bekomme.

                Jetzt hab ich noch mal nachgeschaut und die Graphen über die letzten 24h sind alle leer, bei den Zahlenwerten in der Legende wird für den aktuellen Wert sowie Mittel, Min und Max jeweils "nan" angezeigt, was ja wohl "Not a number" heißen dürfte. Historische Werte, z.B. vom letzten Jahr werden aber weiter angezeigt wenn ich start und stop in der Adresszeile entsprechend anpasse.

                Was bitte ist denn da jetzt schon wieder los?

                Kommentar


                  #9
                  Und noch eine Ergänzung: Hab jetzt in der Webmin Sensor Konfiguration noch einmal probeweise auf Speichern gedrückt, nachdem ich vorher 5min nach Öffnen der Seite abgewertet habe!

                  In der Folge fehlen jetzt bei einigen Sensoren wieder die Icons für die Diagramme und die entsprechenden RRDs sind weider gelöscht.

                  Damit gehe ich davon aus, dass das Ändern der VPN GAs die Ursache für den ersten Datenverlust war und das es außerdem einen Bug im Webmin gibt... Webmin Version ist 1.450

                  Wenn ich noch irgend etwas zur Ursachenfindung beisteuern kann bitte einfach melden.

                  Kommentar


                    #10
                    Ich hab auf Anhieb nichts gefunden - aber schreib mir das mal für den Release-Test mit auf, dort werden mehr eventualitäten getestet - die RRDs werden aber seit ewig nicht mehr gelöscht, sondern in .old (oder so) umbenannt..

                    Makki
                    EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                    -> Bitte KEINE PNs!

                    Kommentar


                      #11
                      Ich hab auf Anhieb nichts gefunden - aber schreib mir das mal für den Release-Test mit auf, dort werden mehr eventualitäten getestet - die RRDs werden aber seit ewig nicht mehr gelöscht, sondern in .old (oder so) umbenannt..
                      Bei mir waren sie weg (falls sie nicht an eine Stelle verschoben werden wo ich sie nicht finde), werde das aber heute abend noch mal probieren um zu schauen, ob ich das Verhalten reproduzieren kann!

                      Kommentar


                        #12
                        Das Problem ist bei mir reproduzierbar, nachdem ich in der Sensor-Konfiguration 2x auf Speicher gedrückt habe (ohne etwas im Dialog zu ändern und jedes mal vorher gewartet), sieht der Dialog jetzt wieder so wie in der angehängten Graphiken und die RRDs sind gelöscht (Sicherungskopien davon finde ich zumindest nicht gefunden)... Schon nach dem ersten Speichern haben RRDs gefehlt.

                        Außerdem werden in die noch vorhandenen RRDs offenbar keine neuen Werte geschrieben, historische lassen sich aber abrufen.

                        Im Moment hab ich keine Ahnung, was da passiert und bin für jeden Tipp dankbar, wie ich die RRDs wieder befüllt bekomme. Das Speichern spare ich mir dann auch fürs erste (bis zum nächsten Sensor...)
                        Angehängte Dateien

                        Kommentar


                          #13
                          So, jetzt bin ich einen Schritt weiter.

                          Ich habe mich darüber gewundert, dass in der Sensor-Konfiguration die Haken bei den Graphen fehlten. Ich bin mir sehr sicher, dass das auch schon vor zwei Wochen der Fall war, als ich die Konfiguration erstmalig geändert habe. Das hat mich nur nicht weiter gestört, da die Symbole für die Graphen ja angezeigt wurden. Beim Vergleich der owsensors.conf fällt dann auch auf, dass in der aktuellen Version die Flags für die Graphen gelöscht sind, die aber in meinem Backup vom 20.01. noch existieren.

                          Wenn ich die Haken, nach dem Zurücksichern der RRDs manuell setze und speichere scheint alles OK zu sein und es werden auch wieder Werte in die RRDs geschrieben. Beim erneuten Aufrufen der Konfiguration werden sie dann auch angezeigt.

                          Damit sehe ich das Problem jetzt an einer etwas anderen Stelle als erst vermutet:
                          1. In der Webmin Konfiguration wurden die Haken für die Graphen nicht angezeigt obwohl sie aktiv waren (aber trotzdem in die RRDs geschrieben)

                          2. Die RRDs wurden beim Speichern gelöscht und nicht, wie oben ja beschrieben, nur umbenannt?

                          3. Es wurden aber nicht alle RRDs gelöscht, wie man ja auch in dem Screenshot oben sehen kann. Für die Sensoren bei denen die RRD noch existiert wird das Graph-Symbol angezeigt.

                          Kommentar


                            #14
                            Werd ich nochmal prüfen, ist aber so hier nicht auf Anhieb nachvollziehbar; der einzige Weg dazu wäre, das es beim nächsten Release-Testlauf zugänglich ist, um mögliche Sonderfälle zu erkennen..

                            Makki
                            EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                            -> Bitte KEINE PNs!

                            Kommentar


                              #15
                              Ev. ist das ja auch ein Bug, der schon länger schlummert. An der Konfiguration hab ich sicher über ein Jahr lang nichts mehr geändert und dementsprechend nicht auf "Speichern" gedrückt.

                              Kommentar

                              Lädt...
                              X