Ankündigung

Einklappen
Keine Ankündigung bisher.

Überwachung von Serverdiensten

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    Überwachung von Serverdiensten

    Hallo,

    da aus igendeinem Grund meine Influx Datenbank letztes Wochenende den Dienst gestoppt hatte und ich das nur durch Zufall mitbekommen habe stellt sich mir die Frage wie kann ich mit Edomi eine Überwachung von Diensten von anderen Servern realisieren.
    Der Server selbst wird über eine Ping abfrage überwacht. Hat sowas jemand vielleicht schon am laufen?

    Grüße
    Jascha

    #2
    Es gibt ein Hostcheck lbs. Mit dem kannst du den Server überwachen und das sollte dir das Ok geben.

    Kommentar


      #3
      genau den habe ich bereits am laufen. Der LBS pingt mir derzeit den Server an. Damit sehe ich aber noch nicht ob auch auf dem Server der Dienst noch läuft. Oder seh ich das gerade falsch?

      Grüße

      Kommentar


        #4
        Zitat von skyacer Beitrag anzeigen
        Damit sehe ich aber noch nicht ob auch auf dem Server der Dienst noch läuft.
        Der Hostcheck LBS unterstützt doch auch eine Prüfung eines TCP Ports. Damit kannst du den Port der Influx-DB regelmäßig prüfen.
        Gibts natürlich noch nicht 100% die Sicherheit, dass Influx noch korrekt läuft, aber zumindest, dass sie nicht komplett weg ist.

        Ein echter inhaltlicher Test, wäre es, einen Wert schreiben und den wieder zurücklesen.

        Alternativ kann man natürlich auch mal ein Monitoring System aufsetzen, um wichtige Services zu monitoren. Ich verwende hierzu Nagios. Gibt aber noch viele andere.

        Kommentar


          #5
          Okay danke. Ich werd dann einmal gucken ob der Hostcheck ausreichend ist für mich.

          Grüße

          Kommentar


            #6
            Eigentlich sollte doch der Host selbst dafür sorgen, das die DB am laufen bleibt.

            Kommentar


              #7
              Eigentlich schon. Ich hab aus dem Syslog keine Punkte finden können warum der Dienst sich abgeschaltet hatte. Nach einem neustart war alles wieder in Ordnung.

              Kommentar


                #8
                Zitat von jonofe Beitrag anzeigen
                Alternativ kann man natürlich auch mal ein Monitoring System aufsetzen, um wichtige Services zu monitoren. Ich verwende hierzu Nagios. Gibt aber noch viele andere.
                Ich empfehle auch Nagios.

                VG
                Samuel

                Kommentar


                  #9
                  Alternative: Mir persönlich war Nagios & co irgendwie zu „fett“ und löse es per Telegraf & influxDB & Grafana.

                  Wie alles im Leben gibt es gute Gründe für beide Lösungen und auch noch ganz andere Lösungen...

                  Kommentar


                    #10
                    Zitat von saegefisch Beitrag anzeigen
                    Alternative: Mir persönlich war Nagios & co irgendwie zu „fett“ und löse es per Telegraf & influxDB & Grafana.

                    Wie alles im Leben gibt es gute Gründe für beide Lösungen und auch noch ganz andere Lösungen...
                    +1

                    Kommentar


                      #11
                      Anmerkung: mit InfluxDB 2.x kann man jetzt auch echten HTTP-Request-Check auf die - mit 2.x eingeführte - GUI machen und so verlässlich prüfen, ob influxDB2 noch "genug da ist", um eine valide Webseite anzubieten und z.B. die Version per API auszules​en.

                      Mit Hostcheck und HTTP-Request kann man vieles in edomi sauber prüfen. z.B. dass mein nextcloud gerade nicht ok ist, aber influxDB2 erreichbar ist mit Version 2.4.0 und TVH eine saubere Senderliste liefert, also nicht down oder irgendwie anders fest steckt - alles schon gesehen...

                      Unbenannt.jpg Unbenannt2.jpg
                      Zuletzt geändert von saegefisch; 31.10.2022, 19:55.

                      Kommentar


                        #12
                        Mal eine Frage zu telegraf auf dem proxmox-Server (also letztlich Debian)... ich habe das erstaunliche Phänomen, dass ich die telegraf.conf-Datei angepasst habe um einen weiteren INPUT (script "update_check.sh" - liefert die Anzahl anstehender update-Pakete). Wenn man telegraf mit
                        Code:
                        sudo telegraf --debug
                        starte, wird alles korrekt ausgeführt und an InfluxDB2 in die beiden richtigen Buckets "proxmox" und "technik" mit richtigen Namen und Tags ausgegeben.
                        Wenn ich aber mit
                        Code:
                        sudo service telegraf start
                        starte, funktioniert es nicht vollständig

                        Einzige Besonderheit: Verwendung von "namedrop" und "namepass" mit mehreren Einträgen. Wie gesagt...im direkten Aufruf geht alles wie erwartet, aber als Service kommt nur "proxmox" und "ups" in influxDB2 an, nicht aber "update"

                        >>Hat jemand eine Idee, warum direkt und service sich unterschiedlich verhalten könnten?

                        Reicht nach Änderung der .conf nicht stop und start des Dienstes, sondern es gibt ein Geheimnis? Habe auch schon disable und
                        Code:
                        sudo systemctl enable telegraf.service
                        versucht - erfolglos.

                        Code:
                        # für Proxmox-Metriken (build-in)
                        [[inputs.socket_listener]]
                        interval = "10s"
                        service_address = "udp://:8089"
                        
                        # Ausgabe an influxDB 2
                        [[outputs.influxdb_v2]]
                        urls = [ "https://<IP>:9926" ]
                        token = "<TOKEN>"
                        organization = "orga"
                        bucket = "proxmox"
                        namedrop = ["ups","update"]
                        
                        [[inputs.exec]]
                        alias = "ups_check"
                        interval = "60s"
                        commands = [ "/etc/telegraf/script/exec_nut.sh" ]
                        timeout = "5s"
                        name_override = "ups"
                        data_format = "influx"
                        
                        [[inputs.exec]]
                        alias = "update_check"
                        interval = "120s"
                        commands = [ "/etc/telegraf/script/upgrade_check.sh" ]
                        timeout = "50s"
                        name_override = "update"
                        data_format = "influx"
                        
                        # Ausgabe an influxDB 2
                        [[outputs.influxdb_v2]]
                        urls = [ "https://<IP>:9926" ]
                        token = "<TOKEN>"
                        organization = "orga"
                        bucket = "technik"
                        namepass = ["ups","update"]​
                        Zuletzt geändert von saegefisch; 31.10.2022, 19:43.

                        Kommentar


                          #13
                          Schon wieder 2h versucht...ich verstehe es nicht... wie kann das sein:

                          telegraf : Hat jemand eine Idee, warum direkt Ausführung und als service sich bei unveränderter(!) CONF unterschiedlich verhalten könnten?​

                          Kommentar


                            #14
                            Gibt es evtl eine andere conf Datei, die der service nutzt?

                            Kommentar


                              #15
                              ich habe (wissentlich) nur eine - die ich kenne. Könnte man das irgendwo sehen?
                              Das wäre aber eine gute Erklärung. Mir kam in den Sinn, dass der Service die conf vielleicht als Snapshot in der alten Version irgendwo hin gelegt hat und weiter zieht. Aber wie sieht man das und wie kann man den Service zwingen, auch die aktuelle zu nehmen?

                              Kommentar

                              Lädt...
                              X