Ankündigung

Einklappen
Keine Ankündigung bisher.

Owserver tot und massig Einträge im Syslog

Einklappen
Dieses Thema ist geschlossen.
X
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    [wiregate] Owserver tot und massig Einträge im Syslog

    Hallo Zusammen,

    aus dem Beitrag #7
    https://knx-user-forum.de/wiregate/3...rch-error.html

    mein Anliegen OT ist, hier der gesonderte Beitrag.

    Der owserver im WG stürtzt nach ca 2 Tagen ab. Owserver ist danach nicht mehr zu starten, das WG muss neu gebootet werden, und dann beginnt das gleiche wieder von vorn.

    Auffallend sind die Einträge im Syslog, hier die aktuellen:

    Code:
    Jan 29 22:07:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:08:54 wiregate534 monit[27492]: 'localhost' cpu system usage of 91.6% matches resource limit [cpu system usage>90.0%]
    Jan 29 22:08:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:08:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.2 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:08:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:08:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:08:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:08:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:09:54 wiregate534 monit[27492]: 'localhost' cpu system usage of 95.2% matches resource limit [cpu system usage>90.0%]
    Jan 29 22:09:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:09:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.1 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:09:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:09:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:09:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:09:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:10:23 wiregate534 collectd[2268]: processes plugin: Failed to open `/proc/13154/cmdline': No such file or directory.
    Jan 29 22:10:54 wiregate534 monit[27492]: 'localhost' cpu system usage of 90.8% matches resource limit [cpu system usage>90.0%]
    Jan 29 22:10:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:10:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.3 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:10:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:10:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:10:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:10:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:11:54 wiregate534 monit[27492]: 'localhost' resource passed
    Jan 29 22:11:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:11:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.5 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:11:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:11:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:11:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:11:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:12:54 wiregate534 monit[27492]: 'localhost' cpu system usage of 91.9% matches resource limit [cpu system usage>90.0%]
    Jan 29 22:12:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:12:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.3 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:12:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:12:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:12:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:12:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:13:54 wiregate534 monit[27492]: 'localhost' cpu system usage of 94.7% matches resource limit [cpu system usage>90.0%]
    Jan 29 22:13:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:13:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.2 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:13:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:13:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:13:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:13:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Jan 29 22:14:54 wiregate534 monit[27492]: 'localhost' cpu system usage of 92.2% matches resource limit [cpu system usage>90.0%]
    Jan 29 22:14:54 wiregate534 monit[27492]: 'localhost' loadavg(5min) of 6.3 matches resource limit [loadavg(5min)>2.0]
    Jan 29 22:14:54 wiregate534 monit[27492]: 'localhost' loadavg(1min) of 6.3 matches resource limit [loadavg(1min)>4.0]
    Jan 29 22:14:54 wiregate534 monit[27492]: 'rootfs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:14:54 wiregate534 monit[27492]: 'rootfs' space usage 83.0% matches resource limit [space usage>80.0%]
    Jan 29 22:14:54 wiregate534 monit[27492]: 'rescue_fs' inode usage 92.0% matches resource limit [inode usage>75.0%]
    Jan 29 22:14:54 wiregate534 monit[27492]: 'owserver' process with pid 2881 is a zombie
    Das geht den ganzen Tag so.
    Wäre um Hilfestellung dankbar.

    Was hat sich geändert?
    Ich habe einen verlängerte 1-W Linie angeschlossen.
    Diese lief aber auch schon längere Zeit fehlerfrei durch-verändert wurde darin nichts.
    Als Plugin kam das neue Squeezebox-Plugin dazu, welches nicht über die Socet-Verbindung funktioniert. Dieses Plugin funktioniert.
    Ansonsten habe ich noch GA im EIBD eingetragen.
    Mehr war es wohl nicht.

    Danke und Grüße,
    Lio

    #2
    Das deutet auf ein Problem mit dem Filesystem hin, entweder zu viele Files oder so. Aber da kennt sich makki besser aus

    Kommentar


      #3
      Richtig, die inodes (Verwaltungseinheiten für Dateien) wurden fast verbraucht, Platz auf der SSD ebenfalls (normalerweise werden nur 50 % benötigt).

      Wir hatten das einmal bei einem anderen Kunden, der hatte sich auch nur ein "harmloses" Script geschrieben, dass jedoch auch emails senden sollte. Da der eMail Server nicht konfiguriert war, lief die Queue mit der Zeit voll, zudem der Server darüber auch noch per eMail berichten wollte.

      ==> Sehe Dir Dein Filesystem an und suche nach massenhaften und kleineren Files.

      lg

      Stefan

      Kommentar


        #4
        ok, mach mich dran.

        gibt es da ein pfad? Oder eine Richtung?

        Ein MailPlugin habe ich, das sendet 2 mal täglich eine Email.

        Danke und Gruß,
        Lio

        Kommentar


          #5
          Hier die Verzeichnisse mit den meissten Dateien:

          ca 150:
          /lib/modules/3.5.1-wiregate-1.41/kernel/drivers/hwmon


          /usr/lib/perl/5.10.0/auto/POSIX

          ca 280:
          /etc/ssl/certs

          hatte gehofft, dass da was Eindeutiges dabei wäre, ist es aber in meinen AUgen nicht.

          Eigentlich wollte ich für die Analyse "SpaceObServer" benutzen, da man per ssh auf das Systemzugreifen kann, bekomme aber die Meldung " Authenzifizierung fehlgeschlagen". Die Hilfe meint es müsse beim SSH-Server die Option PasswordAuthentification gesetzt sein.
          Hab das jetzt nicht auf dem root im WG gefunden, aber da ich Zugriff mit WinSCP habe denke ich, dass das nicht das Problem ist.

          Grüße,
          Lio

          Kommentar


            #6
            Mein Tipp: Systematisch nacheinander deaktivieren. collectd (http://wiregateXXX/collection3/bin/index.cgi) gibt detailiierte Auskunft über die Historie & den aktuellen Status.

            Makki
            EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
            -> Bitte KEINE PNs!

            Kommentar


              #7
              Systematisch die Plugins deaktivieren?

              Danke und Gruß,
              Lio

              Kommentar


                #8
                Hab' das jetzt mal so ausgewertet,
                ich schau nun mal hier im Forum, was ich anfang November gemacht habe.

                Angehängte Dateien

                Kommentar


                  #9
                  habe nun alle Plugins, die über webmin laufen mit return gestoppt.
                  Und auch die, die über cron gestartet werden ebenso, auch cronjob für diese Plugins sind deaktiviert.


                  Im November habe ich den zweiten SML-Zähler in Betrieb genommen, ein Plugin welches Werte in eine CSV schreibt und das Emailplugin.

                  Damals gab es auch schon ein ähnliches Problem, allerdings mit anderen Einträgen:
                  https://knx-user-forum.de/wiregate/3...im-syslog.html

                  Die Lösung habe ich wiederholt, also die Datenbanken gelöscht.


                  Leider tut sich nichts.
                  Angehängte Dateien

                  Kommentar


                    #10
                    Auffällig ist mir das das Verzeichnis /proc
                    Massig leere Dateien, laut google ist das aber für die Prozesse?!?

                    Würde gern mit einem Tool ähnlich Treesize das Filesystem untersuchen.
                    Leider kenn ich mich mit Linux nicht aus und mit der Software SpaceObServer kann ich keinen SSH Zugriff herstellen

                    Grüße,
                    Lio

                    Kommentar


                      #11
                      Schonmal im Webmin links unter Server->Lese Benutzer-E-Mail geschaut? Evtl. liegen da tausende Leichen?
                      Umgezogen? Ja! ... Fertig? Nein!
                      Baustelle 2.0 !

                      Kommentar


                        #12
                        Hallo Mirko,

                        das sieht dann so aus.
                        Wenn ich über WinSCP über root mich ins System wage, finde ich unter den angebenen Verzeichnissen zu den E-Mailbenutzern keine Daten.

                        Grüße,
                        Lio
                        Angehängte Dateien

                        Kommentar


                          #13
                          wenn man sich das Diagramm des Speichers anschaut, hat sich da schon was getan. Fraglich ist, woher die "Abrisse" kommen.

                          Der Cache ist aber nach wie vor an der Grenze.

                          Wie soll ich nur weitermachen? Durch Druchblättern der Verzeichnisse komme ich nicht weiter.
                          Für Linux gibt es ähnlich dem Treesize verschiedene Tools, aber da weiss ich nicht wie ich die auf dem WG benutzen kann.

                          Mit SpaceObServer habe ich keinen Zugriff, das liegt wohl am SSH-Key im WG???
                          SpaceObServer benötigt PasswordAuthentification, das habe ich aber in der sshd_config schon auskommentiert:
                          Code:
                          # Change to no to disable tunnelled clear text passwords
                          PasswordAuthentication yes
                          Ich komme hier echt nicht weiter. Soll ich meine Daten sicheren und auf Werkseinstellungen zurücksetzen?

                          Danke und Grüße,
                          Lio
                          Angehängte Dateien

                          Kommentar


                            #14
                            Das sieht so aus, als würde monit regelmäßig einen Dienst neu starten.
                            Schau Dir den mal an unter http://wiregatexxx:2812 (user: admin passwort: monit)

                            Gruß

                            Christoph

                            Kommentar


                              #15
                              danke, Christoph

                              ich glaube wieder ein Schritt weiter.
                              Ich lese mich in Google mal in die roten "Devices" ein.
                              Scheinbar stimmt hier was nicht.

                              Gruß,
                              Lio
                              Angehängte Dateien

                              Kommentar

                              Lädt...
                              X