Ankündigung

Einklappen
Keine Ankündigung bisher.

- √ - Busmaster verliert sporadisch Sensoren

Einklappen
Dieses Thema ist geschlossen.
X
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • greentux
    antwortet
    In der Tat ist der OOM auch gut am werkeln:

    Code:
    messages:Oct 13 00:00:24 wiregate497 kernel: [49735.954320] wiregated-ow.pl invoked oom-killer: gfp_mask=0x201da, order=0, oom_adj=0
    messages:Oct 13 00:00:24 wiregate497 kernel: [49735.983635]  [<c107745f>] ? oom_kill_process+0x40/0x198
    messages:Oct 13 00:00:36 wiregate497 kernel: [49747.184311] sshd invoked oom-killer: gfp_mask=0x201da, order=0, oom_adj=0
    messages:Oct 13 00:00:36 wiregate497 kernel: [49747.204149]  [<c107745f>] ? oom_kill_process+0x40/0x198
    messages:Oct 13 00:00:51 wiregate497 kernel: [49763.049064] linknx invoked oom-killer: gfp_mask=0x201da, order=0, oom_adj=0
    messages:Oct 13 00:00:51 wiregate497 kernel: [49763.069538]  [<c107745f>] ? oom_kill_process+0x40/0x198
    Ich kann heute Abend mal das VPN aufmachen, wenns hilft.

    Einen Kommentar schreiben:


  • makki
    antwortet
    Nein & richtig: der monit macht keinen reboot! Das macht der OOM-Killer und die vermutlich folgende Kernel-Panic..
    Aber das sieht nach einem (mir bisher völlig unbekannten) ziemlich fetten memleak im owserver aus, da würde ich gerne mal einen scharfen Blick drauf werfen.
    Also den im collectd eintragen, das limit im monit drastisch runterdrehen etc.. Direkt machen können wär einfacher

    Makki

    Einen Kommentar schreiben:


  • greentux
    antwortet
    Ehe einer nachfragt. Der Reboot kam bestimmt nicht, weil Monit das veranlasst hat. Es war trotzdem die letzte Zeile im Log...

    Einen Kommentar schreiben:


  • greentux
    antwortet
    Heute gabs ein Reboot weil:
    Code:
    Oct 12 06:26:40 wiregate497 monit[3054]: 'owserver' total mem amount of 111724kB matches resource limit [total mem amount>10240kB]

    War bei PL29 nie der Fall, jetzt nach Update aufgetreten.

    Einen Kommentar schreiben:


  • Hannatz
    antwortet
    Moin!
    Denke wir sollten das noch ein wenig im Auge halten und dann gegebenfalls reagieren...
    Das "ob" finde ich noch nicht mal so schlimm, das "warum" würde mich da viel mehr interessieren!

    Einen Kommentar schreiben:


  • makki
    antwortet
    Ok, dann zurück zu Plan A: WG tauschen (danach USB-Hub, aber der wars - ausser unpowered - noch nie).
    Sowas darf/kann nicht sein, sonstige "Sünden" sind keine aufgefallen, das ist vermutlich auch der Grund für die reboots weil sowas steht nicht aus Spass an der Freude in den Logs..
    Kommt in den besten Familien vor, wenn nicht rumgezupft wurde hat da was nen HW-hau..

    Makki

    Einen Kommentar schreiben:


  • Hannatz
    antwortet
    Hi Makki,

    in den Logs der Fritzbox kann ich keine Unregelmäßigkeiten erkennen, auch ansonsten ist mir nix aufgefallen. Am Serverschrank war auch keiner am basteln, die Steckverbindungen hatte ich in der letzten Woche noch einmal überprüft gehabt.

    Kurzum: ich hab keine Idee warum diese Meldung entstanden ist!?

    Einen Kommentar schreiben:


  • makki
    antwortet
    Eine Frage: gibt es dafür:
    Oct 8 08:24:16 wiregate451 kernel: [140034.707356] usb 1-4: USB disconnect, address 2
    ..

    eine vernünftige Erklärung ? Hub abgesteckt (ansonsten ist der USB abgeflogen, das recovered zwar aber ist kein gutes Zeichen, das für austauschen spricht!)

    Makki

    Einen Kommentar schreiben:


  • Hannatz
    antwortet
    Hmm, das mit den Stromschwankungen würde ich eher als unwahrscheinlich ansehen wollen, es hängt an dem gleichen Verteiler sowohl das Netzteil des USB-Hubs als auch ne Fritzbox. Diese läuft ohne Probs seit nem knappen Jahr 24/7 stabil, da müsste das WG schon arg empfindlich sein...

    Sei's drum, VPN ist dauerhaft offen...

    Einen Kommentar schreiben:


  • henfri
    antwortet
    Am USB oder 230V?


    Gesendet von unterwegs

    Einen Kommentar schreiben:


  • makki
    antwortet
    Naja, meist warens simple Stromschwankungen, mit denen wir leider immer öfter beglückt werden. Ansonsten würde ich gerne mal ein paar Tage draufschauen, was da los sein könnte..

    Makki

    Einen Kommentar schreiben:


  • Hannatz
    antwortet
    So, nach ein paar Tagen mit nun allen 4 BMs am powered Hub folgende Situation:

    Letzter Reboot nach knapp 4 Tagen Uptime war gestern Nachmittag, alle 4 BMs sind sauber mit hochgekommen, in den Sensorwerten ist eine Lücke von jeweils ca 5 Minuten.

    Habe keine Plugins installiert, kann also die oben genannte Vermutung nicht bestätigen.

    Einen Kommentar schreiben:


  • greentux
    antwortet
    Derzeit habe ich 29 und der Rest läuft ja. Insofern werd ichs mal mit dem updated versuchen heute Abend...

    Einen Kommentar schreiben:


  • makki
    antwortet
    Irgendwo seit 29-32 liegt der collectd mit dem Plugin uptime im Repo, sollte also bei Updates installiert werden..

    Makki

    Einen Kommentar schreiben:


  • greentux
    antwortet
    Could not find plugin uptime.

    Seit welchem PL?

    Einen Kommentar schreiben:

Lädt...
X