Ankündigung

Einklappen
Keine Ankündigung bisher.

Hardware-Error APU2C4

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    Hardware-Error APU2C4

    Hallo zusammen,

    das Thema gehört nicht unbedingt zu Edomi. Nachdem aber einige Edomi auf einem APU2C4 einsetzen....

    Seit Weihnachten beschäftige ich mich mit Edomi und bin begeistert, es läuft auf einem APU2C4. Leider läuft das System nicht 100% stabil. Mal ist das ganze System selbst per ssh nicht mehr erreichbar, mal ist "nur" Edomi weg.

    Jetzt habe ich etwas gefunden, was mich beunruhigt:

    Code:
    Jan 26 19:48:34 edomi kernel: [Hardware Error]: Machine check events logged
    Jan 26 20:21:04 edomi kernel: [Hardware Error]: Machine check events logged
    Jan 27 00:03:34 edomi kernel: [Hardware Error]: Machine check events logged
    Jan 27 07:11:04 edomi kernel: [Hardware Error]: Machine check events logged
    Das sieht für mich nicht normal aus. Bevor ich aber mein APU reklamiere, wollte ich fragen, ob diese Meldungen bei euch auftreten.

    Die Meldungen seht ihr, wenn ihr auf der Kommandozeile "dmesg" aufruft. Falls rsyslogd bei euch läuft, dann findet ihr die Meldungen auch in "/var/log/messages".

    Viele Grüße
    Andreas




    Zuletzt geändert von Andreas1; 27.01.2017, 10:28.

    #2
    Installiere mal mcelog, dann erhältst du über /var/log/mcelog eine genauere Fehlerbeschreibung.

    Kommentar


      #3
      mcelog habe ich schon installiert, aber:

      Code:
      [root@edomi ~]# mcelog
      mcelog: ERROR: AMD Processor family 22: mcelog does not support this processor.  Please use the edac_mce_amd module instead.
      : Success
      CPU is unsupported
      Das Modul edac_mce_amd habe ich inzwischen geladen:
      Code:
      [root@edomi ~]# lsmod | grep edac
      edac_mce_amd           14705  0
      Allerdings liefert edac-util:
      Code:
      [root@edomi ~]# edac-util
      edac-util: Fatal: Unable to get EDAC data: Unable to find EDAC data in sysfs
      Allerdings ist seitdem auch kein Hardware-Error mehr aufgetreten. Muss ich warten bis wieder einer auftritt?

      Kommentar


        #4
        Und es werden mehr:

        Code:
        Jan 26 19:48:34 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 26 20:21:04 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 27 00:03:34 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 27 07:11:04 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 27 18:03:34 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 28 10:21:04 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 28 13:38:34 edomi kernel: [Hardware Error]: Machine check events logged
        Jan 28 17:31:04 edomi kernel: [Hardware Error]: Machine check events logged
        edac-util liefert allerdings weiterhin keine weiteren Infos:
        Code:
        [root@edomi ~]# edac-util
        edac-util: Fatal: Unable to get EDAC data: Unable to find EDAC data in sysfs
        Mal sehen was der Verkäufer antwortet, das APU ist gerade mal 4 Wochen alt...

        Falls noch Jemand eine Idee hat, gerne.

        Viele Grüße
        Andreas

        Kommentar


          #5
          Hast du evtl. ein Kernel-Update gemacht? Oder generell ein yum-update?
          Gibt es denn außer der Meldung auch andere Ausfallerscheinungen?
          Welches edac-Kernel Module ist geladen?

          Code:
          lsmod | grep edac
          Hast du den APU inkl. Speicher gekauft? EDAC soll ja Fehler des Arbeitsspeichers erkennen und korrigieren. Ist aber auch bekannt, dass das Kernel Module gerne mal Fehler meldet wo gar keine sind.


          Ich würde folgendes machen:

          1. Memtest laufen lassen und schauen was da rauskommt
          2. Wenn Memtest fehler meldet, dann anderen Speicher ausprobieren
          3. Wenn Memtest keinen Fehler meldet, dann das EDAC Module blacklisten.

          Kommentar


            #6
            Hi,

            memtest ist eine gute Idee, da hätte ich auch selbst drauf kommen können. Der Speicher ist beim APU aufgelötet, also ja, ich habe es mit dem Speicher gekauft. :-)

            Auf die Logs habe ich erst geachtet, nachdem ich gelegentliche Ausfälle habe. Mal ist das ganze System selbst per ssh nicht mehr erreichbar, mal ist "nur" Edomi weg.

            Viele Grüße
            Andreas

            Edit: So, memtest läuft.....
            Zuletzt geändert von Andreas1; 29.01.2017, 10:43.

            Kommentar


              #7
              Ergebnis:

              Memtest ist mehrere Stunden ohne Fehler durchgelaufen.

              Laut Aussage des Herstellers ist das APU defekt. Der Verkäufer hat es inzwischen ausgetauscht. Das Austauschgerät läuft jetzt stabil, keine Abstürze mehr und auch keine Logeinträge mit [Hardware Error].

              Kommentar

              Lädt...
              X