• Aktualisierte Forenregeln

    Eine kleine Änderung hat es im Bereich Forenregeln unter Abschnitt 2 gegeben, wo wir nun explizit darauf verweisen, dass Forenkommentare in unserer Heftrubrik Leserbriefe landen können.

    Forenregeln


    Vielen Dank

Crash im neuen Hardware Setup

Paganos89

NPC
Mitglied seit
11.10.2021
Beiträge
6
Reaktionspunkte
1
Hallo an alle,

kürzlich habe ich mir einen neue Rechner zusammen gestellt.
Dieser Crasht in regelmäßigen Abständen sowohl im Desktop (Chrome etc.) als auch in Spielen (Cyberpunk, Kingdom Come Deliverance etc.)
Die Crashs enden meisten in einem Black Screen (kurzeitiger Freeze mit sichtbaren kontrastreichen Umrissen der Fenster) oder seltener auf einen Reboot ohne Freeze.

Weder die GPU noch die CPU wurden einem OC oder einem Undervolting unterzogen.
Bis auf RAM D.O.C.P (XMP) ist alles Stock.
Das OS habe ich mehrmals unter Windows 10 und 11 neu installiert.
Das System ist bis auf die Treiber komplett Clean (Keine externen AntiVir, Firewall oder Tuning Software installiert)

SPECS:
Windows 11 Pro
CPU: Ryzen 7 5800X​
CPU-Lüfter: Skythe Fuma 2​
GPU: MSI 3080Ti Suprim​
RAM 2x8GB G.Skill RipJaws V 3200​
PSU: beQuiet! StraigtPower 11 1000W Platinum​
MB: ASUS ROG Strix B550-E Gaming​
Speicher1: M.2 ADATA SC8200PNP 500GB​
Speicher2: Samsung SSD850 EVO 250GB​



Der Fehler ist im "3DMark Stresstest Extrem" ziemlich gut reproduzierbar (Meistens Loop 6).
In Spielen tritt er gefühlt vermehrt in Cut Scenes auf.

Was bisher geschah:

GPU:
Aufgrund der Abstürze mit Black Screen und Freeze ging ich von einem Problem der GPU aus (Vormals Zotac Amp Holo 3080Ti) .
Ich lies diese mit einer Fehlerbeschreibung von Alternate umtauschen/erstatten und besorgte mir die MSI Suprim 3080Ti.
Das Problem bestand weiterhin.

PSU:
Aufgrund der größeren Leistungsaufnahme der MSI Karte kam dann auch eine neue PSU (Vormals Straight Power 11 750 Watt) in den Rechner.
Das Problem bestand weiterhin.

RAM:
Test des Arbeitsspeichers per Memtest86 ergab keine Fehler, ich habe sie trotzdem gegen ein zweites baugleiches Paar aus dem zweit Rechner ausgetauscht. D.O.C.P (XMP) An/Aus macht keinen Unterschied.
Das Problem bestand weiterhin.

unter dem alten Ram wurde immer ein Dump File geschrieben welche in angehängt habe, mit dem Ersatz Ram gibt es nur noch 2 Einträge im Windows WHEA-Logger ohne DUMP.


WHEA 46 (Siehe TXT)
Schwerwiegender Hardwarefehler.
Komponente: Arbeitsspeicher
Fehlerquelle: Machine Check Exception
Die Detailansicht dieses Eintrags beinhalten weitere Informationen.

WHEA 18 (Siehe TXT)
Schwerwiegender Hardwarefehler.
Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Bus/Interconnect Error
Prozessor-APIC-ID: 0
Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.

Mainboard:
Das Mainboard wurde von Alternate ausgetauscht, ich habe das BIOS aktualisiert.
Das Problem bestand weiterhin.

CPU:
Die CPU läuft ohne Probleme im AIDA64 oder CPUZ Stresstest mehrere Minuten durch.
Alternate hat die CPU ebenfalls getestet und keine Fehler gefunden.



Fazit:
Bis auf die Datenträger sowie die CPU wurden somit alle teile durch Alternate ersetzt oder durch Ersatzteile meinerseits temporär ersetzt.
Das System wurde mehrmals neu aufgesetzt und so Clean wie möglich im Stock getestet.
Mittlerweile bin ich mit meinem Latein am ende, da es mit meinem Know-How anscheinend nicht möglich ist, die Fehlerquelle zu finden.

Evnt. fällt euch noch etwas ein.


Grüße Paganos89
 

Anhänge

  • BlackScreen_Freeze.jpg
    BlackScreen_Freeze.jpg
    501,5 KB · Aufrufe: 1
  • Dump.zip
    861,9 KB · Aufrufe: 0
  • WHEA18_NACHRAMTAUSCH.txt
    4,2 KB · Aufrufe: 0
  • WHEA46_NACHRAMTAUSCH.txt
    4,1 KB · Aufrufe: 2
Zuletzt bearbeitet:
Im Grunde hast du schon ziemlich gut alles getestet, die Frage ist aber: wie lange hast du die Tests durchlaufen lassen?!

memtest86 und auch prime95 sollten über Stunden, im Idealfall die Nacht durch, laufen und anschließend keinen Fehler ausspucken. D.h. wenn beide Programme über Stunden (!) stabil laufen, kannst du ggf. wirklich einen Fehler bei der CPU + Kühler und dem RAM ausschließen. Gerade RAM hat sich hier und da ein wenig zickig wenn man diesen z.B. mit einer zu geringen Spannung betreibt.

Ansonsten lass mal Furmark laufen, das strapaziert deine GPU bis aufs Maximum ... ggf. beim Netzteil auch die "Leitungen" prüfen welche zur GraKa gehen, ggf. hier auch mal einen anderen "Strang" nutzen.

Belastungstest über "mehrere" Minuten sind leider absolut unbrauchbar, bei mir haben sich, ich hab meinen 5950x übertaktet, erst nach ~10-15min. gezeigt, dass das System zu heiß wird.

Übrigens hab ich deinen Beitrag nach PC-Hardware-Problemen verschoben! :top:
 
Im Grunde hast du schon ziemlich gut alles getestet, die Frage ist aber: wie lange hast du die Tests durchlaufen lassen?!

memtest86 und auch prime95 sollten über Stunden, im Idealfall die Nacht durch, laufen und anschließend keinen Fehler ausspucken. D.h. wenn beide Programme über Stunden (!) stabil laufen, kannst du ggf. wirklich einen Fehler bei der CPU + Kühler und dem RAM ausschließen. Gerade RAM hat sich hier und da ein wenig zickig wenn man diesen z.B. mit einer zu geringen Spannung betreibt.

Ansonsten lass mal Furmark laufen, das strapaziert deine GPU bis aufs Maximum ... ggf. beim Netzteil auch die "Leitungen" prüfen welche zur GraKa gehen, ggf. hier auch mal einen anderen "Strang" nutzen.

Belastungstest über "mehrere" Minuten sind leider absolut unbrauchbar, bei mir haben sich, ich hab meinen 5950x übertaktet, erst nach ~10-15min. gezeigt, dass das System zu heiß wird.

Übrigens hab ich deinen Beitrag nach PC-Hardware-Problemen verschoben! :top:
Hallo Rabowke,

vielen Dank für die Antwort.

RAM:
der Memtest86 lief über Nacht per Bootstick fehlerfrei durch. Ich habe mir allerdings ein neues Paar Ram-Riegel "G.Skill Trident Z Neo" organisiert, dies werde ich heute Abend Testen. Ich hatte mit dem RipJaw schon einmal in einem alten Setup Probleme und will dies komplett ausschließen.

3D Mark lief im Benchmark mehrere Stunden (Ca. 4 Stunden ) ohne Probleme durch, die Crashes treten nur im 3D Mark Stresstest jedoch nicht im Benchmark.
Die Temperaturen sind im Maximum folgenede.

CPU: 75c°
GPU-Core: 72c°
GPU-Memory: 88c°

Die Werte liegen alle unter den von den Herstellern angebenen werten.

Das Mainboard hat bis auf den CPU-Sockel ein Maximum von 40c° erreicht.
SDD und M.2 pendeln so bei 35c° rum

Ich werde heute Abend noch einmal einen Testlauf mit dem neuen Ram laufen lassen und ein Feedback geben.
In diesem Zug werde ich auch nochmal einen längerfristigen CPU Stresstest laufen lassen.
Ich habe zudem den CPU-Kühler in den Specs ergänzt.

Grüße Paganos
 
Zuletzt bearbeitet:
RAM oder Überhitzung (was es ja nicht zu sein scheint).

Meine beschidende Meinung. Oder zu schwaches NT. Hab nicht alles gelesen.
 
RAM oder Überhitzung (was es ja nicht zu sein scheint).

Meine beschidende Meinung. Oder zu schwaches NT. Hab nicht alles gelesen.
Ram könnte sein, würde sich dann aber auf 2 Riegelpaare der Modellreihe RipJaw beziehen (Unwahrscheinlich)
Oder ist es das Modell generell welches Probleme macht (Wahrscheinlicher)

Netzteil schließe ich erst einmal aus, da ich bereits von einem 750 Watt auf ein 1000 Watt umgezogen bin. Bei beiden das selbe verhalten, am Wochenende werde ich das Netzteil jedoch mal durchchecken.
 
Da ich zu faul zum Suchen bin: sind die RAMs unter den zertifizierten RAMs deines Mainboard-Hrrstellers aufgezählt?! Ich weiß, dass diese nur einen Bruchteil dessen abbilden und bislang hatte ich immer Glück ... außer bei meinem aktuellen Büro PC.

Die RAMs haben in dem Mainboard nicht funktioniert, in einem anderen aber perfekt. Allerdings lief hier der gesamte Rechner instabil und memtest86 erst recht.

Also thermisches Problem würde ich fast ausschließen, die Messwerte, vorausgesetzt diese stimmen, sehen in Ordnung aus. :O

Wobei der Hinweis mit dem Stresstest schon interessant ist, ist der Absturz beim Stresstest CPU oder GPU?! Lass doch wirklich mal Furmark laufen und schau was passiert. Mal meinen Hinweis bzgl. der Verkabelung der GraKa zu Herzen genommen?
 
Sowohl der alte auch der neue Ram (Noch nicht eingebaut) werden von dem Mainboard offiziell unterstützt.

Die Verkabelung werde ich am Wochenende mal mit einem Freund durchtesten, der hat das Know-How und Werkzeug.
Das Problem trat jedoch bei beiden PSU auf.

Furmark werde ich heute Abend mal im Stresstest durchlaufen lassen. Die 3D Mark Stresstests belasten meines Wissens nach CPU und GPU.

Heute Abend nach der Arbeit sind wir schlauer :)
 
Die Verkabelung brauchst du ja nur mal exemplarisch ändern, d.h. einfach mal einen anderen Stecker zur Graka führen ... sofern du dir so etwas zutraust.

Kann ja durchaus sein, dass die Graka auch einen Schuss weg hat.

Aber wenn Furmark für 1-2h stabil durch läuft, können wir die GPU eigentlich ausschließen.
 
Die Verkabelung brauchst du ja nur mal exemplarisch ändern, d.h. einfach mal einen anderen Stecker zur Graka führen ... sofern du dir so etwas zutraust.

Kann ja durchaus sein, dass die Graka auch einen Schuss weg hat.

Aber wenn Furmark für 1-2h stabil durch läuft, können wir die GPU eigentlich ausschließen.
Ich dachte du meint das Messen der Kabel, dann habe ich dich falsch verstanden.

  • Ich habe den RAM nun gegen den neuen getauscht und 3DMark lief durch alle 20 Loops im GPU Bench durch. (Vorher waren es nur 6)
  • Furmark lief auch eine Stunde ohne Crash.

Bei Kingdom Come Deliverance ist das System nach ca 4 Minuten in einem Freeze gecrasht. Bei dem neustart musste er mehrmals Booten (Versuch bios zu resetten ?) schlussendlich kam der Ladebalken von Windows gefolgt von einem Bluescreen.

Ein MiniDump wurde wieder mal nicht erstellt. WHEA Logger sagt nur noch RAM Fehler.
Es wurde allerdings ein 1.8 GB großes MemoryDump geschrieben welches folgenden Fehler enthält:

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error condition. Try !errrec Address of the WHEA_ERROR_RECORD structure to get more details.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: ffff8006e5089028, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000bc800800, High order 32-bits of the MCi_STATUS value.
Arg4: 00000000060c0859, Low order 32-bits of the MCi_STATUS value.

20211012_200737-min.jpg
 

Anhänge

  • 20211012_200905-min.jpg
    20211012_200905-min.jpg
    710,4 KB · Aufrufe: 1
  • WHEA46.txt
    3 KB · Aufrufe: 0
Zuletzt bearbeitet:
Zurück