Surchauffe ? Écran noir random (AMD TR4) - Matériels & problèmes divers - Hardware
Marsh Posté le 18-08-2019 à 14:00:28
J'ai vu sur d'autres threads qu'il était souvent conseillé d'utiliser OCCT. J'ai donc fait quelques tests de mon côté.
Pour tester j'ai augmenté la limite dans OCCT et au bout de quelques minutes l'ordi s'est bien éteint...
Donc ce serait une surchauffe ? Ça me semble bizarre car j'ai monté la même config (en tout cas même CPU et même ventirad) à un client et ils n'ont jamais eu le problème alors qu'ils ont le même cas d'utilisation que moi.
Marsh Posté le 18-08-2019 à 16:28:38
Salut,
Je ne suis pas du tout connaisseur de ta plateforme, mais à la vue des symptômes, je contrôlerais la température des VRM de la carte mère avec HWmonitor ... en rapport peut-être avec la surchauffe indiquée par OCCT.
Perso, j'ai rajouté un ventilo sur les VRM de ma MSI B350 Tomahawk...
A voir donc..
Marsh Posté le 18-08-2019 à 19:43:34
Merci pour ta réponse, je viens de regarder avec HWmonitor. J'ai pas trouvé la température des VRM, voici les infos que j'ai au repos :
Les chiffres sont les mêmes que dans OCCT ... et je pense qu'ils sont faux. En effet quand je faisais des tests avec OCCT j'ai suivi un peu les différentes températures et le CPUTIN et le TMPIN1 montent chacun à plus de 95°C, ce qui semble énorme et surtout c'est incohérent avec les chiffres remontés par le CPU (au moment de la capture ci-dessus < 40° et en charge 64°C quand les 2 autres sont à 95°C). En gros les capteurs semblent ajouter 25°C à la température CPU. J'ai vu un truc comme ça quelque part (+27°C sur les TR4) donc j'imagine que c'est normal.
Je me demande si c'est vraiment une surchauffe du coup ... Enfin disons que OCCT voit 90°C et traite ça comme une surchauffe (assez logiquement) mais si les chiffres récupérés sont supérieurs de 27°C par rapport à la réalité alors c'est pas vraiment une surchauffe. C'est logique ce que je dis ? J'ai l'impression de tourner en rond
Je vais quoiqu'il arrive rajouter un ventilo pour expulser l'air du boîtier en plus de ce que j'ai déjà...
Marsh Posté le 18-08-2019 à 19:47:09
Pour info, dans OCCT comme dans HWmonitor les consos par coeurs sont buggées aussi. Ça marche globalement mais de manière assez aléatoire je vois des consos instantanées de plusieurs milliers de W. La par exemple, après l'avoir laissé tourné pendant plus d'une heure, j'ai des max de 130.000W sur chaque coeurs en moyenne. Alors que globalement 1 coeur au repos consomme < 1W, c'est juste que dès fois le truc pète un cable... Je sais pas si c'est lié ? Par contre la conso sur le package (la somme des coeurs j'imagine) est bien de 50W, pas de problème à signaler là dessus je dirais.
Marsh Posté le 19-08-2019 à 00:15:12
Plop.
Epineux souci que le tien ; non connaisseur de ta plate-forme également, mais simplement, on est bien d'accord : en charge maximale et sans aucun overclock, ce CPU peut consommer en pointe quelque chose comme *** 450 WATTS ***
La piste des VRM est intéressante : pas toujours faciles à monitorer selon la plate-forme, et motif de coupure en cas de surchauffe.
AMD continue à être très "bricolo" au niveau de leur gestion/rapport de températures : c'est assez tiré par les cheveux : https://www.guru3d.com/articles-pag [...] iew,8.html
Citation : Temperature Reporting |
Marsh Posté le 19-08-2019 à 00:38:05
Oui c'est de ça dont je parlais (les +27°C).
Par contre je me demande si j'ai pas pris une alim trop petite du coup... Enfin j'imagine que ça passe mais juste.
Pour info, j'ai désactivé une option dans l'UEFI (Performance boost je crois) et ça me semble beaucoup plus stable. J'ai refait le test OCCT small data set et ça a tenu plus d'une heure (je l'ai arrêté manuellement). Je crois que cette option permettait d'avoir de l'overclocking automatique, je voyais mon proc passer à parfois 4.0 GHz de manière temporaire. Maintenant il est bloqué à 3 GHz et comme je disais ça semble stable. Je vais faire plus de tests demain mais ça semble prometteur.
Étant donné que je n'ai strictement aucune expérience en overclocking (j'ai quelques connaissances, par rapport à des trucs que j'ai lu ou entendu) est-ce que quelququ'un peut me dire si un overclocking instable peut causer les problèmes que je rencontre ? (arrêt subite de manière presque aléatoire, souvent en forte charge) Finalement, si c'est possible, alors me semblerait plus cohérent qu'une surchauffe car j'imagine que l'arret de la machine n'est pas censé arriver à des températures aussi "faibles". De ce que j'ai lu aujourd'hui, quand un threadripper dépasse les 68°C ça va surtout ralentir (throttling) mais c'est censé continuer à marcher.
Je vais quand même regarder pour améliorer l'air flow de ma tour car je ne suis pas très satisfait. Tout à l'heure je l'ai ouverte (haut et côté) et j'ai perdu 4°C en quelques minutes.
Marsh Posté le 17-08-2019 à 21:06:02
Bonjour,
Je me suis monté un nouvel ordi il y a environ 6 mois pour pouvoir bosser tranquillement après être passé en freelance (je suis dev de jeux).
Tout d'abord voilà la config en question :
Mon problème est que mon ordi semble s'éteindre tout seul de manière assez fréquente. Ce que j'appelle s'éteindre tout seul c'est que les écrans deviennent noirs, le son s'arrête, mon clavier et ma souris qui sont rétro-éclairés s'éteignent... Par contre les ventilo continuent de tourner et les LEDs de la CM sont toujours allumées. Ça arrive globalement depuis que je l'ai monté.
J'ai un moyen presque infaillible de reproduire le problème (compilation d'un jeu et/ou cooking des assets) et ça correspond à un moment ou le CPU est chargé à 100% avec peu de charge GPU. Mais j'ai aussi eu le problème "au repos" ou en jouant à des jeux, par exemple Forza qui est loin d'utiliser toute la puissance du CPU.
A savoir que mes firmware/BIOS sont à jours (j'utilise l'outil officiel MSI pour détecter les MAJ et les installer). Windows aussi est à jour.
J'ai fait plusieurs tests :
J'ai récemment trouvé un workaround : dans l'appli Ryzen Master j'ai activé le Game Mode, qui désactive 3 NUMA (24 coeurs) pour ne garder que le premier (8 coeurs donc). Ce workaround m'a permis de terminer plusieurs gros projets ces derniers mois car je pouvais pas me permettre de renvoyer mon matériel à ce moment là mais maintenant c'est le moment de trouver le problème et donc une solution.
Je dirais bien que ça vient de la CM ou du CPU mais je suis pas sur. J'aimerais bien renvoyer le composant défectueux en garantie mais il faut déjà que je l'identifie ...
Qu'en pensez-vous ? CPU ou CM ? ou autre ? Est-ce que vous avez des conseils pour diagnostiquer le composant exact qui pose problème ?
Message édité par Ghashnarb le 18-08-2019 à 14:00:42