Problème de démarrage serveur avec une NVIDIA TESLA K40

Problème de démarrage serveur avec une NVIDIA TESLA K40 - Carte graphique - Hardware

Marsh Posté le 21-04-2024 à 13:43:47    

Bonjour, j'ai fait l'aquisition d'un GPU NVIDIA TESLA K40 dans le but de faire tourner des LLMs. Cependant lorsque j'insère cette carte dans le slot PCIE 3.0 du serveur, il démarre puis s'éteint et se rallume mais sans booter sur l'OS. Mon alimentation fonctionne bien, le serveur est capable de fonctionner avec d'autres modèles de carte graphique (grand public). Je suspecte donc plus un problème au niveau du Boot Secure qui bloque le démarrage complet du serveur sur ce modèle de GPU de type datacenter. Dans le BIOS, je n'ai pas un paramètre explicitement "Secure Boot" pour pouvoir le désactiver mais des règlages "CSM Configuration" et "PCIE Parametres Settings". J'ai essayé d'activer le Legacy/UEFI sur les carte vidéos et autres périphériques PCIE mais sans succès. Puis dans le "PCIE Parametres Settings" j'ai activé les options "Above 4G Decoding"; "Re-siez BAR Support" et "SR-IOV Support", depuis je n'ai plus de plantage lors du démarrage du serveur mais toujours aucun boot sur l'OS Auriez-vous des pistes d'autres réglages dans le BIOS à paufiner ?
 
Ma configuration :
 
Carte-mère : Machinist X99 PR9  
BIOS : Aptio Setup Utility - Version 2.18.1263
Alimentation : Corsair TX 750W
Processeur : Intel Xeon E5 2695 v3 14C-28T
RAM : 96Go DDR4 2133Mhz ECC
SSD : SAMSUNG Nvme M.2 256Go
OS : Ubuntu 22.04.4 LTS x86_64
GPU : NVIDIA TESLA K40
 
Merci d'avance,

Reply

Marsh Posté le 21-04-2024 à 13:43:47   

Reply

Marsh Posté le 21-04-2024 à 17:29:46    

Salut,
La TESLA K40, c'est celle de 2013 ?
 
Si tu la met dans un PC classique, ca donne quoi ?

Reply

Marsh Posté le 21-04-2024 à 20:14:27    

K40c?

 

Si oui elle est UEFI et devrait démarrer en UEFI 'pur' , CSM désactivé etc.

 

La question est : avant de mettre cette carte tu étais en CSM avec boot legacy ou en UEFI, windows sur partition initialisée en GPT etc? Auquel cas c'est censé être ok direct sans manipulations


---------------
Guide OC x58 - Guide d'achat de config - ALIMS:qui fait quoi? - RKO - Radiooooo
Reply

Marsh Posté le 22-04-2024 à 17:09:52    

zonka a écrit :

K40c?
 
Si oui elle est UEFI et devrait démarrer en UEFI 'pur' , CSM désactivé etc.
 
La question est : avant de mettre cette carte tu étais en CSM avec boot legacy ou en UEFI, windows sur partition initialisée en GPT etc? Auquel cas c'est censé être ok direct sans manipulations


 
Bonjour zonka, Je suis bien en possession d'un GPU K40 classique car il est livré par défaut avec le refroidissement passif. Depuis que j'ai activé les options "Above 4G Decoding"; "Re-siez BAR Support" et "SR-IOV Support" il n'y a plus de plantage au début du démarrage de mon serveur mais toujours pas de détection de K40 et arrêt du serveur. De plus lorsque je modifie ces réglages il met impossible de ré-accéder au BIOS même avec un autre GPU et impossible également pour le serveur de fonctionner sans quelconque GPU. Voici mon menu CSM Module Configuration dans le BIOS :
 
CSM Support [Enabled]
CSM Module Version 07.79
GateA20 Active [Upon Request]
Option ROM Messages [Force BIOS]
Boot option filtrer [UEFI and Legacy]
Network [Do not launch]
Storage [UEFI]
Video [Legacy]
Other PCI devices [UEFI]
 
Pour Other PCI devices, j'ai également essayé en mode Legacy mais sans succès...

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed