Meilleure configuration possible pour le data mining

Meilleure configuration possible pour le data mining - Conseil d'achat - Hardware

Marsh Posté le 28-05-2018 à 10:20:26    

Bonjour à tous,
 
Dans le cadre de mon emploi, je souhaiterais acheter avec mon entreprise le meilleur ordinateur possible pour traiter des quantités massives de données avec R ( language dédié aux traitements statistiques).  
 
Je bénéfécie d'un buget très élevé c'est à dire de 5 000 euros , voire 10 000 euros si nécessaire.
 
Voici la configuration à laquelle je pensais:
 
CPU : Intel Core i7-7820X
 
GPU: Nvidia GeForce GTX 1080 Ti Turbo - 11 Go
 
RAM: 128 GO de RAM DDR4 ( Corsair - Vengence LPX Series Low Profile 8 * 16 Go 2400 MHz CAS 14)
 
Stockage: 2 To de stockage SSD ( Samsung - 860 EVO - 2 To)
 
Carte mère: MSI - X299 SLI Plus
 
Je ne suis pas expert sur les composants à choisir pour optimiser les temps de traitement et tout conseil est ici le bienvenu  :??:  
Les types de traitements à realiser avec ce super ordinateur seront les suivants:
 
- lecture et mise en RAM de tables depuis une base Oracle  
- traitement des tables avec différentes opérations de selection et de filtre + utilisation d'algorithmes de machine learning type deep learning
- affichage dynamique de cartes sous leaflet permettant de visualiser près de 100 000 objets spaciaux ( type polygones, points...)
 
 
Pour préciser ma demande, voici les questions sur lesquels j'aimerais beaucoup avoir des précisions:
 
- 1/ afin d'effectuer du traitement de données, vaut il préférer un i7 avec 4 coeurs seulement (ex:  Intel® Core™ i7-7740X) mais cadencé à 4.3 Ghz ou bien un i9 avec 16 coeurs ( ex : Intel® Core™ i9-7960X ) mais avec une fréquence d'horloge nettement plus petite ( en l'occurence 2.8 GHz) . Autrement dit: le multi-threat est il valable dans le cadre de lecture de table pour mise en RAM puis traitement de ces tables ? ( je précise que mon probleme principal concerne aujourd'hui le temps de lecture des tables qui atteignent 25 Go au format csv)  
 
- 2/ quel est le composant qui va me permettre d'afficher d'afficher des cartes à partir d'un très grand nombre de données spatiales ( pour info j'utilise le package leaflet) ?  Actuellement, le chargement de la carte prend énormément de temps tout comme le raffraichissement lorsque je zoom ou que je me déplace sur la carte ... La rapidité d'affichage dépend elle de la GPU ou du CPU ( ou d'autre chose ?)  
 
3/ la carte graphique Nvidia GeForce GTX 1080 Ti Turbo - 11 Go est elle performante pour le deep learning ou bien faudrait il partir sur un autre modèle ?
 
 
Je vous remercie d'avance pour l'aide que vous pourriez m'apporter ! :)

Reply

Marsh Posté le 28-05-2018 à 10:20:26   

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed