Meilleure configuration possible pour le data mining

Meilleure configuration possible pour le data mining - Conseil d'achat - Hardware

Marsh Posté le 28-05-2018 à 10:13:20    

Bonjour à tous,
 
Dans le cadre de mon emploi, je souhaiterais acheter avec mon entreprise le meilleur ordinateur possible pour traiter des quantités massives de données avec R ( language dédié aux traitements statistiques).  
 
Je bénéfécie d'un buget très élevé c'est à dire de 5 000 euros , voire 10 000 euros si nécessaire.
 
Voici la configuration à laquelle je pensais:
 
CPU : Intel Core i7-7820X
 
GPU: Nvidia GeForce GTX 1080 Ti Turbo - 11 Go
 
RAM: 128 GO de RAM DDR4 ( Corsair - Vengence LPX Series Low Profile 8 * 16 Go 2400 MHz CAS 14)
 
Stockage: 2 To de stockage SSD ( Samsung - 860 EVO - 2 To)
 
Carte mère: MSI - X299 SLI Plus
 
Je ne suis pas expert sur les composants à choisir pour optimiser les temps de traitement et tout conseil est ici le bienvenu  :??:  
Les types de traitements à realiser avec ce super ordinateur seront les suivants:
 
- lecture et mise en RAM de tables depuis une base Oracle  
- traitement des tables avec différentes opérations de selection et de filtre + utilisation d'algorithmes de machine learning type deep learning
- affichage dynamique de cartes sous leaflet permettant de visualiser près de 100 000 objets spaciaux ( type polygones, points...)
 
 
Pour préciser ma demande, voici les questions sur lesquels j'aimerais beaucoup avoir des précisions:
 
- 1/ afin d'effectuer du traitement de données, vaut il préférer un i7 avec 4 coeurs seulement (ex:  Intel® Core™ i7-7740X) mais cadencé à 4.3 Ghz ou bien un i9 avec 16 coeurs ( ex : Intel® Core™ i9-7960X ) mais avec une fréquence d'horloge nettement plus petite ( en l'occurence 2.8 GHz) . Autrement dit: le multi-threat est il valable dans le cadre de lecture de table pour mise en RAM puis traitement de ces tables ? ( je précise que mon probleme principal concerne aujourd'hui le temps de lecture des tables qui atteignent 25 Go au format csv)  
 
- 2/ quel est le composant qui va me permettre d'afficher d'afficher des cartes à partir d'un très grand nombre de données spatiales ( pour info j'utilise le package leaflet) ?  Actuellement, le chargement de la carte prend énormément de temps tout comme le raffraichissement lorsque je zoom ou que je me déplace sur la carte ... La rapidité d'affichage dépend elle de la GPU ou du CPU ( ou d'autre chose ?)  
 
3/ la carte graphique Nvidia GeForce GTX 1080 Ti Turbo - 11 Go est elle performante pour le deep learning ou bien faudrait il partir sur un autre modèle ?
 
 
Je vous remercie d'avance pour l'aide que vous pourriez m'apporter !  :)  
 
 
 
 
 

Reply

Marsh Posté le 28-05-2018 à 10:13:20   

Reply

Marsh Posté le 28-05-2018 à 10:14:13    

Mauvaise cat.
 
Va voir en Hardware https://forum.hardware.fr/hfr/Hardw [...] ujet-1.htm

Reply

Marsh Posté le 28-05-2018 à 10:30:20    

Ce sujet a été déplacé de la catégorie Discussions vers la categorie Hardware par Fdaniel


---------------
Topic des restos / Topic des boutiques gastronomiques
Reply

Marsh Posté le 29-05-2018 à 10:13:39    

Hello,

 

1/ je doutes que ça change grand chose de passer du i7 au i9. Le read.csv2 de R est mono thread, ce qui pourrait te faire gagner c'est un SSD encore plus rapide, genre ca: https://www.ldlc.com/fiche/PB00219278.html

 

Mais rien que lire tes données et les écrire dans un format binaire (avec readRDS / saveRDS) tu gagnerai déjà énormément. Du coup, faut toujours se taper le CSV une fois, tu le sauvegarde en binaire (saveRDS) et après tu lis du binaire la prochaine fois que tu charge tes données. Et tu gagnera même en place.

 

2/ je sais pas, mais vu que ça a l'air d'être du Javascript derrière, le GPU peut peut être prendre la tâche. Ça dépends de comment c'est fait. Si tu as un ordi déjà en place, je regarderai dans le gestionnaire des taches ce qui est à 100% quand ça rame. CPU ou GPU.

 

3/ la 1080ti, c'est bien, c'est la solution économique. Tu pourrai vouloir une Titan vu que tu as le budget, mais avec la 1080ti tu sera déjà bien.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed