Les clusters de calculs


Présentation générale


Ce site a été réalisé par Romain Bachimont, Mathieu Brunet, Aurélien Piaszczynski dans le cadre des exposés de système et nouvelles technologies réseaux du cours de Dominique Revuz et Etienne Duris tous deux Maître de Conférences à l'université de Marne-la-Vallée et respectivement directeur de l'école Ingénieurs 2000 de l'université de Marne-la-vallée, et responsable de la filière Informatique et Réseaux.

Chaque exposé réalisé par les élèves de troisième année de la filière Informatique et Réseaux (dont voici la liste) est composé de deux travaux :

Les clusters de calculs

Un cluster, ferme de calcul en français,  est un regroupement d'ordinateurs permettant de dépasser les limitations d'une machines en terme de puissance de calcul.

La théorie est apparue dans les années 70 mais le premier cluster fonctionnel est apparu dans le milieu des années 80 par Digital Equipment Corporation, sous le nom de VAXCluster.

Les objectifs des clusters sont:
  • faciliter la montée en charge
  • augmenter la disponibilité
  • permettre une répartition de la charge
  • diminuer les temps de calculs
  • réaliser opérations non réalisables sur un serveur
  •  réduire les coûts : prix / performance d’une grappe de PC est de 3 à 10 fois inférieur à celui des supercalculateurs traditionnels

Les segments de marché

Depuis les années 90, les clusters "se démocratisent". En effet, ceux-ci ne sont sont plus réservés au domaine de la recherche (NASA) ou de la défense.On voit apparaitre une demande importante de calculs dans des domaines tels que :

  • Science des matériaux
  • Défense et sécurité
  • Conception microélectronique
  • Géo-sciences
  • Conception mécanique
 

Cette forte demande a entrainé un démocratisation des systèmes de clustering. Par exemple, le système Beowulf développé par la NASA est disponible librement. Au niveau du matériel, IBM propose BlueGene , un cluster fabriqué "en série". 

Cette demande de puissance de calcul est tellement forte que parallèment au clustering s'est développé le Grid Computing.Ces deux technologies, bien qu'ayant un but commun, diffèrent sur de nombreux points. 

Différence avec le Grid Computing

Cluster
Grid Computing
Sécurité
Isolé du réseau par un firewall
Sécurité des clients difficiles à gérer
Structure
Le plus homogène possible 
Hétérogène
Coût
Très élevé
Peu élevé
Priorité
Vitesse de calcul
Volume de calcul
Données
Dépendantes
Indépendantes
Durée de calcul
Déterminable
Inconnue
Localisation
Un seul site
Répartie