Tranche de calcul Grid5000 (2015, axe 2b)

Opération au titre de l’année : 2015
Titre : Tranche de calcul Grid’5000
Site(s) : Inria–LORIA
Porteur(s) : Lucas Nussbaum (LORIA, MCF Université de Lorraine)
Financement : 550 k€

Contexte et motivations

Grid’5000 est une plate-forme pour la recherche expérimentale en
informatique. Elle permet à ses utilisateurs de réserver un grand nombre de
ressources (8 sites, 26 clusters, 873 nœuds, 8504 cœurs), avec un très haut
niveau de reconfigurabilité: chaque utilisateur peut déployer sa propre pile
logicielle (système, applications), sans aucune contrainte particulière
(directement sur les machines physiques), et reconfigurer le réseau pour
s’isoler pendant son expérience ou pour obtenir une topologie particulière.
C’est actuellement la plate-forme avec ces objectifs la plus avancée au monde.

En 2015 et début 2016, Grâce au projet CPER Cyber-Entreprises et à une OIP (Opération
d’Investissement Programmé) Inria, le site de Nancy a été entièrement
renouvelé. Cette opération, réalisée en concertation avec les autres
partenaires du Groupement d’Intérêt Scientifique Grid’5000, avait trois
principaux objectifs:

  1. Renforcer les possibilités d’expérimentation réseau sur Grid’5000, notamment pour expérimenter sur les réseaux logiciels (Software-Defined Networking) ;
  2. Servir de nouvelles communautés de chercheurs en informatique qui ont d’importants besoins en calcul et traitement (notamment pour du Deep Learning) ;
  3. Permettre le renouvellement du site Grid’5000 de Nancy, dont la plupart des matériels avaient été achetés en 2007,  2009 et 2010, et étaient hors garantie.

Cet achat s’inscrit dans le programme plus général de renouvellement de Grid’5000 conduit par Inria grâce à un OIP. Ainsi, en 2014, le site de Rennes avait été renouvelé (grâce à un co-financement du CPER Bretagne, total de 650 k€). Et en 2016, le site de Lille va être renouvelé (grâce à un cofinancement du CPER Nord Pas de Calais).

Investissement réalisé

Pour répondre à ces besoins, l’achat suivant a été réalisé, pour un budget global de 550k€

  • Un switch CISCO Nexus 9508 disposant de 240 ports 10G et 20 ports 40G, extensible à 384 ports 10G et 32 ports 40G, entièrement non-bloquant ;
  • 75 nœuds, répartis en:
    • 40 nœuds pour l’expérimentation réseau, dotés de 4 interfaces 10G connectées au switch;
    • 27 nœuds connectés à un switch Infiniband, pour servir de nouvelles communautés d’utilisateurs orientées HPC;
    • 8 nœuds Big Data (dotés de plusieurs disques durs et SSD) pour permettre des expérimentations sur des frameworks de stockage, de manière complémentaire aux deux clusters de ce type déjà en place à Rennes et Nantes (étude des migrations de données entre systèmes de stockage, par exemple).

Ces équipements ont été installés physiquement en décembre 2015, dans la salle B056 du batiment Inria Nancy — Grand Est. Grâce à une bonne anticipation des opérations à réaliser, ils ont pû être mis à disposition des utilisateurs dès janvier, et sont pleinement fonctionnels (taux d’utilisation de 91% sur les nuits et week-ends pour le
principal cluster installé, grisou, en mai et juin 2016).

CV du porteur de l’opération

Lucas Nussbaum, maitre de Conférences à l’Université de Lorraine depuis 2009, est chercheur dans l’équipe MADYNES (LORIA / Inria Nancy Grand-Est). Ses thème de recherche sont l’expérimentation et la recherche reproductible pour les systèmes distribués (HPC, Cloud, Big Data, réseau). L. Nussbaum est responsable du
site Grid’5000 de Nancy, membre du bureau et du comité d’architectes du GIS Grid’5000.

Galerie

 

Les commentaires sont clos.