Compute4PUNCH & Storage4PUNCH : Infrastructure Fédérée pour la Physique des Particules, l'Astrophysique et la Physique Nucléaire

1. Introduction & Aperçu

PUNCH4NFDI (Particles, Universe, NuClei and Hadrons for the National Research Data Infrastructure) est un consortium allemand majeur représentant environ 9 000 scientifiques des domaines de la physique des particules, de l'astrophysique, de l'astroparticule, de la physique des hadrons et de la physique nucléaire. Financé par la DFG (Deutsche Forschungsgemeinschaft), son objectif principal est d'établir une plateforme de données scientifiques fédérée et FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables). Cette plateforme vise à fournir un accès unifié aux diverses ressources de calcul et de stockage hétérogènes réparties entre les institutions participantes, répondant ainsi au défi commun d'analyser des volumes de données en croissance exponentielle avec des algorithmes complexes.

Les concepts Compute4PUNCH et Storage4PUNCH sont les piliers techniques conçus pour fédérer les contributions en nature de ressources de calcul à haut débit (HTC), de calcul haute performance (HPC) et de cloud, ainsi que les systèmes de stockage basés sur des technologies comme dCache et XRootD.

Le Consortium en Bref

Nombre de scientifiques représentés : ~9 000 doctorants et chercheurs
Institutions clés : Société Max Planck, Association Leibniz, Association Helmholtz
Financement initial : 5 ans par la DFG
Défi technique central : Fédérer des systèmes opérationnels hétérogènes et préexistants avec une intrusion minimale.

2. Infrastructure de Calcul Hétérogène Fédérée (Compute4PUNCH)

Le concept Compute4PUNCH relève le défi de fournir un accès transparent à un patchwork de ressources de calcul fournies par la communauté, avec des architectures, systèmes d'exploitation, piles logicielles et systèmes d'authentification différents.

2.1 Architecture de Base & Défi d'Intégration

Le principe de conception fondamental est de créer un système de batch en surcouche qui s'appuie sur les pools de ressources existants. Cette approche minimise les changements obligatoires pour les fournisseurs de ressources, une exigence critique car ces ressources sont déjà partagées et opérationnelles. L'hétérogénéité est gérée non pas en homogénéisant l'infrastructure sous-jacente, mais en construisant une couche d'abstraction intelligente par-dessus.

2.2 Technologies Clés : HTCondor, COBalD/TARDIS, CVMFS

HTCondor : Sert de système de batch fédéré en surcouche, gérant la soumission, l'ordonnancement et l'exécution des tâches à travers les ressources distribuées.
COBalD/TARDIS : Agit comme le méta-ordonnanceur de ressources. Il découvre et intègre dynamiquement les ressources dans le pool HTCondor, rendant la fédération adaptative et transparente. TARDIS « pilote » réclame des emplacements sur les ressources distantes, permettant aux tâches HTCondor de s'exécuter.
CERN Virtual Machine File System (CVMFS) : Résout le problème de l'environnement logiciel. Il fournit un dépôt logiciel évolutif, en lecture seule et mis en cache à tous les nœuds de travail, garantissant des environnements d'application cohérents sans installations locales.
Technologies de conteneurs : Utilisées conjointement avec CVMFS pour encapsuler des dépendances complexes et fournir des environnements d'exécution isolés et reproductibles.

2.3 Accès Utilisateur : JupyterHub & AAI à base de Jetons

Les points d'entrée utilisateur sont conçus pour la facilité d'utilisation :

JupyterHub : Fournit une interface de calcul interactive basée sur le web, idéale pour l'analyse exploratoire et le prototypage.
Nœuds de connexion traditionnels : Destinés aux utilisateurs ayant des flux de travail en ligne de commande établis.
Infrastructure d'Authentification et d'Autorisation à base de Jetons (AAI) : Fournit une méthode standardisée et sécurisée pour accéder aux ressources de calcul et de stockage au-delà des frontières institutionnelles, une pierre angulaire de la fédération.

3. Infrastructure de Stockage Fédérée (Storage4PUNCH)

Parallèlement au calcul, les ressources de stockage sont fédérées pour fournir une couche d'accès aux données unifiée.

3.1 Fédération de Stockage avec dCache & XRootD

Le paysage de stockage est principalement composé de systèmes utilisant les technologies dCache ou XRootD, toutes deux bien établies en physique des hautes énergies (HEP). Storage4PUNCH emploie des méthodes de fédération éprouvées dans la communauté HEP au sens large pour créer un espace de noms et un protocole d'accès communs, permettant de localiser et de récupérer des données de manière transparente depuis n'importe quel élément de stockage participant.

3.2 Mise en Cache et Intégration des Métadonnées

Le projet évalue les technologies existantes pour :

Mise en cache : Pour réduire la latence et le trafic sur le réseau étendu en gardant les données fréquemment accédées plus près des ressources de calcul.
Gestion des métadonnées : Visant une intégration plus poussée pour permettre une découverte et une gestion efficaces des données basées sur les attributs des fichiers, et pas seulement sur leur emplacement.

Cela fait évoluer la fédération au-delà du simple accès aux données vers une gestion intelligente des données.

4. Mise en Œuvre Technique & État du Prototype

Les concepts sont en cours de développement actif. Des prototypes intégrant des ensembles initiaux de ressources de calcul et de stockage ont été établis. La contribution mentionne « premières expériences avec des applications scientifiques exécutées sur les prototypes disponibles », indiquant que les flux de travail des premiers utilisateurs sont testés pour valider l'architecture et identifier les obstacles pratiques. L'environnement combiné est en mesure de permettre aux chercheurs d'exécuter des tâches d'analyse gourmandes en ressources à travers l'infrastructure fédérée.

5. Analyse Principale & Perspective Analytique

Analyse Principale

PUNCH4NFDI ne construit pas un nouveau supercalculateur ; il conçoit une couche de fédération pour l'hétérogénéité administrative et politique. La véritable innovation est la contrainte pragmatique de « l'intrusion minimale » sur les systèmes existants. Ce n'est pas une conception sur table rase comme les clusters Borg ou Omega de Google, mais une surcouche diplomatique et technique pour des ressources souveraines et héritées. Son succès dépend moins de la nouveauté technique brute que de la gouvernance et de l'adoption — une leçon que l'on retrouve dans les difficultés et les succès du European Open Science Cloud (EOSC).

Flux Logique

La logique est élégamment récursive : 1) Accepter l'hétérogénéité comme une contrainte de premier ordre, 2) Utiliser de la « colle » mature et testée par la communauté (HTCondor, dCache) pour construire la surcouche, 3) S'appuyer sur la fourniture d'environnements déclaratifs (CVMFS/conteneurs) pour découpler le logiciel de l'infrastructure, et 4) Fournir des points d'entrée simples et modernes (JupyterHub) pour masquer la complexité sous-jacente. Ce flux priorise la faisabilité de la fédération par rapport aux performances locales optimales, un compromis nécessaire pour la collaboration interinstitutionnelle.

Points Forts & Faiblesses

Points forts : L'utilisation de middleware HEP éprouvé (HTCondor, XRootD) réduit considérablement le risque technique. Le modèle en surcouche est politiquement astucieux, abaissant les barrières à l'entrée pour les fournisseurs de ressources. CVMFS est un coup de maître pour la portabilité logicielle, un point de douleur chronique dans les environnements hétérogènes.

Faiblesses & Risques : Le méta-ordonnanceur (COBalD/TARDIS) ajoute une couche de complexité et des points de défaillance potentiels uniques. La prévisibilité des performances sera inférieure à celle de systèmes dédiés et homogènes — la latence réseau et la contention des ressources deviennent des variables incontrôlables. Le document est silencieux sur les modèles de coût et la durabilité au-delà du financement de 5 ans de la DFG, un signal d'alarme majeur pour la viabilité à long terme, comme on l'a vu dans d'autres projets d'e-infrastructure qui ont stagné après la phase pilote.

Perspectives Actionnables

Pour les autres consortiums : Copiez le modèle de gouvernance, pas seulement la pile technologique. Commencez avec une AAI légère et un seul cas d'utilisation convaincant. Pour PUNCH4NFDI lui-même : Publiez immédiatement des données de référence comparant le débit des tâches et la latence d'accès aux données en mode fédéré versus local. Développez un modèle clair, à plusieurs niveaux, d'adhésion et de partage des coûts pour la phase post-subvention. Explorez l'intégration avec l'éclatement vers le cloud commercial (AWS, GCP) via la même surcouche pour gérer les pics de demande, en suivant la voie de projets comme l'expérience CMS sur AWS.

6. Détails Techniques & Cadre Mathématique

Le problème d'ordonnancement des ressources dans une telle fédération peut être abstrait. Soit $R = \{r_1, r_2, ..., r_n\}$ l'ensemble des ressources hétérogènes, chacune avec des propriétés dynamiques comme les cœurs disponibles $C_i(t)$, la mémoire $M_i(t)$ et le matériel spécialisé (par ex., GPU). Soit $J = \{j_1, j_2, ..., j_m\}$ l'ensemble des tâches avec des exigences $\text{req}(j_k)$.

L'objectif du méta-ordonnanceur est une fonction de mappage $\mathcal{M}: J \rightarrow R$ qui maximise une fonction d'utilité $U$, souvent une somme pondérée d'efficacité et d'équité, tout en respectant les contraintes :

$$ \text{Maximiser } U = \alpha \cdot \text{Utilisation} + \beta \cdot \text{Équité} - \gamma \cdot \text{Coût}_{\text{déplacement-données}} $$ $$ \text{sous contraintes : } \forall r_i, \sum_{j_k \in \mathcal{M}^{-1}(r_i)} \text{req}_{\text{cœurs}}(j_k) \leq C_i(t) $$

Le terme Coût_{déplacement-données} est critique dans un environnement de stockage fédéré, pénalisant les ordonnancements qui nécessitent de déplacer de grands ensembles de données à travers des réseaux étendus. Cela rend le problème distinct de l'ordonnancement classique de clusters.

L'AAI à base de jetons peut être modélisée comme un système de contrôle d'accès basé sur les capacités. Un jeton $\tau$ émis à l'utilisateur $u$ pour la ressource $r$ est une déclaration signée cryptographiquement : $\tau = \text{Sign}_{\text{AAI}}(u, r, \text{portée}, \text{expiration})$. Cela décentralise les décisions d'autorisation vers les fournisseurs de ressources, qui n'ont qu'à valider la signature du jeton.

7. Résultats Expérimentaux & Performance du Prototype

Bien que le PDF ne contienne pas de résultats quantitatifs spécifiques, les « premières expériences avec des applications scientifiques » mentionnées impliquent des tests d'intégration initiaux. Nous pouvons conceptualiser les indicateurs de performance clés (KPI) qui devraient être mesurés :

Graphique de Performance Conceptuel : Exécution de Tâches Fédérée vs. Locale

Type de graphique : Graphique en lignes à double axe.

Axe X : Temps (chronologie du projet ou lots de tâches consécutifs).

Axe Y Gauche (Barres) : Taux de Réussite des Tâches (%). Cela montrerait le pourcentage de tâches qui se terminent avec succès lorsqu'elles sont soumises au système fédéré par rapport à un cluster local stable. Les premières phases de prototype montreraient probablement un taux de réussite fédéré plus faible en raison de problèmes d'intégration (échecs d'authentification, incompatibilités d'environnement logiciel, problèmes réseau), convergeant avec le temps.

Axe Y Droit (Lignes) : Temps d'exécution Moyen des Tâches (heures). Cette métrique serait typiquement plus élevée pour le système fédéré en raison de la surcharge d'ordonnancement ajoutée, de la latence de préparation des données et de la mise en file d'attente potentielle sur plusieurs backends indépendants. L'objectif est de minimiser cet écart. Le graphique visualiserait le compromis entre l'accès accru aux ressources (exécution réussie de tâches plus nombreuses/plus grandes) et la pénalité temporelle payée pour la fédération.

Analyse Clé du Graphique : La valeur de la fédération n'est pas de surpasser les performances locales mais de permettre des charges de travail qui seraient autrement impossibles en raison des contraintes de ressources locales, même si elles prennent plus de temps. La pente de la ligne du temps d'exécution fédéré diminuant avec le temps indique une maturation de l'optimisation dans le méta-ordonnanceur.

8. Cadre d'Analyse : Exemple de Flux de Travail Conceptuel

Puisque le PDF ne contient pas de code, voici une description de flux de travail conceptuelle basée sur YAML qu'un chercheur pourrait utiliser pour définir une tâche d'analyse pour la fédération Compute4PUNCH/Storage4PUNCH. Cela met en évidence la nature déclarative du système ciblé.

# punch_analysis_workflow.yaml
workflow:
  name: "punch4nfdi_federated_analysis"
  user: "researcher@uni-example.de"
  aai_token: "${PUNCH_AAI_TOKEN}"  # Injecté depuis l'environnement

compute:
  requirements:
    cores: 8
    memory: "32GB"
    runtime: "48h"
    software_stack: "punchenv/analysis-suite:latest"  # Résolu via CVMFS/Container
    priority: "medium"

storage:
  input_data:
    - protocol: "root"
      path: "root://storage-a.punch.de//experiment/run2023/data_*.root"
      cache_prefetch: true  # Indication pour la couche de cache Storage4PUNCH
  output_data:
    - protocol: "s3"
      endpoint: "https://object-store.punch.de"
      path: "/results/${WORKFLOW_ID}/histograms.root"

execution:
  entry_point: "jupyterlab"  # Optionnel : Démarrer une session interactive
  # OU
  batch_command: "python /analysis/run_full_chain.py --input ${INPUT_PATH} --output ${OUTPUT_PATH}"

provenance:
  log_level: "detailed"
  export_metadata_to: "meta.punch.de/catalog"

Cette spécification fictive montre comment un utilisateur déclare ce dont il a besoin (ressources, logiciels, données) sans spécifier où cela s'exécute. Le middleware de la fédération (HTCondor, TARDIS, fédération de stockage) interprète cette spécification, trouve des ressources appropriées, prépare les données, injecte l'environnement logiciel et exécute la tâche, rapportant les journaux et les sorties aux emplacements spécifiés.

9. Applications Futures & Feuille de Route de Développement

L'infrastructure PUNCH4NFDI jette les bases de plusieurs applications avancées :

Analyse Astrophysique Multi-Messagers/Trans-Expérience : Combiner de manière transparente des données de détecteurs de particules, de télescopes et d'observatoires d'ondes gravitationnelles dans un seul flux de travail d'analyse, en tirant parti de différentes ressources de calcul spécialisées (fermes GPU pour l'analyse d'images, HTC pour le traitement d'événements de particules).
Entraînement de Modèles IA/ML à Grande Échelle : Le pool de ressources fédéré peut provisionner dynamiquement de grands clusters éphémères pour entraîner des modèles complexes sur des ensembles de données distribués sans centraliser les données, s'alignant sur les paradigmes d'apprentissage fédéré.
Exploration et Visualisation Interactive des Données : Coupler l'interface JupyterHub avec des backends de visualisation distante haute performance, accélérés par GPU, pour les données de simulation à grande échelle.
Intégration avec des e-Infrastructures Externes : L'architecture en surcouche est conceptuellement compatible avec la connexion à des ressources à l'échelle européenne comme le European Open Science Cloud (EOSC) ou les systèmes HPC PRACE, agissant comme une passerelle allemande.

Priorités de la Feuille de Route de Développement :

Robustesse & Industrialisation : Passer du prototype à un service fiable 24h/24 et 7j/7 avec des SLA.
Placement Intelligent des Données : Améliorer le méta-ordonnanceur avec une conscience de la localité des données pour minimiser $\text{Coût}_{\text{déplacement-données}}$.
Catalogue de Métadonnées Avancé : Mettre en œuvre un système de métadonnées puissant et consultable au-dessus de Storage4PUNCH pour permettre la découverte de données basée sur les propriétés physiques.
Métriques d'Informatique Verte : Intégrer des outils pour surveiller et optimiser l'efficacité énergétique à travers les ressources fédérées, une préoccupation croissante pour le calcul à grande échelle.

10. Références

Consortium PUNCH4NFDI. (2024). « PUNCH4NFDI - Particles, Universe, NuClei and Hadrons for the NFDI. » Site Officiel. https://www.punch4nfdi.de/
Thain, D., Tannenbaum, T., & Livny, M. (2005). « Distributed computing in practice: the Condor experience. » Concurrency and Computation: Practice and Experience, 17(2-4), 323-356. (L'article fondateur sur HTCondor).
Blomer, J., et al. (2011). « The CernVM File System: A scalable, read-only, software distribution service. » Journal of Physics: Conference Series, 331(5), 052004. (Détails sur CVMFS).
Commission Européenne. (2024). « European Open Science Cloud (EOSC). » https://eosc-portal.eu/ (Pour comparaison sur les défis de fédération à l'échelle de l'UE).
Verma, A., et al. (2015). « Large-scale cluster management at Google with Borg. » Proceedings of the European Conference on Computer Systems (EuroSys). (Contraste la gestion de cluster sur table rase avec les surcouches de fédération).
Collaboration CMS. (2021). « CMS Computing Operations in the AWS Cloud. » EPJ Web of Conferences, 251, 02006. (Exemple de modèle hybride cloud/fédération).
Principes FAIR pour les Données. (2016). FORCE11. https://www.go-fair.org/fair-principles/ (Les principes directeurs pour la plateforme de données PUNCH).