Compute4PUNCH & Storage4PUNCH: Föderierte Infrastruktur für Teilchen-, Astro- und Kernphysik

1. Einführung & Überblick

PUNCH4NFDI (Particles, Universe, NuClei and Hadrons for the National Research Data Infrastructure) ist ein bedeutendes deutsches Konsortium, das etwa 9.000 Wissenschaftler:innen aus der Teilchen-, Astro-, Astroteilchen-, Hadronen- und Kernphysik vertritt. Gefördert von der DFG (Deutsche Forschungsgemeinschaft) ist sein Hauptziel, eine föderierte, FAIR (Findable, Accessible, Interoperable, Reusable) Wissenschaftsdatenplattform zu etablieren. Diese Plattform soll einen einheitlichen Zugang zu den vielfältigen und heterogenen Rechen- und Speicherressourcen bieten, die über die teilnehmenden Institutionen verteilt sind, und so die gemeinsame Herausforderung bewältigen, exponentiell wachsende Datenmengen mit komplexen Algorithmen zu analysieren.

Die Konzepte Compute4PUNCH und Storage4PUNCH sind die technischen Säulen, die entwickelt wurden, um Naturalleistungen im Bereich High-Throughput Computing (HTC), High-Performance Computing (HPC) und Cloud-Ressourcen sowie Speichersysteme auf Basis von Technologien wie dCache und XRootD zu föderieren.

Konsortium im Überblick

Vertretene Wissenschaftler:innen: ~9.000 Promovierte
Wichtige Institutionen: Max-Planck-Gesellschaft, Leibniz-Gemeinschaft, Helmholtz-Gemeinschaft
Anfangsfinanzierung: 5 Jahre durch die DFG
Kern-Herausforderung: Föderierung heterogener, bereits existierender und betriebener Systeme mit minimalem Eingriff.

2. Föderierte heterogene Recheninfrastruktur (Compute4PUNCH)

Das Compute4PUNCH-Konzept adressiert die Herausforderung, einen nahtlosen Zugang zu einem Flickenteppich von von der Community bereitgestellten Rechenressourcen mit unterschiedlichen Architekturen, Betriebssystemen, Software-Stacks und Authentifizierungssystemen zu bieten.

2.1 Kernarchitektur & Integrationsherausforderung

Das grundlegende Designprinzip ist die Schaffung eines Overlay-Batch-Systems, das auf bestehenden Ressourcenpools aufsetzt. Dieser Ansatz minimiert zwingende Änderungen für Ressourcenanbieter, eine kritische Anforderung, da diese Ressourcen bereits geteilt und im Betrieb sind. Die Heterogenität wird nicht durch Homogenisierung der zugrundeliegenden Infrastruktur gemanagt, sondern durch den Aufbau einer intelligenten Abstraktionsschicht darüber.

2.2 Schlüsseltechnologien: HTCondor, COBalD/TARDIS, CVMFS

HTCondor: Dient als föderiertes Overlay-Batch-System, verwaltet Job-Einreichung, -Planung und -Ausführung über die verteilten Ressourcen hinweg.
COBalD/TARDIS: Fungiert als Ressourcen-Meta-Scheduler. Es entdeckt und integriert Ressourcen dynamisch in den HTCondor-Pool, macht die Föderation adaptiv und transparent. TARDIS-„Piloten“ beanspruchen Slots auf entfernten Ressourcen, sodass HTCondor-Jobs dort ausgeführt werden können.
CERN Virtual Machine File System (CVMFS): Löst das Problem der Softwareumgebung. Es liefert ein skalierbares, schreibgeschütztes und gecachtes Software-Repository an alle Worker-Knoten und stellt so konsistente Anwendungsumgebungen ohne lokale Installationen sicher.
Container-Technologien: Werden neben CVMFS eingesetzt, um komplexe Abhängigkeiten zu kapseln und isolierte, reproduzierbare Laufzeitumgebungen bereitzustellen.

2.3 Nutzerzugang: JupyterHub & Token-basierte AAI

Nutzerzugangspunkte sind auf Benutzerfreundlichkeit ausgelegt:

JupyterHub: Bietet eine webbasierte, interaktive Computing-Oberfläche, ideal für explorative Analyse und Prototyping.
Traditionelle Login-Knoten: Bieten Zugang für Nutzer mit etablierten Kommandozeilen-Workflows.
Token-basierte Authentifizierungs- und Autorisierungsinfrastruktur (AAI): Bietet eine standardisierte, sichere Methode für den Zugriff auf Rechen- und Speicherressourcen über Institutionsgrenzen hinweg, ein Eckpfeiler der Föderation.

3. Föderierte Speicherinfrastruktur (Storage4PUNCH)

Parallel zur Recheninfrastruktur werden die Speicherressourcen föderiert, um eine einheitliche Datenzugriffsschicht bereitzustellen.

3.1 Speicherföderation mit dCache & XRootD

Die Speicherlandschaft besteht hauptsächlich aus Systemen, die dCache oder XRootD Technologien verwenden, beide in der Hochenergiephysik (HEP) etabliert. Storage4PUNCH setzt Föderationsmethoden ein, die sich in der breiteren HEP-Community bewährt haben, um einen gemeinsamen Namensraum und Zugriffsprotokoll zu schaffen. Dies ermöglicht es, Daten transparent von jedem teilnehmenden Speicherelement zu lokalisieren und abzurufen.

3.2 Caching und Metadatenintegration

Das Projekt evaluiert bestehende Technologien für:

Caching: Zur Reduzierung von Latenz und Weitverkehrsnetzwerkverkehr, indem häufig genutzte Daten näher an den Rechenressourcen gehalten werden.
Metadatenbehandlung: Ziel ist eine tiefere Integration, um effiziente Datenerkennung und -verwaltung basierend auf Dateiattributen (nicht nur dem Speicherort) zu ermöglichen.

Dies bewegt die Föderation über einfachen Datenzugriff hinaus hin zu intelligentem Datenmanagement.

4. Technische Umsetzung & Prototyp-Status

Die Konzepte befinden sich in aktiver Entwicklung. Prototypen, die erste Sätze von Rechen- und Speicherressourcen integrieren, wurden eingerichtet. Der Beitrag erwähnt „erste Erfahrungen mit wissenschaftlichen Anwendungen, die auf den verfügbaren Prototypen ausgeführt werden“, was darauf hindeutet, dass Workflows von Early Adoptern getestet werden, um die Architektur zu validieren und praktische Hürden zu identifizieren. Die kombinierte Umgebung ist bereit, Forschenden die Ausführung ressourcenintensiver Analysen über die föderierte Infrastruktur hinweg zu ermöglichen.

5. Kernaussage & Analystenperspektive

Kernaussage

PUNCH4NFDI baut keinen neuen Supercomputer; es konstruiert eine Föderationsschicht für administrative und politische Heterogenität. Die eigentliche Innovation ist die pragmatische Einschränkung des „minimalen Eingriffs“ in bestehende Systeme. Dies ist kein Neudesign wie Googles Borg- oder Omega-Cluster, sondern eine diplomatische und technische Überlagerung für souveräne, bestehende (Legacy-)Ressourcen. Sein Erfolg hängt weniger von roher technischer Neuheit ab als vielmehr von Governance und Akzeptanz – eine Lektion, die sich in den Schwierigkeiten und Erfolgen der European Open Science Cloud (EOSC) widerspiegelt.

Logischer Ablauf

Die Logik ist elegant rekursiv: 1) Heterogenität als primäre Randbedingung akzeptieren, 2) Bewährte, von der Community getestete „Klebstoffe“ (HTCondor, dCache) für den Aufbau der Überlagerung nutzen, 3) Auf deklarative Umgebungsbereitstellung (CVMFS/Container) setzen, um Software von der Infrastruktur zu entkoppeln, und 4) Einfache, moderne Einstiegspunkte (JupyterHub) bereitstellen, um die zugrundeliegende Komplexität zu verbergen. Dieser Ablauf priorisiert die Machbarkeit der Föderation gegenüber optimaler lokaler Leistung – ein notwendiger Kompromiss für institutionsübergreifende Zusammenarbeit.

Stärken & Schwächen

Stärken: Der Einsatz von erprobter HEP-Middleware (HTCondor, XRootD) reduziert das technische Risiko drastisch. Das Overlay-Modell ist politisch klug und senkt die Eintrittsbarrieren für Ressourcenanbieter. CVMFS ist ein Meisterstreich für Software-Portabilität, einem chronischen Problem in heterogenen Umgebungen.

Schwächen & Risiken: Der Meta-Scheduler (COBalD/TARDIS) fügt eine zusätzliche Komplexitätsschicht und potenzielle Single Points of Failure hinzu. Die Leistungsvorhersagbarkeit wird im Vergleich zu dedizierten, homogenen Systemen leiden – Netzwerklatenz und Ressourcenkonkurrenz werden zu unberechenbaren Faktoren. Das Dokument schweigt zu Kostenmodellen und Nachhaltigkeit über die 5-jährige DFG-Finanzierung hinaus, eine große Warnflagge für die langfristige Lebensfähigkeit, wie sie auch bei anderen E-Infrastrukturprojekten zu beobachten ist, die nach der Pilotphase ins Stocken gerieten.

Umsetzbare Erkenntnisse

Für andere Konsortien: Kopieren Sie das Governance-Modell, nicht nur den Tech-Stack. Beginnen Sie mit einer schlanken AAI und einem einzigen, überzeugenden Anwendungsfall. Für PUNCH4NFDI selbst: Sofort Benchmark-Daten veröffentlichen, die föderierten vs. lokalen Job-Durchsatz und Datenzugriffslatenz vergleichen. Ein klares, gestaffeltes Mitgliedschafts- und Kostenverteilungsmodell für die Phase nach der Förderung entwickeln. Die Integration mit kommerziellem Cloud Bursting (AWS, GCP) über dieselbe Überlagerung zur Bewältigung von Spitzenlasten erkunden, ähnlich dem Weg von Projekten wie dem CMS-Experiment auf AWS.

6. Technische Details & Mathematisches Rahmenwerk

Das Ressourcenplanungsproblem in einer solchen Föderation kann abstrahiert werden. Sei $R = \{r_1, r_2, ..., r_n\}$ die Menge heterogener Ressourcen, jede mit dynamischen Eigenschaften wie verfügbaren Kernen $C_i(t)$, Speicher $M_i(t)$ und spezialisierter Hardware (z.B. GPUs). Sei $J = \{j_1, j_2, ..., j_m\}$ die Menge von Jobs mit Anforderungen $\text{req}(j_k)$.

Das Ziel des Meta-Schedulers ist eine Abbildungsfunktion $\mathcal{M}: J \rightarrow R$, die eine Nutzenfunktion $U$ maximiert, oft eine gewichtete Summe aus Effizienz und Fairness, unter Einhaltung von Randbedingungen:

$$ \text{Maximiere } U = \alpha \cdot \text{Auslastung} + \beta \cdot \text{Fairness} - \gamma \cdot \text{Kosten}_{\text{Datenbewegung}} $$ $$ \text{unter den Nebenbedingungen: } \forall r_i, \sum_{j_k \in \mathcal{M}^{-1}(r_i)} \text{req}_{\text{Kerne}}(j_k) \leq C_i(t) $$

Der Term Kosten_{Datenbewegung} ist in einer föderierten Speicherumgebung kritisch, da er Zeitpläne bestraft, die das Verschieben großer Datensätze über Weitverkehrsnetzwerke erfordern. Dies unterscheidet das Problem vom klassischen Cluster-Scheduling.

Die token-basierte AAI kann als ein capability-basiertes Zugriffskontrollsystem modelliert werden. Ein Token $\tau$, das für Nutzer $u$ für Ressource $r$ ausgestellt wird, ist eine kryptografisch signierte Aussage: $\tau = \text{Sign}_{\text{AAI}}(u, r, \text{Bereich}, \text{Ablauf})$. Dies dezentralisiert Autorisierungsentscheidungen zu den Ressourcenanbietern, die nur die Tokensignatur validieren müssen.

7. Experimentelle Ergebnisse & Prototyp-Leistung

Während das PDF keine spezifischen quantitativen Ergebnisse enthält, implizieren die erwähnten „ersten Erfahrungen mit wissenschaftlichen Anwendungen“ erste Integrationstests. Wir können die zu messenden Key Performance Indicators (KPIs) konzeptualisieren:

Konzeptuelle Leistungsgrafik: Föderierte vs. lokale Job-Ausführung

Grafiktyp: Liniendiagramm mit zwei Y-Achsen.

X-Achse: Zeit (Projektzeitplan oder aufeinanderfolgende Job-Batches).

Linke Y-Achse (Balken): Job-Erfolgsrate (%). Dies würde den Prozentsatz der Jobs zeigen, die erfolgreich abgeschlossen werden, wenn sie an das föderierte System vs. einen stabilen lokalen Cluster übermittelt werden. Frühe Prototyp-Phasen würden wahrscheinlich eine niedrigere föderierte Erfolgsrate aufgrund von Integrationsproblemen (Authentifizierungsfehler, Softwareumgebungsinkompatibilitäten, Netzwerkprobleme) zeigen, die sich mit der Zeit angleichen.

Rechte Y-Achse (Linien): Durchschnittliche Job-Durchlaufzeit (Stunden). Diese Metrik wäre typischerweise für das föderierte System höher aufgrund zusätzlicher Planungs-Overheads, Datenstaging-Latenz und potenzieller Warteschlangenbildung über mehrere unabhängige Backends hinweg. Das Ziel ist es, diese Lücke zu minimieren. Die Grafik würde den Kompromiss zwischen erhöhtem Ressourcenzugang (erfolgreiche Ausführung von mehr/größeren Jobs) und dem für die Föderation gezahlten Zeitaufwand visualisieren.

Wesentliche Erkenntnis aus der Grafik: Der Wert der Föderation liegt nicht darin, lokale Leistung zu übertreffen, sondern darin, Workloads zu ermöglichen, die aufgrund lokaler Ressourcenbeschränkungen sonst unmöglich wären, selbst wenn sie länger dauern. Die abnehmende Steigung der föderierten Durchlaufzeitlinie über die Zeit deutet auf eine reifende Optimierung im Meta-Scheduler hin.

8. Analyse-Framework: Konzeptuelles Workflow-Beispiel

Da das PDF keinen Code enthält, folgt hier eine konzeptuelle, YAML-basierte Workflow-Beschreibung, wie sie eine Forscherin verwenden könnte, um einen Analyse-Job für die Compute4PUNCH/Storage4PUNCH-Föderation zu definieren. Dies hebt die deklarative Natur des angestrebten Systems hervor.

# punch_analysis_workflow.yaml
workflow:
  name: "punch4nfdi_federated_analysis"
  user: "researcher@uni-example.de"
  aai_token: "${PUNCH_AAI_TOKEN}"  # Aus der Umgebung eingefügt

compute:
  requirements:
    cores: 8
    memory: "32GB"
    runtime: "48h"
    software_stack: "punchenv/analysis-suite:latest"  # Aufgelöst via CVMFS/Container
    priority: "medium"

storage:
  input_data:
    - protocol: "root"
      path: "root://storage-a.punch.de//experiment/run2023/data_*.root"
      cache_prefetch: true  # Hinweis an die Storage4PUNCH-Caching-Schicht
  output_data:
    - protocol: "s3"
      endpoint: "https://object-store.punch.de"
      path: "/results/${WORKFLOW_ID}/histograms.root"

execution:
  entry_point: "jupyterlab"  # Optional: Interaktive Sitzung starten
  # ODER
  batch_command: "python /analysis/run_full_chain.py --input ${INPUT_PATH} --output ${OUTPUT_PATH}"

provenance:
  log_level: "detailed"
  export_metadata_to: "meta.punch.de/catalog"

Diese fiktive Spezifikation zeigt, wie ein Nutzer deklariert, was er benötigt (Ressourcen, Software, Daten), ohne anzugeben, wo es ausgeführt wird. Die Middleware der Föderation (HTCondor, TARDIS, Speicherföderation) interpretiert diese Spezifikation, findet geeignete Ressourcen, staged Daten, injiziert die Softwareumgebung und führt den Job aus, wobei Protokolle und Ausgaben an die angegebenen Orte gemeldet werden.

9. Zukünftige Anwendungen & Entwicklungsfahrplan

Die PUNCH4NFDI-Infrastruktur legt eine Grundlage für mehrere fortgeschrittene Anwendungen:

Experimentübergreifende/Multi-Messenger-Astrophysik-Analyse: Nahtlose Kombination von Daten aus Teilchendetektoren, Teleskopen und Gravitationswellenobservatorien in einem einzigen Analyse-Workflow, unter Nutzung verschiedener spezialisierter Rechenressourcen (GPU-Farmen für Bildanalyse, HTC für Teilchenereignisverarbeitung).
KI/ML-Modelltraining im großen Maßstab: Der föderierte Ressourcenpool kann dynamisch große, kurzlebige Cluster für das Training komplexer Modelle auf verteilten Datensätzen bereitstellen, ohne die Daten zu zentralisieren, und entspricht so föderierten Lernparadigmen.
Interaktive Datenerkundung und Visualisierung: Kopplung der JupyterHub-Oberfläche mit leistungsstarken, GPU-beschleunigten Remote-Visualisierungs-Backends für großskalige Simulationsdaten.
Integration mit externen E-Infrastrukturen: Die Overlay-Architektur ist konzeptionell kompatibel mit der Anbindung an europaweite Ressourcen wie die European Open Science Cloud (EOSC) oder PRACE-HPC-Systeme und kann als deutsches Gateway fungieren.

Prioritäten des Entwicklungsfahrplans:

Robustheit & Produktivsetzung: Übergang vom Prototyp zu einem 24/7 zuverlässigen Dienst mit SLAs.
Intelligente Datenplatzierung: Erweiterung des Meta-Schedulers um Datenlokalitätsbewusstsein, um $\text{Kosten}_{\text{Datenbewegung}}$ zu minimieren.
Erweitertes Metadatenkatalog: Implementierung eines leistungsfähigen, durchsuchbaren Metadatensystems auf Basis von Storage4PUNCH, um Datenerkennung basierend auf physikalischen Eigenschaften zu ermöglichen.
Green-Computing-Metriken: Integration von Tools zur Überwachung und Optimierung der Energieeffizienz über die föderierten Ressourcen hinweg, ein wachsendes Anliegen für großskaliges Computing.

10. Referenzen

PUNCH4NFDI-Konsortium. (2024). "PUNCH4NFDI - Particles, Universe, NuClei and Hadrons for the NFDI." Offizielle Website. https://www.punch4nfdi.de/
Thain, D., Tannenbaum, T., & Livny, M. (2005). "Distributed computing in practice: the Condor experience." Concurrency and Computation: Practice and Experience, 17(2-4), 323-356. (Das grundlegende HTCondor-Papier).
Blomer, J., et al. (2011). "The CernVM File System: A scalable, read-only, software distribution service." Journal of Physics: Conference Series, 331(5), 052004. (Details zu CVMFS).
Europäische Kommission. (2024). "European Open Science Cloud (EOSC)." https://eosc-portal.eu/ (Zum Vergleich der Föderationsherausforderungen auf EU-Ebene).
Verma, A., et al. (2015). "Large-scale cluster management at Google with Borg." Proceedings of the European Conference on Computer Systems (EuroSys). (Kontrastiert Neudesign-Clustermanagement mit Föderations-Overlays).
CMS-Kollaboration. (2021). "CMS Computing Operations in the AWS Cloud." EPJ Web of Conferences, 251, 02006. (Beispiel für ein Hybrid-Cloud/Föderations-Modell).
FAIR Data Principles. (2016). FORCE11. https://www.go-fair.org/fair-principles/ (Die Leitprinzipien für die PUNCH-Datenplattform).