Compute4PUNCH & Storage4PUNCH: Infraestrutura Federada para Física de Partículas, Astrofísica e Física Nuclear

1. Introdução & Visão Geral

O PUNCH4NFDI (Partículas, Universo, Núcleos e Hadrões para a Infraestrutura Nacional de Dados de Investigação) é um grande consórcio alemão que representa aproximadamente 9.000 cientistas das áreas de física de partículas, astrofísica, astropartículas, física de hadrões e física nuclear. Financiado pela DFG (Fundação Alemã de Investigação), o seu principal objetivo é estabelecer uma plataforma federada de dados científicos FAIR (Localizáveis, Acessíveis, Interoperáveis, Reutilizáveis). Esta plataforma visa fornecer acesso unificado aos diversos e heterogéneos recursos de computação e armazenamento dispersos pelas instituições participantes, abordando o desafio comum de analisar volumes de dados que crescem exponencialmente com algoritmos complexos.

Os conceitos Compute4PUNCH e Storage4PUNCH são os pilares técnicos concebidos para federar contribuições em espécie de recursos de Computação de Alto Débito (HTC), Computação de Alto Desempenho (HPC) e Cloud, bem como sistemas de armazenamento baseados em tecnologias como dCache e XRootD.

Consórcio em Resumo

Cientistas Representados: ~9.000 Doutorados
Instituições-Chave: Sociedade Max Planck, Associação Leibniz, Associação Helmholtz
Financiamento Inicial: 5 anos pela DFG
Desafio Técnico Central: Federar sistemas operacionais heterogéneos e pré-existentes com intrusão mínima.

2. Infraestrutura de Computação Federada Heterogénea (Compute4PUNCH)

O conceito Compute4PUNCH aborda o desafio de fornecer acesso sem interrupções a um mosaico de recursos de computação fornecidos pela comunidade, com diferentes arquiteturas, sistemas operativos, pilhas de software e sistemas de autenticação.

2.1 Arquitetura Central & Desafio de Integração

O princípio de design fundamental é criar um sistema de lote em sobreposição que se situa sobre os conjuntos de recursos existentes. Esta abordagem minimiza as alterações obrigatórias para os fornecedores de recursos, um requisito crítico, uma vez que estes recursos já são partilhados e operacionais. A heterogeneidade é gerida não pela homogeneização da infraestrutura subjacente, mas pela construção de uma camada de abstração inteligente por cima.

2.2 Tecnologias-Chave: HTCondor, COBalD/TARDIS, CVMFS

HTCondor: Funciona como o sistema de lote federado em sobreposição, gerindo a submissão, agendamento e execução de tarefas através dos recursos distribuídos.
COBalD/TARDIS: Atua como o meta-agendador de recursos. Descobre e integra dinamicamente recursos no conjunto HTCondor, tornando a federação adaptativa e transparente. Os "pilotos" TARDIS reivindicam slots em recursos remotos, permitindo que as tarefas HTCondor sejam executadas.
CERN Virtual Machine File System (CVMFS): Resolve o problema do ambiente de software. Distribui um repositório de software escalável, só de leitura e em cache para todos os nós de trabalho, garantindo ambientes de aplicação consistentes sem instalações locais.
Tecnologias de Contentores: Utilizadas em conjunto com o CVMFS para encapsular dependências complexas e fornecer ambientes de execução isolados e reproduzíveis.

2.3 Acesso do Utilizador: JupyterHub & AAI Baseado em Tokens

Os pontos de entrada do utilizador são concebidos para facilitar a utilização:

JupyterHub: Fornece uma interface de computação interativa baseada na web, ideal para análise exploratória e prototipagem.
Nós de Login Tradicionais: Servem utilizadores com fluxos de trabalho estabelecidos na linha de comandos.
Infraestrutura de Autenticação e Autorização Baseada em Tokens (AAI): Fornece um método padronizado e seguro para aceder a recursos de computação e armazenamento além das fronteiras institucionais, uma pedra angular para a federação.

3. Infraestrutura de Armazenamento Federada (Storage4PUNCH)

Paralelamente à computação, os recursos de armazenamento são federados para fornecer uma camada de acesso a dados unificada.

3.1 Federação de Armazenamento com dCache & XRootD

A paisagem de armazenamento é composta principalmente por sistemas que utilizam tecnologias dCache ou XRootD, ambas bem estabelecidas na Física de Altas Energias (HEP). O Storage4PUNCH emprega métodos de federação comprovados na comunidade HEP mais ampla para criar um espaço de nomes comum e um protocolo de acesso, permitindo que os dados sejam localizados e recuperados de forma transparente a partir de qualquer elemento de armazenamento participante.

3.2 Cache e Integração de Metadados

O projeto está a avaliar tecnologias existentes para:

Cache: Para reduzir a latência e o tráfego da rede de longa distância, mantendo os dados acedidos frequentemente mais próximos dos recursos de computação.
Gestão de Metadados: Visando uma integração mais profunda para permitir a descoberta e gestão eficiente de dados com base em atributos de ficheiros, e não apenas na localização.

Isto move a federação para além do simples acesso a dados, rumo a uma gestão inteligente de dados.

4. Implementação Técnica & Estado do Protótipo

Os conceitos estão em desenvolvimento ativo. Foram estabelecidos protótipos que integram conjuntos iniciais de recursos de computação e armazenamento. A contribuição menciona "primeiras experiências com aplicações científicas a serem executadas nos protótipos disponíveis", indicando que os fluxos de trabalho dos primeiros utilizadores estão a ser testados para validar a arquitetura e identificar obstáculos práticos. O ambiente combinado está preparado para permitir que os investigadores executem tarefas de análise exigentes em recursos através da infraestrutura federada.

5. Perspetiva Central & Análise

Perspetiva Central

O PUNCH4NFDI não está a construir um novo supercomputador; está a conceber uma camada de federação para a heterogeneidade administrativa e política. A verdadeira inovação é a restrição pragmática de "intrusão mínima" nos sistemas existentes. Este não é um design de raiz como os clusters Borg ou Omega da Google, mas uma sobreposição diplomática e técnica para recursos soberanos e legados. O seu sucesso depende menos da novidade técnica bruta e mais da governação e adoção—uma lição ecoada nas lutas e sucessos da European Open Science Cloud (EOSC).

Fluxo Lógico

A lógica é elegantemente recursiva: 1) Aceitar a heterogeneidade como uma restrição de primeira ordem, 2) Utilizar "cola" madura e testada pela comunidade (HTCondor, dCache) para construir a sobreposição, 3) Confiar na entrega declarativa de ambientes (CVMFS/contentores) para desacoplar o software da infraestrutura, e 4) Fornecer pontos de entrada simples e modernos (JupyterHub) para ocultar a complexidade subjacente. Este fluxo prioriza a viabilidade da federação em detrimento do desempenho local ótimo, uma troca necessária para a colaboração interinstitucional.

Pontos Fortes & Fraquezas

Pontos Fortes: A utilização de middleware HEP testado em batalha (HTCondor, XRootD) reduz drasticamente o risco técnico. O modelo de sobreposição é politicamente astuto, baixando as barreiras à entrada para os fornecedores de recursos. O CVMFS é um golpe de mestre para a portabilidade do software, um ponto de dor crónico em ambientes heterogéneos.

Fraquezas & Riscos: O meta-agendador (COBalD/TARDIS) adiciona uma camada de complexidade e potenciais pontos únicos de falha. A previsibilidade do desempenho sofrerá em comparação com sistemas dedicados e homogéneos—a latência da rede e a contenção de recursos tornam-se fatores imprevisíveis. O documento é omisso quanto a modelos de custos e sustentabilidade para além dos 5 anos de financiamento da DFG, uma grande bandeira vermelha para a viabilidade a longo prazo, como visto noutros projetos de e-infraestrutura que estagnaram após a fase piloto.

Perspetivas Acionáveis

Para outros consórcios: Copiem o modelo de governação, não apenas a pilha tecnológica. Comecem com uma AAI leve e um único caso de utilização convincente. Para o próprio PUNCH4NFDI: Publiquem imediatamente dados de benchmark comparando o débito de tarefas federadas vs. locais e a latência de acesso a dados. Desenvolvam um modelo claro, escalonado, de adesão e partilha de custos para a fase pós-financiamento. Explorem a integração com o cloud bursting comercial (AWS, GCP) através da mesma sobreposição para lidar com a procura de pico, seguindo o caminho de projetos como a experiência CMS na AWS.

6. Detalhes Técnicos & Enquadramento Matemático

O problema de agendamento de recursos numa tal federação pode ser abstraído. Seja $R = \{r_1, r_2, ..., r_n\}$ o conjunto de recursos heterogéneos, cada um com propriedades dinâmicas como núcleos disponíveis $C_i(t)$, memória $M_i(t)$ e hardware especializado (por exemplo, GPUs). Seja $J = \{j_1, j_2, ..., j_m\}$ o conjunto de tarefas com requisitos $\text{req}(j_k)$.

O objetivo do meta-agendador é uma função de mapeamento $\mathcal{M}: J \rightarrow R$ que maximiza uma função de utilidade $U$, frequentemente uma soma ponderada de eficiência e justiça, respeitando as restrições:

$$ \text{Maximizar } U = \alpha \cdot \text{Utilização} + \beta \cdot \text{Justiça} - \gamma \cdot \text{Custo}_{\text{movimentação-dados}} $$ $$ \text{sujeito a: } \forall r_i, \sum_{j_k \in \mathcal{M}^{-1}(r_i)} \text{req}_{\text{núcleos}}(j_k) \leq C_i(t) $$

O termo Custo_{movimentação-dados} é crítico num ambiente de armazenamento federado, penalizando os agendamentos que exigem a movimentação de grandes conjuntos de dados através de redes de longa distância. Isto torna o problema distinto do agendamento clássico de clusters.

A AAI baseada em tokens pode ser modelada como um sistema de controlo de acesso baseado em capacidades. Um token $\tau$ emitido para o utilizador $u$ para o recurso $r$ é uma declaração assinada criptograficamente: $\tau = \text{Sign}_{\text{AAI}}(u, r, \text{âmbito}, \text{validade})$. Isto descentraliza as decisões de autorização para os fornecedores de recursos, que só precisam de validar a assinatura do token.

7. Resultados Experimentais & Desempenho do Protótipo

Embora o PDF não inclua resultados quantitativos específicos, as "primeiras experiências com aplicações científicas" mencionadas implicam testes iniciais de integração. Podemos conceptualizar os indicadores-chave de desempenho (KPIs) que devem ser medidos:

Gráfico Conceptual de Desempenho: Execução Federada vs. Local de Tarefas

Tipo de Gráfico: Gráfico de linhas com eixo duplo.

Eixo X: Tempo (cronograma do projeto ou lotes consecutivos de tarefas).

Eixo Y Esquerdo (Barras): Taxa de Sucesso de Tarefas (%). Mostraria a percentagem de tarefas que são concluídas com sucesso quando submetidas ao sistema federado versus um cluster local estável. As fases iniciais do protótipo provavelmente mostrariam uma taxa de sucesso federada mais baixa devido a problemas de integração (falhas de autenticação, incompatibilidades de ambiente de software, problemas de rede), convergindo ao longo do tempo.

Eixo Y Direito (Linhas): Tempo Médio de Conclusão de Tarefas (horas). Esta métrica seria tipicamente mais elevada para o sistema federado devido à sobrecarga adicional de agendamento, latência de preparação de dados e potencial fila de espera em múltiplos backends independentes. O objetivo é minimizar esta diferença. O gráfico visualizaria a troca entre o aumento do acesso a recursos (execução bem-sucedida de mais/maiores tarefas) e a penalização de tempo paga pela federação.

Perspetiva-Chave do Gráfico: O valor da federação não está em superar o desempenho local, mas em permitir cargas de trabalho que de outra forma seriam impossíveis devido a restrições de recursos locais, mesmo que demorem mais tempo. O declive da linha do tempo de conclusão federada a diminuir ao longo do tempo indica a maturação da otimização no meta-agendador.

8. Enquadramento de Análise: Exemplo Conceptual de Fluxo de Trabalho

Uma vez que o PDF não inclui código, aqui está uma descrição conceptual de fluxo de trabalho baseada em YAML que um investigador poderia usar para definir uma tarefa de análise para a federação Compute4PUNCH/Storage4PUNCH. Isto destaca a natureza declarativa do sistema visado.

# punch_analysis_workflow.yaml
workflow:
  name: "punch4nfdi_federated_analysis"
  user: "researcher@uni-example.de"
  aai_token: "${PUNCH_AAI_TOKEN}"  # Injetado a partir do ambiente

compute:
  requirements:
    cores: 8
    memory: "32GB"
    runtime: "48h"
    software_stack: "punchenv/analysis-suite:latest"  # Resolvido via CVMFS/Contentor
    priority: "medium"

storage:
  input_data:
    - protocol: "root"
      path: "root://storage-a.punch.de//experiment/run2023/data_*.root"
      cache_prefetch: true  # Sugestão para a camada de cache do Storage4PUNCH
  output_data:
    - protocol: "s3"
      endpoint: "https://object-store.punch.de"
      path: "/results/${WORKFLOW_ID}/histograms.root"

execution:
  entry_point: "jupyterlab"  # Opcional: Iniciar sessão interativa
  # OU
  batch_command: "python /analysis/run_full_chain.py --input ${INPUT_PATH} --output ${OUTPUT_PATH}"

provenance:
  log_level: "detailed"
  export_metadata_to: "meta.punch.de/catalog"

Esta especificação fictícia mostra como um utilizador declara o que precisa (recursos, software, dados) sem especificar onde é executado. O middleware da federação (HTCondor, TARDIS, federação de armazenamento) interpreta esta especificação, encontra recursos adequados, prepara os dados, injeta o ambiente de software e executa a tarefa, reportando registos e saída para as localizações especificadas.

9. Aplicações Futuras & Roteiro de Desenvolvimento

A infraestrutura PUNCH4NFDI estabelece uma base para várias aplicações avançadas:

Análise Astrofísica Multi-Mensageira/Inter-Experiência: Combinar perfeitamente dados de detetores de partículas, telescópios e observatórios de ondas gravitacionais num único fluxo de trabalho de análise, aproveitando diferentes recursos de computação especializados (fazendas de GPU para análise de imagem, HTC para processamento de eventos de partículas).
Treino de Modelos AI/ML à Escala: O conjunto de recursos federado pode provisionar dinamicamente clusters grandes e efémeros para treinar modelos complexos em conjuntos de dados distribuídos sem centralizar os dados, alinhando-se com os paradigmas de aprendizagem federada.
Exploração e Visualização Interativa de Dados: Acoplar a interface JupyterHub com backends de visualização remota de alto desempenho e acelerados por GPU para dados de simulação em larga escala.
Integração com e-Infraestruturas Externas: A arquitetura de sobreposição é conceptualmente compatível com a ligação a recursos à escala europeia, como a European Open Science Cloud (EOSC) ou sistemas HPC PRACE, atuando como uma porta de entrada alemã.

Prioridades do Roteiro de Desenvolvimento:

Robustez & Produção: Passar do protótipo para um serviço fiável 24/7 com SLAs.
Colocação Inteligente de Dados: Melhorar o meta-agendador com consciência da localidade dos dados para minimizar $\text{Custo}_{\text{movimentação-dados}}$.
Catálogo de Metadados Avançado: Implementar um sistema de metadados poderoso e pesquisável sobre o Storage4PUNCH para permitir a descoberta de dados com base em propriedades físicas.
Métricas de Computação Verde: Integrar ferramentas para monitorizar e otimizar a eficiência energética em todos os recursos federados, uma preocupação crescente para a computação em larga escala.

10. Referências

Consórcio PUNCH4NFDI. (2024). "PUNCH4NFDI - Particles, Universe, NuClei and Hadrons for the NFDI." Sítio Web Oficial. https://www.punch4nfdi.de/
Thain, D., Tannenbaum, T., & Livny, M. (2005). "Distributed computing in practice: the Condor experience." Concurrency and Computation: Practice and Experience, 17(2-4), 323-356. (O artigo fundamental sobre HTCondor).
Blomer, J., et al. (2011). "The CernVM File System: A scalable, read-only, software distribution service." Journal of Physics: Conference Series, 331(5), 052004. (Detalhes sobre CVMFS).
Comissão Europeia. (2024). "European Open Science Cloud (EOSC)." https://eosc-portal.eu/ (Para comparação sobre desafios de federação à escala da UE).
Verma, A., et al. (2015). "Large-scale cluster management at Google with Borg." Proceedings of the European Conference on Computer Systems (EuroSys). (Contrasta a gestão de clusters de raiz com sobreposições de federação).
Colaboração CMS. (2021). "CMS Computing Operations in the AWS Cloud." EPJ Web of Conferences, 251, 02006. (Exemplo de modelo híbrido cloud/federação).
Princípios FAIR para Dados. (2016). FORCE11. https://www.go-fair.org/fair-principles/ (Os princípios orientadores para a plataforma de dados PUNCH).