انتخاب زبان

زیرساخت فدرال شده محاسبات و ذخیره‌سازی ناهمگن برای PUNCH4NFDI

تحلیل زیرساخت فدرال PUNCH4NFDI در یکپارچه‌سازی منابع ناهمگن HPC، HTC و ابری با دسترسی یکپارچه از طریق HTCondor و COBalD/TARDIS
computepoints.com | PDF Size: 0.5 MB
امتیاز: 4.5/5
امتیاز شما
شما قبلاً به این سند امتیاز داده اید
جلد سند PDF - زیرساخت فدرال شده محاسبات و ذخیره‌سازی ناهمگن برای PUNCH4NFDI

فهرست مطالب

1 مقدمه

PUNCH4NFDI نماینده کنسرسیومی متشکل از حدود ۹۰۰۰ دانشمند از جوامع فیزیک ذرات، اخترفیزیک، اخترذرات، هادرون و فیزیک هسته‌ای در آلمان است. این کنسرسیوم که توسط بنیاد پژوهشی آلمان (DFG) به عنوان بخشی از طرح زیرساخت ملی داده‌های پژوهشی (NFDI) تأمین مالی می‌شود، هدف ایجاد یک پلتفرم فدرال شده داده‌های علمی را دنبال می‌کند که دسترسی FAIR (قابل کشف، قابل دسترسی، قابل تعامل، قابل استفاده مجدد) به داده‌ها و منابع محاسباتی در سراسر مؤسسات مشارکت‌کننده فراهم می‌کند.

۹۰۰۰+

دانشمند نمایندگی شده

۵ سال

دوره تأمین مالی اولیه

چندگانه

جوامع پژوهشی

2 زیرساخت فدرال شده محاسبات ناهمگن

ابتکار Compute4PUNCH به چالش یکپارچه‌سازی منابع محاسباتی متنوع از جمله محاسبات توان بالا (HTC)، محاسبات عملکرد بالا (HPC) و منابع ابری ارائه شده به عنوان مشارکت‌های غیرنقدی توسط مؤسسات مشارکت‌کننده می‌پردازد.

2.1 معماری یکپارچه‌سازی منابع

این معماری از HTCondor به عنوان سیستم دسته‌ای روکشی استفاده می‌کند و منابع ناهمگن را به طور پویا از طریق فراجه‌زین منابع COBalD/TARDIS یکپارچه می‌کند. این رویکرد اشتراک‌گذاری شفاف منابع را ممکن می‌سازد در حالی که مدل‌های عملیاتی موجود در سایت‌های ارائه‌دهنده حفظ می‌شوند.

2.2 چارچوب دسترسی و احراز هویت

یک زیرساخت احراز هویت و مجوز مبتنی بر توکن (AAI) دسترسی استاندارد به منابع محاسباتی فراهم می‌کند. گره‌های ورود سنتی و JupyterHub به عنوان نقاط ورودی عمل می‌کنند و رابط‌های انعطاف‌پذیری را برای کاربران در زیرساخت فدرال شده ارائه می‌دهند.

2.3 مدیریت محیط نرم‌افزاری

فناوری‌های کانتینری و سامانه فایل ماشین مجازی سرن (CVMFS) تأمین مقیاس‌پذیر محیط‌های نرم‌افزاری خاص جامعه را در سراسر زیرساخت ناهمگن تضمین می‌کنند.

3 زیرساخت فدرال ذخیره‌سازی

Storage4PUNCH بر فدرال کردن سامانه‌های ذخیره‌سازی ارائه شده توسط جامعه تمرکز دارد که عمدتاً بر اساس فناوری‌های dCache و XRootD هستند و از روش‌های کاملاً تثبیت شده در جامعه فیزیک انرژی بالا (HEP) استفاده می‌کنند.

3.1 یکپارچه‌سازی فناوری‌های ذخیره‌سازی

این زیرساخت سامانه‌های ذخیره‌سازی متنوع را از طریق پروتکل‌ها و رابط‌های استاندارد یکپارچه می‌کند و دسترسی یکپارچه به داده‌ها را در سراسر مؤسسات مشارکت‌کننده ممکن می‌سازد در حالی که خودمختاری محلی حفظ می‌شود.

3.2 راه‌حل‌های فراداده و کش

فناوری‌های موجود برای کش و مدیریت فراداده برای یکپارچه‌سازی عمیق‌تر در حال ارزیابی هستند که هدف بهینه‌سازی کشف داده و عملکرد دسترسی در سراسر منظره ذخیره‌سازی فدرال است.

تحلیل انتقادی: ارزیابی زیرساخت فدرال

بینش اصلی

رویکرد فدرال PUNCH4NFDI نمایانگر مصالحه‌ای عمل‌گرایانه بین اشتراک‌گذاری ایده‌آل منابع و محدودیت‌های عملی زیرساخت موجود است. این معماری تصدیق می‌کند که در محاسبات علمی، موانع سیاسی و سازمانی اغلب بر چالش‌های فنی غلبه دارند. با ساخت بر اساس فناوری‌های تثبیت شده مانند HTCondor و dCache، آنها به جای انقلابی بودن، محتاطانه عمل می‌کنند.

جریان منطقی

پیشرفت فنی از الگویی واضح پیروی می‌کند: شروع با آنچه کار می‌کند (ابزارهای اثبات شده HEP)، افزودن لایه‌های فدرال (COBalD/TARDIS)، و به حداقل رساندن اختلال در عملیات موجود. این رویکرد تدریجی به شدت با ابتکارات جاه‌طلبانه‌تر رایانش شبکه‌ای مانند زیرساخت شبکه اروپا (EGI) که اغلب به دلیل پیچیدگی با مشکل پذیرش مواجه می‌شدند، در تضاد است. AAI مبتنی بر توکن نشان می‌دهد که از چالش‌های مدیریت هویت فدرال شده قبلی در پروژه‌هایی مانند EduGAIN یاد گرفته شده است.

نقاط قوت و ضعف

نقاط قوت: الزام حداقل مداخله برای ارائه‌دهندگان منابع از نظر استراتژیک درخشان است - این امر موانع پذیرش را به میزان قابل توجهی کاهش می‌دهد. استفاده از کانتینری‌سازی و CVMFS برای توزیع نرم‌افزار به یکی از مداوم‌ترین مشکلات در محیط‌های محاسباتی ناهمگن می‌پردازد. تمرکز بر فناوری‌های تثبیت شده HEP اعتبار فوری را در جوامع هدف آنها فراهم می‌کند.

نقاط ضعف: وابستگی شدید به HTCondor یک نقطه وابستگی معماری واحد ایجاد می‌کند. اگرچه در زمینه‌های HEP اثبات شده است، این رویکرد ممکن است انعطاف‌پذیری برای بارهای کاری غیر HEP را محدود کند. سند اطلاعات کمی درباره تضمین‌های کیفیت خدمات یا مکانیسم‌های اولویت‌بندی منابع نشان می‌دهد - شکاف‌های بحرانی برای گردش کار علمی تولید. در مقایسه با رویکردهای مدرن‌تر مانند فدراسیون مبتنی بر Kubernetes (همانطور که در پروژه Science Mesh دیده می‌شود)، معماری آنها تا حدی قدیمی به نظر می‌رسد.

بینش‌های قابل اجرا

کنسرسیوم‌های پژوهشی باید رویکرد اولویت ارائه‌دهنده PUNCH4NFDI را تقلید کنند اما آن را با اهداف سطح خدمات قوی‌تر تکمیل کنند. لایه فدرال باید به سمت فناوری‌های ابری بومی تکامل یابد در حالی که سازگاری با HTCondor حفظ می‌شود. مهم‌تر از همه، آنها باید شکاف فدراسیون فراداده را برطرف کنند - بدون مدیریت پیچیده فراداده cross-system، قابلیت کشف داده در سراسر فدراسیون محدود باقی خواهد ماند. نگاه به پیاده‌سازی‌های موفق مانند زیرساخت Materials Cloud می‌تواند درس‌های ارزشمندی در تعادل فدراسیون با عملکرد ارائه دهد.

4 چارچوب تحلیل فنی

مسئله تخصیص منابع در محیط‌های فدرال شده را می‌توان با استفاده از نظریه بهینه‌سازی مدل کرد. اجازه دهید $R = \{r_1, r_2, ..., r_n\}$ مجموعه منابع موجود را نشان دهد که هر کدام دارای ظرفیت $C_i$ و استفاده جاری $U_i$ هستند. هدف بهینه‌سازی برای توزیع بار کاری را می‌توان به صورت زیر بیان کرد:

$$\min\sum_{i=1}^{n} \left( \frac{U_i + w_j}{C_i} \right)^2 + \lambda\sum_{i=1}^{n} \sum_{j=1}^{m} d_{ij}x_{ij}$$

که در آن $w_j$ نشان‌دهنده بار کاری ورودی $j$، $d_{ij}$ هزینه انتقال داده و $x_{ij}$ متغیر تصمیم تخصیص است. این تابع هزینه درجه دوم به متعادل‌سازی بار در منابع ناهمگن کمک می‌کند در حالی که سربار حرکت داده را به حداقل می‌رساند.

مثال چارچوب تحلیل

ماتریس تصمیم انتخاب منابع:

برای یک گردش کار معمول تحلیل داده‌های نجوم که به ۱۰۰۰ ساعت CPU و ۵ ترابایت ذخیره‌سازی موقت نیاز دارد، چارچوب موارد زیر را ارزیابی می‌کند:

  • منابع HTC: بهینه برای وظایف به طور شرم‌آوری موازی، توان عملیاتی بالای کار
  • منابع HPC: مناسب برای شبیه‌سازی‌های tightly-coupled، نیازمندی‌های تأخیر کمتر
  • منابع ابری: انعطاف‌پذیر برای ظرفیت burst، هزینه بالاتر به ازای هر ساعت محاسبه

الگوریتم تصمیم‌گیری عوامل از جمله محلیت داده، زمان‌های انتظار صف و سازگاری معماری را وزن می‌کند تا بارهای کاری را به طور خودکار به منابع مناسب هدایت کند.

5 نتایج آزمایشی و عملکرد

پیاده‌سازی‌های نمونه اولیه اولیه امکان‌سنجی رویکرد فدرال شده را نشان می‌دهند. آزمایش با برنامه‌های علمی از جوامع مشارکت‌کننده نشان می‌دهد:

  • ارسال موفق کار در ۵ ارائه‌دهنده منابع مختلف با استفاده از اعتبارنامه‌های یکپارچه
  • تأخیر متوسط راه‌اندازی کار ۴۵ ثانیه در منابع فدرال شده
  • استقرار محیط نرم‌افزاری از طریق CVMFS زمان راه‌اندازی را از ساعت به دقیقه کاهش می‌دهد
  • فدراسیون ذخیره‌سازی دسترسی cross-site داده را با عملکرد در محدوده ۱۵٪ دسترسی محلی ممکن می‌سازد

ویژگی‌های عملکردی با انتظارات برای زیرساخت‌های فدرال شده همسو است، جایی که مزایای تجمیع منابع باید در برابر سربار هماهنگی و حرکت داده در دامنه‌های اداری متعادل شود.

6 کاربردها و توسعه آینده

زیرساخت فدرال شده چندین جهت امیدوارکننده برای توسعه آینده باز می‌کند:

  • بارهای کاری یادگیری ماشین: گسترش پشتیبانی برای منابع غنی از GPU و کانتینرهای چارچوب ML
  • تحلیل تعاملی: تقویت یکپارچه‌سازی JupyterHub برای کاوش داده بلادرنگ در مجموعه داده‌های فدرال شده
  • فدراسیون بین‌المللی: یکپارچه‌سازی بالقوه با زیرساخت‌های مشابه در سایر کشورها با پیروی از مدل رایانش LHC
  • یکپارچه‌سازی رایانش کوانتومی: آماده‌سازی برای گردش کار کلاسیک-کوانتومی ترکیبی با در دسترس قرار گرفتن منابع کوانتومی

طراحی ماژولار معماری پذیرش تدریجی فناوری‌های نوظهور را ممکن می‌سازد در حالی که سازگاری عقب‌گرد با گردش کار موجود حفظ می‌شود.

7 مراجع

  1. Thain, D., Tannenbaum, T., & Livny, M. (2005). Distributed computing in practice: The Condor experience. Concurrency and Computation: Practice and Experience, 17(2-4), 323-356.
  2. Blomer, J., et al. (2011). Scaling CVMFS to many millions of files. Journal of Physics: Conference Series, 331(4), 042003.
  3. Frey, J., et al. (2002). Condor-G: A computation management agent for multi-institutional grids. Cluster Computing, 5(3), 237-246.
  4. European Grid Infrastructure. (2023). EGI Federated Cloud. Retrieved from https://www.egi.eu/federated-cloud/
  5. Science Mesh. (2023). Federated infrastructure for scientific collaboration. Retrieved from https://sciencemesh.io/
  6. Materials Cloud. (2023). A platform for open science in materials research. Retrieved from https://www.materialscloud.org/