اخبار انتخاب سردبیر مرکزداده مطالب ویژه نقد و بررسی

سیستم‌های ماژولار: تکامل در قابلیت اطمینان

ماژولاریتی، تکنیکی برای سازمان‌دهی و ساده‌سازی یک سیستم پیچیده به شمار می‌رود. از سیستم‌های ابتدایی (همچون باتری چراغ قوه) گرفته تا سیستم‌های پیچیده(سلول‌های یک ارگانیسم)، ماژولاریتی سابقه‌ی چشمگیری داشته که ویژگی های دیگر به راحتی قادر به برابری با آن نیستند. با این حال، ممکن است در سیستم‌های ساخته‌ی دست بشر که در آستانه‌ی تحول از طراحی monolithic یا به اصطلاح “یک تکه ای” به طراحی ماژولار بوده، تردیدهایی بروز کرده یا آن که ترویج کامل ماژولاریتی و بهره‌مندی از مزایای اثبات شده‌ی آن، شروعی آهسته داشته و زمان‌بر باشد.

زیرساخت‌های فیزیکی مرکز داده (DCPI) نیز در مسیر این تحول قرار می‌گیرد. در عین حال که ویژگی‌های معماری قطعات ساخت که به لحاظ فیزیکی واضح و روشن بوده –توسعه‌پذیری، انعطاف‌پذیری، سادگی، قابلیت حمل- به راحتی درک و شناخته شده و موضوع بحث جدی قرار ندارد، اما یکی از ویژگی‌های طراحی ماژولار، در این صنعت موضوع بحث و جدل‌های بسیاری بوده است و آن ویژگی، قابلیت اطمینان است.

با انجام تحلیل‌های ساده و کلاسیک قابلیت اطمینان بر این روش جدید اجرا(قطعات بیشتر به معنی ریسک بالاتری از خرابی است)، در بهترین حالت تحلیل ناقصی ارائه شده و در بدترین حالت، گمراه‌کننده خواهد بود. هدف اصلی این مقاله آنست تا با بررسی نمونه‌های موردی، نشان دهد که ماژولاریتی نه تنها می‌تواند مزایای ملموس‌تر و شناخته‌شده‌تر خود را نمایان سازد، بلکه دیگر مزیت عمیق‌تر و نامحسوس‌تر آن در زمینه‌ی قابلیت اطمینان که دانش کمتری در مورد آن وجود داشته، را نیز آشکار می‌سازد. این مزیت چیزی نیست جز: تحمل خطا! طراحی ماژولار به طور ذاتی دارای قابلیت تحمل خطا بوده که مقاومتی جدید و قدرتمند در برابر خطا ایجاد کرده و در سیستم‌های پیچیده یک استراتژی برای قابلیت اطمینان ایجاد کرده که ناکافی اما سودمند است.

نمونه موردی طبیعت: زندگی انسان‌های اولیه

 پیشینه‌ی ماژولاریتی به زمانی بسیار قبل‌تر از پیدایش مرکز داده و باتری چراغ قوه باز می‌گردد. سیستم‌های بسیار قدیمی غیرماژولار – مانند ارگانیسم‌های تک سلولی- حدودا سه میلیارد سال پیش روی زمین زندگی می‌کردند. فسیل‌های باقیمانده از این ارگانیسم‌ها نسان داده که به مرور زمان، این جانداران پوسته، شاخک، دهان، دست، پنجه و دیگر ساختارهای پیچیده را در خود گسترش داده‌اند. بعضی از این جانداران، تا ابعاد قابل توجهی، در حدود 15 سانتی‌متر رشد کرده‌اند. این طراحی‌های پیچیده‌ی تک‌سلولی برای میلیاردها سال، جز اصلی زنجیره‌ی غذا در زمین بوده‌اند.

سپس، در حدود 500 میلیون سال پیش، ارگانیسم‌های چند سلولی به وجود آمدند. در طول ده‌ها میلیون سال، این جانداران به سرعت تکامل یافته و از تکامل سه میلیارد ساله‌ی تک‌سلولی‌های پیچیده، نیز پیش افتادند تا آن که در این طراحی، جایگزین تک‌سلولی‌ها شدند.

شکل 1: زندگی ابتدایی تک‌سلولی‌های پیچیده
شکل 1: زندگی ابتدایی تک‌سلولی‌های پیچیده

مزیت ماژولار برای ارگانیسم‌های چند سلولی

چرا طراحی ماژولار چندسلولی بر طراحی یک تکه ای آغازین اولویت یافت؟

  • توانایی رشد و توسعه‌پذیری: رشد و توسعه‌ی سیستم، چه در ابعاد و چه در ایجاد قابلیت‌های جدید، به سادگی با افزودن ماژول‌های (سلول‌ها) جدیدی که در تعامل با ماژول‌های فعلی و با استفاده از رابط‌های استاندارد عمل می‌کنند، امکان‌پذیر است.
  • فرایند ساده‌ی تکثیر: تکثیر تعدادی سلول‌هایی کوچک‌تر با پیچیدگی کمتر، راحت‌تر، سریع‌تر و قابل اطمینان‌تر از تکثیر یک سلول پیچیده است.
  • توانایی تخصصی ساختن کارکرد ماژول‌ها: با تخصصی سازی وظایف هر سلول، می‌توان به همان میزان بهره‌وری و اثربخشی حاصل از کار تیمی، دست یافت. در جانداران اولیه‌ی چندسلولی، یک نوع سلول با هدف حرکت، دیگری برای حفاظت طراحی می‌شد. سلولی دیگر تشخیص و تامین غذا را بر عهده داشته و این روند ادامه می‌یافت.
  • انطباق‌ سریع با محیط: با افزودن، حذف یا تغییر سلول، تغییرات مستمر طراحی را می توان سریع تر آزموده و در نهایت، آن را پذیرفته و سلول را با آن تطبیق داد یا به کل آن را رد کرد.
  • تحمل خطا: با کمک افزونگی سلولی، هر سلول می‌تواند بدون به خطر انداختن سیستم، از کار بیفتد، که در نتیجه بدون توقف سیستم (که در اینجا به ناتوانی یا مرگ منجر شده)، ترمیم همزمان سلول امکان‌پذیر خواهد بود.
شکل 2زندگی اولیه‌ی چند سلولی‌ها
شکل 2زندگی اولیه‌ی چند سلولی‌ها

آخرین ویژگی مطرح شده یا همان تحمل خطا، یکی از مزیت‌های کلیدی حاصل از قابلیت اطمینان در سیستم‌های ماژولار در مقایسه با سیستم‌های یک تکه محسوب می‌شود.

با ماژولاریتی می‌توان یک سیستم را در قالب قسمت‌های کوچک‌تر تقسیم‌بندی کرده و از این طریق، افزونگی اجزای هر قسمت را تسهیل ساخته که در اثر نقص یا خرابی یک یا حتی چند جز، لزوما تمام عملکرد سیستم تحت تاثیر قرار نگیرد. پوست انسان با یک خراش کوچک صدها سلول را از دست می‌دهد اما بدن با چنین امری، از پای در نمی‌آید. در حین ترمیم این سلول‌های آسیب دیده، دیگر سلول‌ها به عملکرد خود ادامه می‌دهند. ما انسان‌ها ماژولاریتی را ابداع نکردیم، بلکه بدن ما خود سیستمی ماژولار است و به عبارتی ما خود ماژولاریتی هستیم. با میلیاردها ماژول (سلول) موجود در هر فرد، هر انسانی هر روز از زندگی خود از مزایای تحمل خطا بهره‌مند می‌شود.

نمونه‌ی موردی فاوا: درایورهای دیسک

زمانی که مراکز داده هنوز از mainframeها استفاده می‌کردند، تجهیزات ذخیره‌سازی شامل هارد درایوهای بزرگ اختصاصی با انبوهی از نوارهای 14 اینچی بود که با مکانیسم read/write  طراحی شده و ابعادی در حدود ماشین‌های لباسشویی داشت. در سال 1978، شرکت IBM ایده‌ی جدیدی در زمینه‌ی استفاده از چیدمانی از دیسک‌های کوچک‌تر را به نام خود ثبت کرد اما این ایده را بیش از این، پیش نبرد زیرا تصور نمی‌شد این ایده، بتواند به اندازه‌ی طراحی‌های سنتی یک تکه­ای قابل اطمینان باشد. بررسی‌ها و اقدامات اجرایی در زمینه‌ی تحمل خطا، در مراحل ابتدایی خود بود و تنها به صنعت هوا فضا محدود می‌شد که خرابی اجزای سیستم‌های الکترونیکی به حیات افراد وابسته بود.[1]

در سال 1987، پژوهشگران برکلی متوجه شدند میان سرعت رایانش و سرعت دسترسی به داده‌های ذخیره شده، فاصله‌ی محسوسی وجود داشته و  پیدایش درایورهای خارجی دیسک‌ها در کامپیوترهای شخصی به فرصتی تبدیل شد تا از این درایورها به عنوان قطعاتی در سیستمی با انتقال سریع‌تر داده استفاده شود. یک سال بعد، مقاله‌ای چشمگیر تحت عنوان “نمونه‌ای از آرایه چندگانه دیسک‌های مستقل (RAID)” ارائه دادند. هدف اصلی آرایه چندگانه‌ی دیسک‌های مستقل که اصطلاحا RAID[2] نامیده می‌شوند، پیوند دادن چند دیسک سخت جداگانه در چهارچوب یک آرایه (array) ، برای دستیابی به کارایی، پایایی و گنجایشی بیش از یک دیسک بزرگ و گران می‌باشد.

در این مقاله طرح‌های بسیاری برای ثبت و ذخیره‌ی داده‌ها (“سطوح RAID”) ارائه شده که می‌توانند در چنین چیدمانی برای ذخیره، تغییر و بازیابی داده‌ها مورد استفاده قرار گیرند.

در سال 1990، با استفاده از دیسک‌ها 5.25 اینچی صنعت کامپیوتر‌های شخصی، تجهیزات و نظریات هر دو با هم ترکیب شده و در نهایت، پس از تکامل و توسعه، به حدی رسید که ظرفیت، عملکرد و قابلیت اطمینان مورد نیاز برای استفاده در در اولین چیدمان‌های RAID را داشته باشند. این دستگاه‌های جدید ذخیره‌ساز ماژولار امکان انتخاب در مصالحه‌های میان افزونگی و سرعت read/write را فراهم کرده و  با جایگزینی به جای دستگاه‌های ذخیره‌ساز mainframeها، تنها بخشی از فضای اشغال شده‌ی پیشین را به خود اختصاص می‌دهند.

شکل 3: آرایه RAID
شکل 3: آرایه RAID

مزیت ماژولار در آرایه‌های RAID

چرا آرایه‌های ماژولار RAID بر دستگاه‌های ذخیره‌ساز سنتی یک تکه‌ای برتری یافتند؟

  • توانایی توسعه و رشد: ظرفیت ذخیره‌سازی را می‌توان به راحتی با افزایش تعداد ماژول‌های هر آرایه یا با افزودن بر تعداد آرایه‌ها، افزایش داد.
  • فرایند ساده‌ی تکثیر: ساخت تعداد زیادی درایو کوچک که به عنوان ماژول‌های RAID عمل کرده بسیار ساده‌تر از ساخت درایوهای بزرگ و پیچیده‌ی سنتی است.
  • توانایی تخصصی‌سازی کارکرد ماژول‌ها: هر یک از درایو‌ها در آرایه را می‌توان بسته به سطح RAID تعریف شده برای آرایه، برای ظرفیت اضافی ذخیره‌سازی، افزایش سرعت دسترسی، یا افزونگی بالاتر به کار گرفت. علاوه بر آن، در سطحی بالاتر خود آرایه‌های RAID را نیز می توان به عنوان ماژول‌هایی در نظر گرفت که کاربرد خاصی به هر یک اختصاص داده شده است.
  • انطباق سریع با محیط: می‌توان درایورها را اضافه یا حذف کرد، و سطح RAID را برای دستیابی به مصالحه‌های مورد نظر در ظرفیت، سرعت و افزونگی، به آسانی تغییر داد.
  • تحمل خطا: استفاده از افزونگی رویه­ی ذخیره­سازی داده در سیستم RAID، امکان بازیابی داده در صورت خرابی یکی از درایوها، را فراهم می­کند.

بر خلاف انتظارات طراحان، عمده‌ی استقبال بازار از RAID ناشی از سرعت بالاتر آن –که هدف اصلی طراحی محسوب می‌شد-نبود، بلکه بیشتر به دلیل قابلیت اطمینان بیشتری بود که از تحمل خطا نشات می‌گرفت. تا آن که در سال 1988، نویسندگان مقاله‌ی منتشر شده در 1988، قابلیت تحمل خطا در طراحی RAID را نشان داده –در طول نمایش عملکرد، یک درایو به سادگی حذف شده در حالی که آرایه همچنان به عملکرد خود ادامه می‌دهد- تا این پژوهش منتج به تغییر ذهنیت رایج در مورد پایداری سیستم­های چند قسمتی در فناوری اطلاعات شد. تا پیش از این عموما معتقد بودند که: یک سیستم درایو چندگانه باید قابلیت اطمینان کمتری داشته باشد زیرا دارای اجزای بیشتری است.

نمونه‌ی مورد فاوا: سرورهای تیغه‌ای

سرورهای تیغه‌ای مرکز روند تغییر به طراحی‌های ماژولار محسوب شده که در زمان نگارش این گزارش نیز، در حال اتفاق است. برای سال‌های بسیاری، سرورهای سنتی مستقل بزرگ‌تر و سریع‌تر شده، و با گسترش شبکه‌ی کامپیوتری، وظایف بیشتری را بر عهده دارند. سرورهای جدید بر اساس احساس نیاز، معمولا به شکلی سریع و با کمترین برنامه ریزی و هماهنگی به مراکز داده اضافه شده است. برای اپراتورهای مرکز داده خیلی عجیب نبود اگر بدون اطلاع آنان، سرورهایی اضافه می‌شد. پیچیدگی ناشی از این جعبه‌ها و کابل‌کشی مورد نیاز برای افزودن سرورها، به سردرگمی و اشتباهات بیشتر انجامیده و از قابلیت انعطاف پذیری می‌کاست.

سرورهای تیغه‌ای برای اولین بار در سال 2001 به کار گرفته شد و مثالی ساده و روشن از معماری ماژولار به شمار می‌رود- تیغه‌های ی شاسی سرور تیغه‌ای به لحاظ فیزیک یکسان بوده و پردازنده‌های یکسانی نیز داشتند که آماده‌ی پیکربندی و استفاده در جهت اهداف مورد نظر کاربران است. پیدایش این سرورها مزایای بسیاری از ماژولاریتی را در زمینه‌ی سرورها نمایان ساخت- توسعه‌پذیری، سادگی تکثیر، تخصصی سازی کارکردها و انطباق‌پذیری.

در عین حال که این مزایای کلاسیک ماژولار موجب رواج استفاده از سرورهای تیغه‌ای در مراکز داده گشته، اما یکی از اصلی‌ترین پتانسیل‌های اجرایی آن هنوز در انتظار یکی از قابلیت‌های حیاتی طراحی ماژولار باقی مانده است: تحمل خطا! قابلیت تحمل خطا در سرورهای تیغه‌ای-سرورهایی با قابلیت ذاتی بازسازی سرویس بعد از هر خرابی، برای انتقال از تیغه‌های معیوب به تیغه‌های سالم- به تازگی در دسترس قرار گرفته و مقرون به صرفه است. قابلیت اطمینان در چنین سرورهایی با تحمل خطا، نسبت به تکنیک‌های فعلی مرتبط با نرم‌افزار جایگزین و سرورهای خوشه‌ای ارجحیت دارند. بنابراین سرورهای تیغه‌ای به معماری غالب در حیطه‌ی سرورها در مراکز داده تبدیل شده‌اند. با ظهور تحمل خطای اتومات، در پنج سال گذشته، صنعت شاهد تغییری سریع به سمت بکارگیری سرورهای تیغه‌ای بوده است.

شکل 4: سرورهای سنتی
شکل 4: سرورهای سنتی

مزیت ماژولار در سرورهای تیغه‌ای

چرا سرورهای تیغه‌ای نسبت به سرورهای بزرگ مستقل و سنتی ارجحیت یافتند؟

  • توانایی توسعه و رشد: ظرفیت رایانش می‌تواند به راحتی و با افزودن ماژول‌های(تیغه‌های) بیشتر، افزایش یابد.
  • فرایند ساده‌ی تکثیر: ساخت تعدادی تیغه‌ی کوچک بسیار ساده‌تر از ساخت تمامی سرور است. منبع برق، فن‌های سرمایش، اتصالات شبکه و دیگر اجزای پشتیبانی داخل شاسی متمرکز شده و بین تیغه‌ها، مشترک هستند که در نتیجه، از این طریق ساختار تیغه‌ها ساده‌سازی می‌شوند.
  • توانایی تخصصی‌سازی کارکرد ماژول‌ها: هر یک از تیغه‌ها را می توان با کاربرد‌های نرم‌افزاری که توسط کاربران تعیین شده، پیکربندی کرد.
  • انطباق سریع با محیط: مطابق نیاز کسب و کار یا الزامات مالی، می‌توان تیغه‌هایی را اضافه یا حذف کرد و برای اجرای کاربرهای متفاوت، مجددا پیکربندی کرد.
  • تحمل خطا: با قابلیت ذاتی بازسازی سرویس بعد از هر خرابی که در حین خرابی به روشی منسجم عملیات را به دیگر تیغه‌ها منتقل کرده، می‌توان به طور خودکار خرابی و از ار افتادگی تیغه‌ها را مدیریت کرد.
شکل 5: سرور تیغه‌ای (10 تیغه در یک شاسی)
شکل 5: سرور تیغه‌ای (10 تیغه در یک شاسی)

تعریفی متغیر برای خرابی در سیستم‌های فاوا

بررسی این نمونه‌های موردی نشان داد که چگونه طراحی ماژولار به دلایلی اساسی که در ذات و ماهیت ماژولاریتی نهان است، نسبت به طراحی یک تکه‌ای اولویت یافت. یکی از این دلایل، تحمل خطا بوده که اهمیت ویژه‌ای برای مراکز داده‌ی آتی خواهد داشت. زمانی که سرورها و دستگاه‌های ذخیره‌ساز در سرتاسر مرکز داده، به قابلیت تحمل خطا مجهز شوند، تعریف خرابی و خطا نیز در صنعت فاوا تغییر خواهد کرد.

دو سناریوی متفاوت برای خرابی در مرکز داده در نظر گرفته می‌شود(شکل 6). در شکل سمت راست با از کار افتادن یک UPS که از کل مرکز داده پشتیبانی می‌کند، خرابی در تمام رک‌ها رخ می‌دهد. در سمت چپ، تنها یک رک از کار افتاده است. در مراکز داده‌ی سنتی، مدیر فاوا تفاوتی بین این دو سناریو قائل نمی‌شود زیرا حتی با خرابی یک رک، وابستگی‌های درونی بین سرورها، آرایه‌های دیسک، سویچ‌ها و روترها به احتمال زیاد موجب تاثیرات و آسیب‌های سری شده که کل مرکز داده را از کار می‌اندازد.

با بکارگیری طراحی ماژولار جدید مبتنی بر آرایه‌ها در رایانش و ذخیره‌سازی، خرابی سمت چپ -یک رک- در دید مدیران فاوا خرابی بهتر و کم‌ضررتری تعریف شده زیرا امروزه حتی با خرابی در هر یک از واحدها، با کمک افزونگی در منابع، مراکز داده می‌توانند به عملکرد خود ادامه دهند. هر چه معماری‌هایی با تحمل خطا رواج یافته، مراکز داده نیز قادر هستند بدون از کار افتادگی کل سیستم، خرابی در تعداد بیشتری از واحدهای خود را تحمل کنند. وقتی سازندگان سرورهای‌تیغه‌ای موفق شدند به وعده‌های اولیه‌ی خود در مورد قابلیت منسجم تحمل خطا عمل کنند، دیگر خرابی یک، دو، سه یا چندین رک نیز موجب از کار افتادن سیستم نخواهد شد.

شکل 6: دو سناریوی خرابی در مرکز داده (نما از بالا، چهار ردیف با 8 رک)
شکل 6: دو سناریوی خرابی در مرکز داده (نما از بالا، چهار ردیف با 8 رک)

پیامدهایی در DCPI

این الگوی جدید در مدیریت خرابی – یعنی انتظار آن که خرابی بعضی ماژول‌ها اجتناب ناپذیر بوده با آمادگی مقابله با خرابی همراه شود- پیامدی به دنبال داشته که بر نحوه‌ی پشتیبانی زیرساخت‌های فیزیکی مرکز داده(DCPI) از معماری جدید فاوا تاثیر می‌گذارد. به عنوان مثال، هر چه مراکز داده تحمل بیشتری در برابر خطا در سطوح فاوا داشته باشند، پشتیبانی برق توسط یک UPS بزرگ بهره‌وری کمتری نشان خواهد داد زیرا با خرابی آن دستگاه UPS، کل سیستم از کار می‌افتد – نتیجه‌ای نامطلوب در مرکز داده‌ای که می‌تواند با از دست دادن یک رک، به کار خود ادامه دهد. اگر UPSها به شکلی در سرتاسر مرکز داده توزیع شوند که هر دستگاه از یک رک پشتیبانی کند، در آن صورت با خرابی هر یک از UPSها، تنها همان رک وابسته به آن از کار افتاده و سیستم به کار خود ادامه می‌دهد.

حتی با وجودی که تعداد بیشتری UPS به کار گرفته شده که این خود احتمال خرابی هر دستگاه را افزایش داده، باز هم سیستم می‌تواند چنین خرابی را تحمل کند. اگر با خرابی 3 رک تمام سیستم از کار بیفتد، درنتیجه باید 3 دستگاهUPS به طور همزمان خراب شده تا عملکرد سیستم را منحل کند  این احتمالی بعید به نظر می‌رسد- چنین پیشامدی از خرابی یک UPS بزرگ غیر محتمل‌تر به نظرمی‌رسد. به همین دلیل، تئوری قابلیت اطمینان شدیدا بر معماری توزیع شده‌ی برق و سرمایش تاکید داشته تا سیستم‌های فاوا قابلیت بالاتری در تحمل خطا داشته باشند.

زیرساخت‌های فیزیکی یک تکه‌ای در برابر زیرساخت‌های فیزیکی ماژولار در مراکز داده

در پیشینه‌ی 3 ساله‌ی مراکز داده،زیساخت‌های فیزیکی مراکز داده(DCPI) تا حد زیادی ثابت و بدون تغییر باقی مانده است. از کوچک‌ترین سالن‌های کامپیوتر گرفته تا بزرگ‌ترین تاسیسات سازمانی، مدل ثابت زیرساخت‌های فیزیک یک دستگاه مرکزی برای تامین برق و سرمایش بوده است. مهندسی و طراحی این نوع از زیرساخت‌ها به پیکربندی منحصر به فرد و یک تکه‌ای در تجهیزات و اتصالات منجر می‌شود. با جایگزینی چنین معماری با طراحی ماژولار، نه تنها DCPI می‌تواند به طور مناسبی از تجهیزات ماژولار فاوا با تحمل خطا، پشتیبانی کند، بلکه تجهیزات DCP نیز از مزایای ماژولاریتی -شامل مزایای قابلیت اطمینان ناشی از تحمل خطا- بهره‌مند می‌شوند.

شکل 7: دستگاه UPS مرکز داده یک تکه‌ای
شکل 7: دستگاه UPS مرکز داده یک تکه‌ای

مزایای ماژولار DCPI

چرا DCPI ماژولار جایگزین DCPI یک تکه‌ای سنتی شد؟

  • توانایی توسعه یا رشد: مشخصات DCPI ماژولار باید متناسب با الزامات فعلی فاوا در مرکز داده انتخاب شود و بسته به همین الزامات نیز رشد و توسعه یابد. این مزیت اهمیت ویژه‌ای در DCPI داشته زیرا روش سنتی یک بار سیستم برق و سرمایش را اجرا کرده تا از حداکثر نیاز در تجهیزات فاوا، پشتیبانی کند. این امر به هدررفتی چشمگیر در هزینه‌ی سرمایه و عملیاتی منجر می‌شود.

  • فرایند ساده‌ی تکثیر: طراحی ماژولار به معنی ساخت تعداد بیشتری واحد کوچک به جای ساخت تعداد کمی واحد بزرگ است. حجم بیشتر تولید به معنای خطای کمتر بوده و طراحی کوچک‌تر و ساده‌تر نیز، به معنای اتوماسیون قوی‌تر و دخالت انسانی کمتر در حین ساخت و در نتیجه خطای کمتر، است.

  • توانایی تخصصی‌سازی کارکرد ماژول‌ها: دستگاه‌های تامین برق و سرمایش را می‌توان با پیکربندی‌های مختلف ساخت که با دسترسی مشخص و الزامات سرمایش در قطعات مختلف مرکز داده، همخوانی داشته باشد.

  • انطباق سریع با محیط: با افزودن تجهیزات جدید و تغییر هر 2-3 ساله در تجهیزات فاوا، فضای مرکز داده دائما در حال تغییر و بازبینی است. ممکن است در تجهیزات جدید، ابعاد یا شکل، الزامات برق و سرمایشی، پریز‌ها و دوشاخه‌های و دیگر مشخصات متفاوت باشد. سیستم DCPI ماژولار را به راحتی می‌توان توسعه بخشیده یا مجددا پیکربندی کرد تا به نیازهای متغیر فاوا پاسخ گفت.

  • تحمل خطا: همان طور که تجهیزات فاوا با تحمل خطا، به مرکز داده اجازه می‌دهند تا با خرابی یکی از اجزای فاوا نیز به عملکرد خود ادامه دهد، تجهیزات DCPI با تحمل خطا نیز می‌تواند در صورت بروز خرابی در یکی از اجزا، عملکرد برق و سرمایش را تداوم بخشد. با دستگاه‌های افزونه‌ی DCPI یا با افزونگی داخلی اجزای داخل این دستگاه‌ها – به طور مثال با داشتن ماژول‌های اضافی برق در یک UPS- می‌تواند به قابلیت تحمل خطا در DCPI دست یافت.

مشابه نمونه‌ی موردی پیشین از طراحی ماژولار، 4 ویژگی اول در موفقیت طراحی موثر و مفید بوده اما پنجمین ویژگی – تحمل خطا- حیاتی است. علاوه بر آن، از آن جا که مرکز داده برای عملکرد خود کاملا به برق و سرمایش وابسته است، قابلیت اطمینان تحمل خطا در DCPI نیز مانند تجهیزات فاوای تحت پشتیبانی آن، حیاتی و ضروری است.  مرکز داده‌ی با قابلیت تحمل خطا که فاقد DCPI با تحمل خطا باشد، همچون پل معلقی است که بدنه‌ای قوی داشته اما با کابل‌هایی ضعیف به تکیه‌گاه متصل است.

شکل 8: دستگاه UPS ماژولار در سطح رک
شکل 8: دستگاه UPS ماژولار در سطح رک

نتیجه‌گیری

تغییر و تحولات طراحی از حالت یک تکه‌ای به طراحی ماژولار، به دلیل مزایایی که در بهره‌وری، انعطاف پذیری و قابلیت اطمینان ایجاد کرده، قسمتی از روند طبیعی تکامل در سیستم‌های پیچیده محسوب می‌شود. با بررسی نمونه‌های موفق دیگر، راحت‌تر می‌توان پتانسیل‌های ماژولاریتی را در ارتقای چمشگیر و حتی پایه‌ای سیستم‌هایی درک کرد که از همان مفهوم اولیه به شکلی یک تکه‌ای کار کرده و هرگز روش دیگر در مورد آن متصور نبوده است. تحمل خطا و دیگر ویژگی‌های کلیدی در ماژولاریتی – توانایی توسعه، انطباق، تخصصی‌سازی و تکثیر- به همان اندازه که در سیستم‌های ماژولار ساخته‌ی دست بشر واضح و اجتناب‌ناپذیر است، در سیستم‌های طبیعی نیز اهمیت دارد.

پیش از این صنعت فاوا، مزایای ناشی از طراحی‌های ماژولار را در رایانش و ذخیره‌سازی مشاهده و درک کرده است – آرایه‌های RAID و سرورهای تیغه‌ای.

مهم‌تر از آن، مزیت سیستمی ماژولاریتی که از دهه‌ 70 میلادی، به طور معمول در مشاغل حساس و حیاتی استفاده شده، همان ویژگی تحمل خطا بوده که امروزه مراکز داده قادر هستند تا در پیاده‌سازی چنین مزیتی(تحمل خطا)، از صنایعی همچون هوا فضا پیروی کنند. در ویژگی تحمل خطا، در می‌شود که اعمال کنترلی دقیق برکیفیت اجزا تنها گام نخست در قابلیت اطمینان سیستم محسوب شده و تاکتیک نهایی قابلیت اطمینان، عملکرد دائمی سیستم در صورت خرابی یکی از اجزا، است.

همان طور که ماژولاریتی و تحمل خطا، به مدل‌های جدیدی در طراحی مرکز داده تبدیل می‌شوند، زیرساخت‌های فیزیکی مرکز داده نیز باید در همین جهت حرکت کرده تا در عین حال که به بهره‌وری مرکز داده کمک کرده، در بهره‌وری، انعطاف‌پذیری و قابلیت اطمینان خود نیز از مزایای ماژولاریتی بهره برد.

 

[1] – امروزه که عملیات فاوا تقریبا در تمامی صنایع از جمله سلامت و بهداشت و صنایع دفاع، گسترش یافته، مراکز داده به عنوان مشاغل حیاتی محسوب شده زیرا با توقف احتمالی عملکرد آن، ممکن است زندگی افراد به خطر بیفتد. در نتیجه تحمل خطا نیز حتی فراتر از منافع اقتصادی آن، در طراحی مراکز داده در نظر گرفته می‌شود.

[2] – redundant array of independent disks