انتخاب سردبیر مقاله‌ها

تاثیر UPS بر پایایی سیستم مرکزداده (Availability)

آئین‌نامهٔ مهندسی مرکز داده ترجمهٔ فارسی مقالات نیل راسموسن - APC White Papers
آئین‌نامهٔ مهندسی مرکزداده:
ترجمهٔ فارسی مقالات نیل راسموسن
در APC White Papers

تاثیر UPS بر پایایی سیستم مرکزداده (Availability) ـ[1]

مقدمه

در این مقاله توضیح می‌دهیم چگونه قطع برق AC بر «زمانِ به‌کار» (Uptime) ـ[2] و پایایی (Availability) سیستم مرکزداده اثر می‌گذارد. همچنین دادهٔ کمّی دربارهٔ «زمان به‌کار» مراکزداده ارائه می‌دهیم که از شرایط واقعی به‌دست آمده است و نشان می‌دهد چگونه UPS به افزایش «زمان به‌کار» مرکزداده کمک می‌کند. این داده دربارهٔ پی‌آمدهای فراوانی قطع برق و مدت قطعی، رفتار تجهیزات در هنگام ریست‌شدن، همچنین عوامل مرتبط با اطمینان‌پذیری UPS است. همچنین نشان می‌دهیم چگونه افزایش مدت پشتیبانی UPS باعث بهبود اطمینان‌پذیری (Reliability) می‌شود.

درخواست برای افزایش «زمان به‌کار» در بخش فاوای مراکزدادهٔ مبتنی بر راهکارهای «ایمنی ذاتی» (Intrinsically Safe) ـ[3] روزبه‌روز بیشتر می‌شود. آن‌ها معمولا انتظار اطمینان‌پذیری پنج ۹ [4] را دارند. از میان عوامل بسیاری که در قابلیت‌های سیستم، کاستی به‌وجود می‌آورند و مانع از دستیابی به میزان عملکرد پنج ۹ می‌شوند، اطمینان‌پذیری برق AC اصلی‌ترین مانع است. البته رابطهٔ میان اطمینان‌پذیری برق AC و «زمان به‌کار» به‌خوبی روشن نیست؛ همچنین اطمینان‌پذیری برق AC در هر جا نسبت به جای دیگر بسیار متفاوت است.

محیط‌های دارای برق AC

 دربارهٔ اطمینان‌پذیری برق AC دادهٔ (Data) استاندارد اندکی وجود دارد. البته دو پژوهش مهم در آمریکا انجام شده که آزمایشگاه بِل [5] و IBM انجام داده‌اند. شرکت اشنایدر الکتریک نیز با نصب ۱۰ میلیون سیستم UPS که بیشتر آن‌ها قابلیت ثبت مشکلات برق را دارند، تجربهٔ ارزشمندی در این زمینه به‌دست آورده است.

مشکلات ناشی از برق AC در سه گروه زیر دسته‌بندی می‌شوند:

  1. قطع برق یا افت ولتاژ که تجهیزات مصرف‌کننده را به‌شکل موقت از کار می‌اندازد.
  2. نوسان‌های آنی که موجب می‌شود تجهیزات مصرف‌کننده هنگ کند (Hang) یا به‌شکل موقت به اختلال کارکرد دچار شود.
  3. نوسان‌های آنی که به تجهیزات مصرف‌کننده آسیب می‌زند.

در این مقاله تنها مشکلات گروه اول یعنی قطع برق یا افت ولتاژ را بررسی می‌کنیم. در اینجا فرض کرده‌ایم که:

  • تجهیزات به‌وسیلهٔ «دستگاه کاهندهٔ نوسان‌های گذرا و نوسان‌های صاعقه» [6] یا به‌وسیلهٔ UPS به‌خوبی حفاظت می‌شوند.
  • خرابی‌های ناشی از مشکلات برق AC در شرایط واقعی، بزرگ‌تر و بدتر از چیزی است که در این مقاله به آن می‌پردازیم.

داده‌ایی که از پژوهش در آمریکا به‌دست آمده و با تجربهٔ اشنایدر الکتریک نیز مطابقت دارد، نکات مهم زیر را نشان می‌دهد:

  1. میانگین تعداد قطع برق به آن اندازه است که سیستم فاوای هر تاسیسات معمول را تقریبا ۱۵ بار در سال به مشکل دچار می‌کند.
  2. مدت زمان قطع برق در ۹۰ درصد از مواقع، کمتر از ۵ دقیقه است.
  3. مدت زمان قطع برق در ۹۹ درصد از مواقع، کمتر از ۱ ساعت است.
  4. مجموع مدت زمان قطع برق در سال، تقریبا ۱۰۰ دقیقه است.

البته باید توجه داشت که از این نظر، هر جایی نسبت به جای دیگر بسیار متفاوت است. برای نمونه در بعضی از مناطق آمریکا، مثلا فلوریدا، تعداد قطع برق بیشتر است چون صاعقه‌زدگی زیادی رخ می‌دهد. مشکلات داخل ساختمان‌ها نیز تعداد قطع برق را تا چندین برابر افزایش می‌دهد. داده‌ای که نتایج پیش‌گفته از آن به‌دست آمده، بیان‌کنندهٔ شرایط ژاپن یا اروپای شرقی است. اطلاعات نشان می‌دهد زمان به‌کار (آپ‌تایم) برق AC در آمریکا ۹۹٫۹۸۰ درصد است؛ یعنی ۱۰۰ دقیقه قطع برق در سال. این وضعیت دست‌یافتن به هدف پنج ۹ را بسیار دشوار می‌کند؛ زیرا زمان قطع برق برای به‌دست‌آوردن این ویژگی باید ۴٫۸ دقیقه در سال باشد.

تاثیر رفتار تجهیزات بر «زمانِ به‌کار» (Uptime)

در شرایط واقعی، رفتار تجهیزات در هنگام قطع برق آشکارا زمان ازکارافتادگی سیستم (Downtime) را افزایش می‌دهد. واکنش تجهیزات پس از قطع برق معمولا یکی از سه حالت زیر است:

  1. با اتصال جریان برق، به‌شکل خودکار و بی‌درنگ ریست (Restart) می‌شوند.
  2. به‌شکل خودکار ولی با تاخیر ریست می‌شوند.
  3. کاربر به‌شکل دستی آن‌ها را ریست می‌کند.

در حالت دستی، مقدار زمان تاخیر مُجاز را سطح کیفیت خدمات تعیین می‌کند که معمولا یکی از موارد زیر است:

  1. حضور همیشگی کارشناس: ۱ ساعت
  2. کارشناس منتظر تماس: ۴ ساعت
  3. خدمات دسترسی از راه دور: ۲۴ ساعت

با در نظر گرفتن این عوامل، مدت ازکارافتادگی ناشی از مشکل سیستم برق AC را می‌توان با توجه به جدول زیر به‌مقدار بسیاری کاهش داد.

جدول ۱: تاثیر رفتار تجهیزات بر زمان ازکارافتادگی سیستم، با برق حفاظت‌نشدهٔ AC
  حضور دائم کارشناس کارشناس منتظر تماس سرویس دسترسی
از راه دور
ریست سریع ۱۱۳ دقیقه ۱۱۳ دقیقه ۱۱۳ دقیقه
ریست خودکار در ۵ دقیقه ۱۸۹ دقیقه ۱۸۹ دقیقه ۱۸۹ دقیقه
ریست دستی ۱٬۰۸۵ دقیقه ۳٬۸۱۲ دقیقه ۲۱٬۹۹۲ دقیقه

 

تاثیر UPS بر زمان ازکارافتادگی سیستم (Downtime)

وقتی UPS به سیستم اضافه می‌شود، سه وضعیت به‌وجود می‌آید که هریک به‌نوعی بر زمان ازکارافتادگی تاثیر می‌گذارد:

  1. اگر مدت قطع برق کوتاه‌تر از مدت پشتیبانی UPS باشد، بر تحلیل ما اثری ندارد.
  2. اگر مدت قطع برق طولانی‌تر از مدت پشتیبانی UPS باشد، قطع برق رخ می‌دهد.
  3. خود سیستم UPS ممکن است از کار بیفتد و موجب قطع برق بشود.

بدیهی است فایدهٔ UPS در جلوگیری از قطع برق است. گذشته از رفتار تجهیزات یا سطح خدمات که در جدول زیر آمده است، نصب UPS تعداد قطع برق را کاهش می‌دهد. در جدول زیر منظور از PA سیستم‌هایی همچون APC Symmetra Power Array است که افزونگی N+1 دارند.

جدول ۲: تاثیر بهره‌گرفتن از UPS، بر تعداد قطع برق
  برق شهری UPS
با ۵ دقیقه پشتیبانی
UPS
با ۱ ساعت پشتیبانی
UPS
با ژنراتور
سیستم PA با ژنراتور
ریست سریع ۱۵ ۱ ۰٫۱۵ ۰٫۰۱ ۰٫۰۰۱
ریست خودکار در ۵ دقیقه ۱۵ ۱ ۰٫۱۵ ۰٫۰۱ ۰٫۰۰۱
ریست دستی ۱۵ ۱ ۰٫۱۵ ۰٫۰۱ ۰٫۰۰۱

هنگامی که تمام عوامل را در نظر بگیرید، زمان ازکارافتادگی سیستم با بهره‌گرفتن از UPS به‌مقدار زیادی کم خواهد شد. هرچند که مزایای این کار وابستگی بسیاری به کیفیت خدمات تجهیزات و رفتار آن‌ها در زمان قطع برق دارد. اکنون به سه جدول زیر توجه کنید:

جدول ۳: تاثیر بهره‌گرفتن از UPS، بر زمان ازکارافتادگی سیستم، با حضور دائم کارشناس
  برق شهری UPS
با ۵ دقیقه پشتیبانی
UPS
با ۱ ساعت پشتیبانی
UPS
با ژنراتور
سیستم PA با ژنراتور
ریست سریع ۱۱۳ دقیقه ۱۰۰ دقیقه ۱۰ دقیقه ۱ دقیقه ۰٫۱ دقیقه
ریست خودکار در ۵ دقیقه ۱۸۹ دقیقه ۱۰۹ دقیقه ۱۰ دقیقه ۱ دقیقه ۰٫۱ دقیقه
ریست دستی ۱٬۰۸۵ دقیقه ۲۰۸ دقیقه ۲۰ دقیقه ۱ دقیقه ۰٫۱ دقیقه
جدول ۴: تاثیر بهره‌گرفتن از UPS، بر زمان ازکارافتادگی سیستم، با کارشناس منتظر تماس
  برق شهری UPS
با ۵ دقیقه پشتیبانی
UPS
با ۱ ساعت پشتیبانی
UPS
با ژنراتور
سیستم PA با ژنراتور
ریست سریع ۱۱۳ دقیقه ۱۰۱ دقیقه ۱۱ دقیقه ۲ دقیقه ۰٫۲ دقیقه
ریست خودکار در ۵ دقیقه ۱۸۹ دقیقه ۱۱۰ دقیقه ۱۲ دقیقه ۲ دقیقه ۰٫۲ دقیقه
ریست دستی ۳٬۸۱۲ دقیقه ۵۰۹ دقیقه ۵۱ دقیقه ۵ دقیقه ۰٫۵ دقیقه
جدول ۵: تاثیر بهره‌گرفتن از UPS، بر زمان ازکارافتادگی سیستم، با سرویس دسترسی از راه دور
  برق شهری UPS
با ۵ دقیقه پشتیبانی
UPS
با ۱ ساعت پشتیبانی
UPS
با ژنراتور
سیستم PA با ژنراتور
ریست سریع ۱۱۳ دقیقه ۱۱۴ دقیقه ۲۳ دقیقه ۱۴ دقیقه ۱٫۴ دقیقه
ریست خودکار در ۵ دقیقه ۱۸۹ دقیقه ۱۲۲ دقیقه ۲۴ دقیقه ۱۴ دقیقه ۱٫۴ دقیقه  
ریست دستی ۲۱٬۹۹۲ دقیقه ۲٬۵۱۳ دقیقه ۲۵۵ دقیقه ۲۹ دقیقه ۲٫۹ دقیقه  

راهنمای انتخاب UPS

از دادهٔ بالا می‌توان نتایج زیر را دربارهٔ انتخاب سیستم UPS مناسب برای کاهش زمان ازکارافتادگی به‌دست آورد:

  1. انتخاب UPS، رفتار تجهیزات، سطح خدمات، این‌ها عواملی هستند که مدت ازکارافتادگی را از اندکی تا چندین برابر کاهش می‌دهند.
  2. افزایش‌دادن زمان پشتیبانی UPS از ۵ دقیقه به ۱ ساعت، معمولا مدت ازکارافتادگی را تا چندین برابر کاهش می‌دهد.
  3. برای دست‌یافتن به زمان به‌کار (آپ‌تایم) با ویژگی پنج ۹، به UPS با زمان پشتیبانی بیش از ۱ ساعت یا ژنراتور نیاز است.
  4. برای دستیابی به زمان به‌کار پنج ۹ در مراکزداده‌ای که خارج از شهرها هستند، هم به ژنراتور و هم به UPS با افزونگی N+1 نیاز است.
  5. استفاده از UPS در افزایش زمانِ به‌کار سیستم‌هایی که به‌شکل دستی ریست می‌شوند، بسیار موثرتر است.

نتیجه‌گیری

قطع برق مهم‌ترین مانع برای دستیابی به «زمان به‌کار» با ویژگی ۹۹٫۹۹۹ درصد (پنج ۹) است. زیرا برای به‌دست‌آوردن این ویژگی، مقدار پذیرفتهٔ زمان ازکارافتادگی (Downtime) فقط ۴٫۸ دقیقه در سال است. در مراکزدادهٔ خارج از شهر که سیستم‌ها نیازمند به مداخلهٔ انسانی هستند، به‌دست‌آوردن فاکتور زمان ازکارافتادگی در سطح پنج ۹ به‌سادگی ممکن نمی‌شود. شرکت‌هایی که زیرساخت فاوا دارند، معمولا ۲۳ برابر بیشتر از استاندارد پنج ۹ با قطع برق مواجه می‌شوند. زمان به‌کار با بهره‌گرفتن از UPS، بسیار افزایش می‌یابد؛ ولی ممکن است برای دست‌یافتن به عملکرد (Performance) پنج ۹ ضروری باشد که زمان پشتیبانی UPS طولانی‌تر بشود یا ژنراتور به کار رود.

در این مقاله تنها دربارهٔ آثار قطع برق گفتیم و به دیگر مشکلات برق AC نپرداختیم. مشکلاتی همچون نوسان آنی ولتاژ که می‌باید مهار بشود؛ چون سیستم را از کار می‌اندازد و به عملکرد آن آسیب وارد می‌کند. با به‌کار گرفتن UPS چنین مشکلاتی از میان می‌رود و افزون بر آن مزایای دیگری نیز دارد که در این مقاله بیان نشده است.

پانویس

[1] این مطلب بخشی از کتاب «آئین‌نامهٔ مهندسی مرکزداده» و ترجمهٔ فارسی مقالهٔ زیر است:

APC White Paper 24: “Effect of U PS on Sys tem Availability” (Revision 3)

نویسنده نیل راسموسن (Neil Rasmussen) [آشنایی با نویسنده و مطالعه‌ی مقالات فارسی او]، مترجم نازلی مجیدی، بازنویسی و ویراستاری پرهام غدیری‌پور، به‌کوشش دکتر بابک نیکفام، تهیه‌شده در باشگاه مراکزداده

[2] Uptime: «زمانِ به‌کار» مدت‌زمان اندازه‌گیری شده‌ای است که سیستم در آن بدون دخالت و به‌شکل درست و فعال عمل می‌کند.

[3] Intrinsically Safe، به‌اختصار (IS): راهکاری است برای آن تجهیزات الکتریکی که در محیط‌های در معرض خطر آتش‌سوزی یا انفجار قرار دارند. این شیوه با به‌کاربردن مواردی همچون کاهش مصرف انرژی، کاهش حرارت، ساده‌کردن مدارها، همچنین کاستن از جریان ولتاژ، امکان آتش‌سوزی یا انفجار را هم‌زمان با کاهش هزینه از میان می‌برد. مولفه‌های این شیوه در برخی از استاندارها لحاظ شده است.

[4] سیستمی دارای قابلیت پایایی پنج ۹ است که ۹۹٫۹۹۹ درصد از بازهٔ زمانی را به‌شکل بی‌وقفه و درست کار کند؛ یعنی در حالت به‌کار (Uptime) باشد.

[5] AT&T Bell Laboratories؛ آزمایشگاه‌های بل (Bell Labs): آزمایشگاهی باسابقه در آمریکا است که گراهام بل در سال ۱۸۸۰ آن را تاسیس کرد. این آزمایشگاه از بخش‌های تحقیق و توسعهٔ موسسهٔ آلکاتل ـ لوسنت بود که شرکت نوکیا در سال ۲۰۱۵ آن را به‌همراه این آزمایشگاه خریداری کرد.

[6] Transient protection of a surge suppressor

درج دیدگاه

برای درج دیدگاه کلیک کنید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سوال امنیتی *