تاثیر UPS بر پایایی سیستم مرکزداده (Availability) ـ[1]
مقدمه
در این مقاله توضیح میدهیم چگونه قطع برق AC بر «زمانِ بهکار» (Uptime) ـ[2] و پایایی (Availability) سیستم مرکزداده اثر میگذارد. همچنین دادهٔ کمّی دربارهٔ «زمان بهکار» مراکزداده ارائه میدهیم که از وضعیت واقعی به دست آمده است و نشان میدهد چگونه UPS به افزایش «زمان بهکار» مرکزداده کمک میکند. این داده دربارهٔ پیآمدهای فراوانی قطع برق و مدت قطعی، رفتار تجهیزات در هنگام ریستشدن، همچنین عوامل مرتبط با اطمینانپذیری UPS است. همچنین نشان میدهیم چگونه افزایش مدت پشتیبانی UPS باعث بهبود اطمینانپذیری (Reliability) میشود.
درخواست برای افزایش «زمان بهکار» در بخش فاوای مراکزدادهٔ مبتنی بر راهکارهای «ایمنی ذاتی» (Intrinsically Safe) ـ[3] روزبهروز بیشتر میشود. آنها معمولا انتظار اطمینانپذیری پنج ۹ [4] را دارند. از میان عوامل بسیاری که در قابلیتهای سیستم، کاستی بهوجود میآورند و مانع از دستیابی به میزان عملکرد پنج ۹ میشوند، اطمینانپذیری برق AC اصلیترین مانع است. البته رابطهٔ میان اطمینانپذیری برق AC و «زمان بهکار» بهخوبی روشن نیست؛ همچنین اطمینانپذیری برق AC در هر جا نسبت به جای دیگر بسیار متفاوت است.
محیطهای دارای برق AC
دربارهٔ اطمینانپذیری برق AC دادهٔ (Data) استاندارد اندکی وجود دارد. البته دو پژوهش مهم در آمریکا انجام شده که آزمایشگاه بِل [5] و IBM انجام دادهاند. شرکت اشنایدر الکتریک نیز با نصب ۱۰ میلیون سیستم UPS که بیشتر آنها قابلیت ثبت مشکلات برق را دارند، تجربهٔ ارزشمندی در این زمینه به دست آورده است.
مشکلات ناشی از برق AC در سه گروه زیر دستهبندی میشوند:
- قطع برق یا افت ولتاژ که تجهیزات مصرفکننده را بهشکل موقت از کار میاندازد.
- نوسانهای آنی که موجب میشود تجهیزات مصرفکننده هنگ کند (Hang) یا بهشکل موقت به اختلال کارکرد دچار شود.
- نوسانهای آنی که به تجهیزات مصرفکننده آسیب میزند.
در این مقاله تنها مشکلات گروه اول یعنی قطع برق یا افت ولتاژ را بررسی میکنیم. در اینجا فرض کردهایم که:
- تجهیزات بهوسیلهٔ «دستگاه کاهندهٔ نوسانهای گذرا و نوسانهای صاعقه» [6] یا بهوسیلهٔ UPS بهخوبی حفاظت میشوند.
- خرابیهای ناشی از مشکلات برق AC در وضعیت واقعی، بزرگتر و بدتر از چیزی است که در این مقاله به آن میپردازیم.
دادهای که از پژوهش در آمریکا به دست آمده و با تجربهٔ اشنایدر الکتریک نیز مطابقت دارد، نکات مهم زیر را نشان میدهد:
- میانگین تعداد قطع برق به آن اندازه است که سیستم فاوای هر تاسیسات معمول را تقریبا ۱۵ بار در سال به مشکل دچار میکند.
- مدت زمان قطع برق در ۹۰ درصد از مواقع، کمتر از ۵ دقیقه است.
- مدت زمان قطع برق در ۹۹ درصد از مواقع، کمتر از ۱ ساعت است.
- مجموع مدت زمان قطع برق در سال، تقریبا ۱۰۰ دقیقه است.
البته باید توجه داشت که از این نظر، هر جایی نسبت به جای دیگر بسیار متفاوت است. برای نمونه در بعضی از مناطق آمریکا، مثلا فلوریدا، تعداد قطع برق بیشتر است چون صاعقهزدگی زیادی رخ میدهد. مشکلات داخل ساختمانها نیز تعداد قطع برق را تا چندین برابر افزایش میدهد. دادهای که نتایج پیشگفته از آن به دست آمده، بیانکنندهٔ وضعیت ژاپن یا اروپای شرقی است. اطلاعات نشان میدهد زمان بهکار (آپتایم) برق AC در آمریکا ۹۹٫۹۸۰ درصد است؛ یعنی ۱۰۰ دقیقه قطع برق در سال. این وضعیت دستیافتن به هدف پنج ۹ را بسیار دشوار میکند؛ زیرا زمان قطع برق برای بهدستآوردن این ویژگی باید ۴٫۸ دقیقه در سال باشد.
تاثیر رفتار تجهیزات بر «زمانِ بهکار» (Uptime)
در وضعیت واقعی، رفتار تجهیزات در هنگام قطع برق آشکارا زمان ازکارافتادگی سیستم (Downtime) را افزایش میدهد. واکنش تجهیزات پس از قطع برق معمولا یکی از سه حالت زیر است:
- با اتصال جریان برق، بهشکل خودکار و بیدرنگ ریست (Restart) میشوند.
- بهشکل خودکار ولی با تاخیر ریست میشوند.
- کاربر بهشکل دستی آنها را ریست میکند.
در حالت دستی، مقدار زمان تاخیر مُجاز را سطح کیفیت خدمات تعیین میکند که معمولا یکی از موارد زیر است:
- حضور همیشگی کارشناس: ۱ ساعت
- کارشناس منتظر تماس: ۴ ساعت
- خدمات دسترسی از راه دور: ۲۴ ساعت
با در نظر گرفتن این عوامل، مدت ازکارافتادگی ناشی از مشکل سیستم برق AC را میتوان با توجه به جدول زیر بهمقدار بسیاری کاهش داد.
حضور دائم کارشناس | کارشناس منتظر تماس | سرویس دسترسی از راه دور |
|
---|---|---|---|
ریست سریع | ۱۱۳ دقیقه | ۱۱۳ دقیقه | ۱۱۳ دقیقه |
ریست خودکار در ۵ دقیقه | ۱۸۹ دقیقه | ۱۸۹ دقیقه | ۱۸۹ دقیقه |
ریست دستی | ۱٬۰۸۵ دقیقه | ۳٬۸۱۲ دقیقه | ۲۱٬۹۹۲ دقیقه |
تاثیر UPS بر زمان ازکارافتادگی سیستم (Downtime)
وقتی UPS به سیستم اضافه میشود، سه وضعیت بهوجود میآید که هریک بهنوعی بر زمان ازکارافتادگی تاثیر میگذارد:
- اگر مدت قطع برق کوتاهتر از مدت پشتیبانی UPS باشد، بر تحلیل ما اثری ندارد.
- اگر مدت قطع برق طولانیتر از مدت پشتیبانی UPS باشد، قطع برق رخ میدهد.
- خود سیستم UPS ممکن است از کار بیفتد و موجب قطع برق بشود.
بدیهی است فایدهٔ UPS در جلوگیری از قطع برق است. گذشته از رفتار تجهیزات یا سطح خدمات که در جدول زیر آمده است، نصب UPS تعداد قطع برق را کاهش میدهد. در جدول زیر منظور از PA سیستمهایی همچون APC Symmetra Power Array است که افزونگی N+1 دارند.
برق شهری | UPS با ۵ دقیقه پشتیبانی |
UPS با ۱ ساعت پشتیبانی |
UPS با ژنراتور |
سیستم PA با ژنراتور | |
ریست سریع | ۱۵ | ۱ | ۰٫۱۵ | ۰٫۰۱ | ۰٫۰۰۱ |
ریست خودکار در ۵ دقیقه | ۱۵ | ۱ | ۰٫۱۵ | ۰٫۰۱ | ۰٫۰۰۱ |
ریست دستی | ۱۵ | ۱ | ۰٫۱۵ | ۰٫۰۱ | ۰٫۰۰۱ |
هنگامی که تمام عوامل را در نظر بگیرید، زمان ازکارافتادگی سیستم با بهرهگرفتن از UPS بهمقدار زیادی کم خواهد شد. هرچند که مزایای این کار وابستگی بسیاری به کیفیت خدمات تجهیزات و رفتار آنها در زمان قطع برق دارد. اکنون به سه جدول زیر توجه کنید:
برق شهری | UPS با ۵ دقیقه پشتیبانی |
UPS با ۱ ساعت پشتیبانی |
UPS با ژنراتور |
سیستم PA با ژنراتور | |
ریست سریع | ۱۱۳ دقیقه | ۱۰۰ دقیقه | ۱۰ دقیقه | ۱ دقیقه | ۰٫۱ دقیقه |
ریست خودکار در ۵ دقیقه | ۱۸۹ دقیقه | ۱۰۹ دقیقه | ۱۰ دقیقه | ۱ دقیقه | ۰٫۱ دقیقه |
ریست دستی | ۱٬۰۸۵ دقیقه | ۲۰۸ دقیقه | ۲۰ دقیقه | ۱ دقیقه | ۰٫۱ دقیقه |
برق شهری | UPS با ۵ دقیقه پشتیبانی |
UPS با ۱ ساعت پشتیبانی |
UPS با ژنراتور |
سیستم PA با ژنراتور | |
ریست سریع | ۱۱۳ دقیقه | ۱۰۱ دقیقه | ۱۱ دقیقه | ۲ دقیقه | ۰٫۲ دقیقه |
ریست خودکار در ۵ دقیقه | ۱۸۹ دقیقه | ۱۱۰ دقیقه | ۱۲ دقیقه | ۲ دقیقه | ۰٫۲ دقیقه |
ریست دستی | ۳٬۸۱۲ دقیقه | ۵۰۹ دقیقه | ۵۱ دقیقه | ۵ دقیقه | ۰٫۵ دقیقه |
برق شهری | UPS با ۵ دقیقه پشتیبانی |
UPS با ۱ ساعت پشتیبانی |
UPS با ژنراتور |
سیستم PA با ژنراتور | |
ریست سریع | ۱۱۳ دقیقه | ۱۱۴ دقیقه | ۲۳ دقیقه | ۱۴ دقیقه | ۱٫۴ دقیقه |
ریست خودکار در ۵ دقیقه | ۱۸۹ دقیقه | ۱۲۲ دقیقه | ۲۴ دقیقه | ۱۴ دقیقه | ۱٫۴ دقیقه |
ریست دستی | ۲۱٬۹۹۲ دقیقه | ۲٬۵۱۳ دقیقه | ۲۵۵ دقیقه | ۲۹ دقیقه | ۲٫۹ دقیقه |
راهنمای انتخاب UPS
از دادهٔ بالا میتوان نتایج زیر را دربارهٔ انتخاب سیستم UPS مناسب برای کاهش زمان ازکارافتادگی به دست آورد:
- انتخاب UPS، رفتار تجهیزات، سطح خدمات، اینها عواملی هستند که مدت ازکارافتادگی را از اندکی تا چندین برابر کاهش میدهند.
- افزایشدادن زمان پشتیبانی UPS از ۵ دقیقه به ۱ ساعت، معمولا مدت ازکارافتادگی را تا چندین برابر کاهش میدهد.
- برای دستیافتن به زمان بهکار (آپتایم) با ویژگی پنج ۹، به UPS با زمان پشتیبانی بیش از ۱ ساعت یا ژنراتور نیاز است.
- برای دستیابی به زمان بهکار پنج ۹ در مراکزدادهای که خارج از شهرها هستند، هم به ژنراتور و هم به UPS با افزونگی N+1 نیاز است.
- استفاده از UPS در افزایش زمانِ بهکار سیستمهایی که بهشکل دستی ریست میشوند، بسیار موثرتر است.
نتیجهگیری
قطع برق مهمترین مانع برای دستیابی به «زمان بهکار» با ویژگی ۹۹٫۹۹۹ درصد (پنج ۹) است. زیرا برای بهدستآوردن این ویژگی، مقدار پذیرفتهٔ زمان ازکارافتادگی (Downtime) فقط ۴٫۸ دقیقه در سال است. در مراکزدادهٔ خارج از شهر که سیستمها نیازمند به مداخلهٔ انسانی هستند، بهدستآوردن فاکتور زمان ازکارافتادگی در سطح پنج ۹ بهسادگی ممکن نمیشود. شرکتهایی که زیرساخت فاوا دارند، معمولا ۲۳ برابر بیشتر از استاندارد پنج ۹ با قطع برق مواجه میشوند. زمان بهکار با بهرهگرفتن از UPS، بسیار افزایش مییابد؛ ولی ممکن است برای دستیافتن به عملکرد (Performance) پنج ۹ ضروری باشد که زمان پشتیبانی UPS طولانیتر بشود یا ژنراتور به کار رود.
در این مقاله تنها دربارهٔ آثار قطع برق گفتیم و به دیگر مشکلات برق AC نپرداختیم. مشکلاتی همچون نوسان آنی ولتاژ که میباید مهار بشود؛ چون سیستم را از کار میاندازد و به عملکرد آن آسیب وارد میکند. با بهکار گرفتن UPS چنین مشکلاتی از میان میرود و افزون بر آن مزایای دیگری نیز دارد که در این مقاله بیان نشده است.
پانویس
[1] این مطلب بخشی از کتاب «آئیننامهٔ مهندسی مرکزداده» و ترجمهٔ فارسی مقالهٔ زیر است:
APC White Paper 24: “Effect of UPS on System Availability” (Revision 3)
نویسنده نیل راسموسن (Neil Rasmussen) [آشنایی با نویسنده و مطالعهی مقالات فارسی او]، مترجم نازلی مجیدی، بازنویسی و ویراستاری پرهام غدیریپور، بهکوشش دکتر بابک نیکفام، تهیهشده در باشگاه مراکزداده
[2] Uptime: «زمانِ بهکار» مدتزمان اندازهگیری شدهای است که سیستم در آن بدون دخالت و بهشکل درست و فعال عمل میکند.
[3] Intrinsically Safe، بهاختصار (IS): راهکاری است برای آن تجهیزات الکتریکی که در محیطهای در معرض خطر آتشسوزی یا انفجار قرار دارند. این شیوه با بهکاربردن مواردی همچون کاهش مصرف انرژی، کاهش حرارت، سادهکردن مدارها، همچنین کاستن از جریان ولتاژ، امکان آتشسوزی یا انفجار را همزمان با کاهش هزینه از میان میبرد. مولفههای این شیوه در برخی از استاندارها لحاظ شده است.
[4] سیستمی دارای قابلیت پایایی پنج ۹ است که ۹۹٫۹۹۹ درصد از بازهٔ زمانی را بهشکل بیوقفه و درست کار کند؛ یعنی در حالت بهکار (Uptime) باشد.
[5] AT&T Bell Laboratories؛ آزمایشگاههای بل (Bell Labs): آزمایشگاهی باسابقه در آمریکا است که گراهام بل در سال ۱۸۸۰ آن را تاسیس کرد. این آزمایشگاه از بخشهای تحقیق و توسعهٔ موسسهٔ آلکاتل ـ لوسنت بود که شرکت نوکیا در سال ۲۰۱۵ آن را بههمراه این آزمایشگاه خریداری کرد.
[6] Transient protection of a surge suppressor
درج دیدگاه