انتخاب سردبیر مقاله‌ها

مدیریت ظرفیت برق و سرمایش مرکزداده

مقالهٔ مدیریت ظرفیت برق و سرمایش مرکز داده
آئین‌نامهٔ مهندسی مرکزداده:
ترجمهٔ فارسی مقالات نیل راسموسن
در APC White Papers
مقاله ۱۵۰: مدیریت ظرفیت برق و سرمایش مرکزداده

مدیریت ظرفیت برق و سرمایش مرکزداده [1]

مقدمه

مدیریت ظرفیتِ زیرساخت فیزیکی مرکزداده، عمل یا فرایندی است که تعریف شده تا برق و سرمایش و فضا به‌شکل کارآمد، در زمان درست، به‌مقدار کافی برای مصارف و فرایندهای فاوا فراهم باشد. در این مقاله تنها به مدیریت ظرفیت سرمایش و برق می‌پردازیم. مسائل مدیریت فضا در مقالهٔ «الزامات محاسبهٔ فضا و ظرفیت برق در مرکزداده» [2] بررسی شده است. عوامل اصلی زیر، برای داشتن مدیریت موثر و موفقیت‌آمیز ظرفیت برق و سرمایش لازم‌اند:

  • داشتن پیش‌بینی دقیق از ظرفیت
  • فراهم‌کردن ظرفیت مناسب برای تامین نیازهای کسب‌وکار

امکان پیش‌بینی و تامین کارآمد ظرفیت بستگی دارد به قابلیت تامین ظرفیت برق و سرمایش به‌وسیلهٔ رک‌ها. چنین قابلیتی امروزه کمتر در دسترس است. بهره‌برداران مرکزداده اغلب برای توسعهٔ ظرفیتی که کسب‌وکارشان نیاز دارد، اطلاعات ضروری را در اختیار ندارند تا بتوانند به‌شکل کارآمد تجهیزات جدید را اجرا کنند. بدین ترتیب از پاسخ‌دادن به پرسش‌های ساده‌ای همچون موارد زیر ناتوان می‌مانند:

  • سرور بعدی در کدام رک نصب شود تا پایایی (Availability) تجهیزات موجود را کاهش ندهد؟
  • برای اجرای تجهیزات پیشنهادی فاوا، مناسب‌ترین مکان از دید پایایی سرمایش و توان کجاست؟
  • آیا می‌توان تجهیزات جدید را طوری نصب کرد که از حاشیهٔ ایمنی، همچون افزونگی و مدت‌زمان پشتیبانی نکاهد؟
  • آیا پس از این نصب، هنگام رخ‌دادن خرابی یا هنگام تعمیر و نگهداری، همچنان افزونگی برای توان و سرمایش خواهیم داشت؟
  • آیا با استفاده از زیرساخت‌های فعلی برق مرکزداده و سرمایش، می‌توان فناوری‌های سخت‌افزاری جدید همچون سرورهای خشابی را اجرا کرد؟
  • آیا برای اینکه کارکرد مطمئن باشد، پخش‌کردن سرورهای خشابی در میان سایر تجهیزات ضروری است؟
  • چه‌زمانی ظرفیت زیرساخت فعلی برق و سرمایش به پایان می‌رسد و به ظرفیت بیشتر نیاز خواهد شد؟

ناتوانی از پاسخ‌دادن به چنین پرسش‌های ساده‌ای بسیار همه‌گیر است. با اینکه درک مدیران از بهره‌وری ابتدایی است، به نظر می‌رسد اغلب مراکزداده‌ای که برای ظرفیت بیشتر از نیاز طراحی شده‌اند یا آن‌ها که با کمتر از ظرفیت کار می‌کنند و حاشیهٔ ایمنی خوبی دارند، کارکردشان موفقیت‌آمیز است. با این حال چنین سروسامان‌دادن ناآگاهانه‌ای، پایایی سیستم (Availability) را کاهش می‌دهد و ممکن است به ازکارافتادگی‌های کوتاه‌مدت اما قابل تحمل بینجامد. باید دانست که استفاده از برآورد بیشتر از نیاز (Oversizing)، در کوتاه‌مدت بهینه و مقرون‌‌به‌صرفه نیست. ولی حاشیهٔ ایمنی را فراهم می‌کند؛ تا هنگامی که ظرفیت موجود با مقدار ظرفیتی که برای استفاده ضروری است برابر بشود. امروزه سایهٔ عوامل زیر که بر مراکزداده سنگینی می‌کند، نشان می‌دهد روش‌های عملیاتی فعلی ناکارآمد هستند:

  • تجهیزات فاوا با ظرفیت بسیار زیاد
  • ضرورتِ مهارکردن بهای تمام‌شده (TCO) و ضرورت بهره‌گیری از تمام ظرفیت مرکزداده
  • سرعت تغییرات ناشی از مجازی‌سازی و به‌روزرسانی چرخهٔ تجهیزات فاوا

این عوامل استفاده از کارکرد پیش‌بینی‌پذیرتر را برای مرکزداده لازم می‌کنند.

تجهیزات فاوا با ظرفیت بسیار زیاد

عامل ۱ موثر بر مرکز داده : تجهیزات فاوای با ظرفیت بسیار زیاد

تجهیزات فاوا اگر بیش از ۸ کیلووات در رک برق مصرف کنند، پرظرفیت به شمار می‌آیند. هر رک که با سرور پر شده باشد، از ۶ تا ۳۵ کیلووات برق مصرف می‌کند. با این حال بیشتر مراکزدادهٔ امروزی برای توان مصرفیِ کمتر از ۴ کیلووات در رک طراحی شده‌اند. چنان‌که پیش‌تر گفته‌ایم، به‌شکل روزافزون در مرکزداده تجهیزاتی نصب می‌شود که توان مصرفی آن‌ها بیشتر از ظرفیت طراحی است. بدین ترتیب نخست سیستم‌های برق و سرمایش دچار اضافه‌بار و گرمای بیش از حد می‌شوند، آنگاه افزونگی از دست می‌رود، سپس ازکارافتادگی رخ می‌دهد. بهره‌برداران دربارهٔ چگونگی و محل نصب مطمئنِ این تجهیزات در مرکزدادهٔ فعلی و جدید، نیازمند به اطلاعات مفیدتری هستند.

بهای تمام‌شده (TCO)

عامل ۲ موثر بر مرکز داده : محدودیت بهای تمام‌شده

افزایش هزینهٔ طراحی یا برآورد بیشتر از نیاز، در مرکزدادهٔ اغلب کسب‌وکارها پذیرفته نیست. در چنین مواردی، هدررفت هزینهٔ سرمایه‌ای و هزینهٔ عملیاتی دارای اهمیت است. می‌توان در مرکزدادهٔ معمول امروزی اگر به‌خوبی مدیریت بشود، تقریبا بدون اینکه ظرفیت سرمایش و برق تاسیسات افزایش یابد، تجهیزات فاوا را تا ۳۰ درصد افزایش داد. ولی نمی‌توان تمام ظرفیت موجود برق و سرمایش را به کار گرفت. چنین تاسیساتی نسبت به سیستم‌هایی که ظرفیت در آن‌ها به‌خوبی مدیریت می‌شود، بهره‌وری کمتری دارند و بیش از ۲۰ درصد بیشتر برق مصرف می‌کنند. ابزارهای مدیریت ظرفیت کمک می‌کنند از منابع برق و سرمایش بهتر استفاده شود و مصرف برق کاهش یابد.

سریع‌بودن تغییرات

عامل ۳ موثر بر مرکز داده : تغییرات سریع

تجهیزات فاوای مرکزدادهٔ معمول پیوسته در تغییرند. چرخهٔ عمر به‌روزرسانی تجهیزات، اغلب کمتر از سه سال است و هر روز تجهیزاتی اضافه یا کم می‌شود. افزون بر آن، الزامات برق و سرمایش در خودِ دستگاه‌های فاوا ثابت نیست. مجازی‌سازی و قابلیت‌های مدیریت که سازندگان تجهیزات ارائه می‌کنند، دقیقه‌به‌دقیقه آن را تغییر می‌دهد. روش قدیمی «امتحان کن ببین نتیجه می‌دهد یا نه!» دیگر در اجرای تجهیزات فاوا کاربرد ندارد؛ زیرا اغلب به بروز گرمای بیش از حد می‌انجامد. ابزارهای مدیریت ظرفیت باید قابلیت برنامه‌ریزی آنی را برای رویارویی با این چالش‌ها داشته باشند. چنین قابلیتی باید مقرون‌‌به‌صرفه، آسان برای نصب و استفاده، همچنین از پیش طراحی‌شده باشد. برای درک بهتر تاثیر مجازی‌سازی و رایانش ابری بر زیرساخت فیزیکی و نحوهٔ مدیریت آن، به مقالهٔ «مجازی‌سازی و رایانش ابری: بهینه‌سازی برق و سرمایش و مدیریت بیشینهٔ مزایا» [3] مراجعه کنید.

عرضه و تقاضای ظرفیت

برای یافتن پاسخ‌های ساده به پرسش‌های اساسی کاربران، می‌باید رویکرد روشمند در مدیریت ظرفیت داشت. پایه و اساس مدیریت ظرفیت، قابلیت سنجش مقدار عرضه و تقاضای برق و سرمایش است.

 گزارش از عرضه و تقاضای برق و سرمایش، در سطح سالن یا تاسیسات مفید است. ولی از این دو سطح، جزئیات کافی به دست نمی‌آید تا بتوان با آن‌ها به پرسش‌های ناشی از اجرای خاصی از تجهیزات فاوا پاسخ داد. از سوی دیگر همراه با گزارش‌های عرضه و تقاضایی که در سطح دستگاه‌های فاوا هستند، جزئیات اضافی و غیرضروری ارائه می‌شود. تهیهٔ این گزارش‌ها نیز کار دشواری است. سطح موثر و عملی برای اندازه‌گیری و بودجه‌بندی ظرفیت برق و سرمایش، همان سطح رک است. ما در این مقاله همین روش را به کار می‌بریم.

سنجش عرضه و تقاضای مرکز داده در سطح رک
شکل ۱ – مقاله ۱۵۰

در مدلی که در این مقاله توضیح می‌دهیم، کمیت‌های عرضه و تقاضای برق و سرمایش در سطح رک، به چهار روش اصلی تعیین می‌شوند:

  • بیشینهٔ تقاضای احتمالی به‌شکل پیکربندی‌شده
  • تقاضای واقعی کنونی
  • بیشینهٔ عرضهٔ احتمالی به‌شکل پیکربندی‌شده
  • عرضهٔ واقعی کنونی

شکل ۱: سنجش عرضه و تقاضا در سطح رک

با چنین اطلاعاتی می‌توان توصیف کاملی از وضعیت کنونیِ برق و سرمایش مرکزداده در سطح رک به دست آورد. در ادامه به این توصیف‌ها می‌پردازیم. (شکل ۱)

پیکربندی متداول برمبنای بیشینهٔ «تقاضای احتمالی» برق و سرمایش

اگر سرورهای مدرن با این پیکربندی کار کنند، ممکن است مصرف برق در حین عملیات معمول تا بیش از ۵۰ درصد کاهش یابد. این پیکربندی در واقع برای اوج مصرف طراحی شده است. ولی آن را با درنظرگرفتنِ تفاوت کارکرد سرورها در حالت‌های مختلف و با بررسی روندهای جاری یا با گزارش‌گیری مستقیم از تجهیزات فاوا انجام می‌دهند.

بیشینهٔ مقدار تقاضای برق و سرمایش، همواره مساوی یا بیشتر از تقاضای واقعی برق و سرمایش است. در حوزهٔ مدیریت ظرفیت، این اطلاعات تعیین‌کننده محسوب می‌شوند.

«تقاضای واقعی» برق و سرمایش کنونی

این همان مقدار برق مصرف‌شده و گرمای تولیدشده، در سطح رک، در هر نقطهٔ زمانی مشخص است. در حالت مطلوب، این مقدار را با اندازه‌گیری آن‌به‌آن مصرفِ برق محاسبه می‌کنند. مقدار مصرف برق به‌وات، در بیشتر تجهیزات با مقدار گرمای تولیدشده به‌وات برابر است [مطالعهٔ بیشتر]. در دیگر تجهیزات همچون UPS، واحد توزیع برق (PDU)، دستگاه تهویهٔ مطبوع، روترهای VoIP، مقدار وات گرمای خروجی با وات مصرف برق برابر نیست؛ ولی می‌توان مقدار گرما را با روش‌های ریاضی اندازه‌گیری کرد. مصرف برق رک را همچنین از سیستم توزیع برق می‌توان به دست آورد. یا مقدار برق را از خود تجهیزات فاوا دریافت کرد و مقادیری را که هر مجموعه از دستگاه‌های فاوای داخل هر رک گزارش می‌دهند، با هم جمع کرد و برق مصرفی رک را به دست آورد.

پیکربندی متداول برمبنای بیشینهٔ «عرضهٔ احتمالی» برق و سرمایش

این پیکربندی چنین تعریف می‌شود: مقداری از برق و سرمایش که تجهیزات زیرساختیِ نصب‌شده در سطح رک تامین می‌کنند. عرضهٔ احتمالی برق و سرمایش، همواره مساوی یا بیشتر از مقدار عرضهٔ واقعی آن است. سیستمی که بیشینهٔ عرضهٔ احتمالی برای مقداری از مصرف آن، از عرضهٔ واقعی آن مقدار مصرف بیشتر باشد، بهینه نخواهد بود. چنین حالتی را عوامل مختلف پیش می‌آورند:

  • مسدود شدن فیلترهای هوای سیستم سرمایش
  • کاهش قابلیت دفع گرما به‌دلیل پیش‌آمدن وضعیت ویژهٔ آب‌وهوایی
  • ازکارافتادن ماژول برق در UPS ماژولار

یکی از کارکردهای مهم سیستم‌های مدیریت ظرفیت، تشخیص‌دادن هنگامی است که عرضهٔ واقعی از اندازه‌ای که در طراحی پیش‌بینی‌شده کمتر می‌شود. همچنین باید کمک کنند تا دلیل کاستی‌هایی آشکار گردد که باعث می‌شود ظرفیت طراحی فراهم نشود.

عرضهٔ «واقعی کنونی»

عرضهٔ واقعی برق و سرمایش در رک، از اطلاعاتی به دست می‌آید که به معماری توزیعِ سیستم برق و سرمایش مرکزداده، ظرفیت واقعی کنونیِ منابع کلی برق و سرمایش، همچنین تاثیرات ظرفیت موجود بر دیگر مصارف ارتباط دارد.

عرضهٔ واقعی برق در هر رک، با دانستن ظرفیت شاخه‌مدار موجود در همان رک تعیین می‌شود که با میزان پایایی منابع برقِ استفاده‌نشدهٔ بالادستی مانند PDUها و UPS محدود می‌شود. در بعضی موارد، ظرفیت قابل استفاده با طراحی یا پیکربندی سیستم برق محدود می‌شود. برای نمونه، تجهیز سیستم ماژولار ممکن است کامل نباشد یا برای ورودی‌های دو مسیره طراحی شده باشد.

معمولا تعیین‌کردن عرضهٔ واقعی سرمایش در رک، از تعیین‌کردن عرضهٔ برق پیچیده‌تر و بسیار وابسته به معماری هوارسانی است. برخلاف معماری برق که جریان الکتریکی به درون کابل‌ها محدود می‌شود، جریان هوا معمولا چنین است که نخست به گروهی از رک‌ها می‌رسد، آنگاه در میان تجهیزات فاوا متناسب با قدرت مکندگی فن‌ها توزیع می‌شود. بدین ترتیب محاسبهٔ ظرفیت هوا پیچیده‌تر است و به مدل‌های کامپیوتری پیشرفته‌تری نیاز دارد. اگر هوای رفت یا برگشت به‌شکل مستقیم از طریق کانال‌ها به رک‌ها‌ هدایت بشود، ظرفیت منبع سرمایش رک بهتر است و با دقت‌ بیشتری محاسبه می‌شود.

انواع ظرفیت در سطح سیستم

تقاضای برق و سرمایش در سطح رک، مطابق با شکل ۲ تعیین می‌شود. پیش‌تر گفتیم که مقدار عرضه نیز باید درک شود و در سطح رک معین گردد. سیستم عرضهٔ برق و سرمایش به‌شکل رک‌به‌رک تعیین نمی‌شود؛ بلکه سلسله‌‌مراتبی است و از دستگاه‌های تامین برق همچون UPS و PDU و نیز دستگاه تهویهٔ مطبوع تعیین می‌گردد که از گروهی از رک‌ها پشتیبانی می‌کنند. دستگاه‌های تامین برق و سرمایشِ کلی، مانند پست برق یا برج خنک‌کننده نیز به‌نوعی برای رک منبع عرضهٔ ظرفیت محسوب می‌شوند که باید بتوانند تقاضا را تامین کنند. ازاین‌رو افزون بر سنجش ظرفیت منابع برق و سرمایش در سطح رک، برآورد در سطح کلی نیز باید انجام شود و مقدار آن مطابق با دستگاه‌های عرضه‌کننده محاسبه گردد.

منشأ تقاضا در برابر منشأ عرضه در مرکز داده
شکل ۲ – مقاله ۱۵۰

شکل ۲: منشأ تقاضا در برابر منشأ عرضه

برای اینکه مرکزداده دچار ازکارافتادگی نشود، همیشه باید عرضه با تقاضا برابر یا از آن بیشتر باشد. این ضرورت را همچنین باید در سطح هریک از رک‌ها و برای دستگاه‌های تامین‌کنندهٔ گروهی از رک‌ها فراهم کرد. در نتیجه تا وقتی که عرضهٔ کلی برابر با تقاضای کلی یا بیشتر از آن باشد، در هر زمانِ مشخص همواره ظرفیت مازاد موجود است.

شکل ۳: انواع ظرفیت مازاد

انواع ظرفیت مازاد مرکز داده
شکل ۳ – مقاله ۱۵۰

ظرفیت مازاد برای تامین اهداف مدیریت ظرفیت، چهار نوع متفاوت دارد که عبارت‌اند از:

  • ظرفیت ذخیره (Spare Capacity)
  • ظرفیت آماده‌به‌کار (Idle Capacity)
  • ظرفیت حاشیهٔ ایمنی (Safety Margin Capacity)
  • ظرفیت بی‌فایده (Stranded Capacity)

در ادامه دربارهٔ هریک از انواع ظرفیت مازاد توضیح می‌دهیم (شکل ۳).

ظرفیت ذخیره

ظرفیت ذخیره ظرفیت مازادِ واقعی و موجود را برای استفادهٔ تجهیزات جدید فاوا فراهم می‌کند. اجراکردنِ ظرفیت ذخیره، هزینهٔ سرمایه‌ای و عملیاتی زیادی دارد که دلیل آن خریدن تجهیزات برق و سرمایش و نگهداری از آن‌ها است. افزون بر این، ظرفیت ذخیره همواره از بهره‌وریِ عملیاتی مرکزداده می‌کاهد و مصرف برق را افزایش می‌دهد.

معماری کارآمدِ مدیریت ظرفیتِ مرکزدادهٔ در حال رشد و تغییر، انواع مشخصی از ظرفیت ذخیرهٔ مقرون‌به‌صرفه دارد؛ مانند تامین ظرفیت‌ اضافه با اتصال به شبکهٔ توزیع برق. البته در حالت مطلوب، تجهیزات برق و سرمایش فقط در زمان و در جایی نصب می‌شوند که پیش‌تر نیاز به تقاضای روبه‌رشد به وجود آمده باشد.

سیستم مدیریت ظرفیتِ موثر باید برنامهٔ رشد و توسعه را در نظر بگیرد و مقدار آن را مشخص نماید. برای اطلاع بیشتر دربارهٔ برنامهٔ رشد و توسعه به مقالهٔ «پروژه‌های مرکزداده: مدل رشد» [4] مراجعه کنید.

ظرفیت آماده‌به‌کار

ظرفیت آماده‌به‌کار ظرفیت مازادِ واقعی و موجود برق و سرمایش است که برای مقدار بیشینهٔ احتمالیِ تقاضای پیکربندی‌شده فراهم می‌شود. تجهیزات فاوای فعلی، در هنگام اوج مصرف به این ظرفیت نیاز دارند. به همین دلیل نیز نمی‌توان آن را برای تامین ظرفیتی به کار برد که اجرای تجهیزات جدید فاوا نیاز دارد.

ظرفیت آماده‌به‌کار مشکلی روبه‌رشد شمرده می‌شود که از کارکردهای مدیریت برق و جریان اتوماتیک VMها در تجهیزات فاوا ناشی می‌شود. این نوع از ظرفیت باید برای هنگامی مهیا باشد که تجهیزات فاوا با توان مدیریت‌شده به‌حالت پرمصرف درمی‌آیند.

ظرفیت حاشیهٔ ایمنی

ظرفیت مازادِ حاشیهٔ ایمنی، برنامه‌ریزی می‌شود تا برق و سرمایش برای بیشترین مقدار احتمالی تقاضایِ پیکربندی‌شده مهیا باشد. وجود این حاشیهٔ ایمنی امکان می‌دهد هنگامی که خطاهای کوچک در تنظیم بیشینهٔ تقاضای احتمالیِ برق و سرمایش رخ می‌دهد یا تجهیزات فاوا به‌اندازهٔ غیر مجاز افزایش می‌یابند، سیستم همچنان بتواند تداوم کارکرد خود را حفظ کند. حاشیهٔ ایمنی در بازهٔ ۱۰ تا ۲۰ درصد معمول است. ولی اگر روش‌های نظارت بر تغییراتِ مرکزداده کارآمد نباشند، ممکن است تا بیش از ۳۰ درصد نیز برسد. این ظرفیتی است که نباید برای اجرای تجهیزات فاوا به کار رود.

ظرفیت بی‌فایده

ظرفیت بی‌فایده ظرفیتی است که به‌دلیل نوع طراحی یا پیکربندی سیستم، از دسترس استفادهٔ مصارف فاوا به‌دور مانده است. وجود آن نشان‌دهندهٔ نبودن ظرفیت در یک یا چند بخش زیر است:

  • فضای رک یا کف طبقه
  • برق
  • توزیع برق
  • سرمایش
  • هوارسانی

هر دستگاه فاوا، به‌مقدار کافی از همهٔ این پنج نوع ظرفیت نیاز دارد. با این حال این ظرفیت‌ها هرگز با تعادلِ درست و به‌شکل سازگار با هریک از مصارف فاوا، در دسترس نیستند. همیشه در رک جاهایی هست که سرمایش کافی به آن نمی‌رسد. یا جاهایی که برق دارد؛ ولی فضای کافی برای نصب مصارف ندارد. ظرفیت بی‌فایده همان نوع ظرفیتی است که بی‌استفاده باقی می‌ماند؛ به این دلیل که از چهار ظرفیت پیش‌گفته تا بیشترین مقدار ممکن استفاده شده است. وجود ظرفیت بی‌فایده نامطلوب است و امکان دارد بر عملکرد مرکزداده تاثیر کاهندهٔ زیادی بگذارد. متاسفانه بیشتر مراکزداده به مشکلات بسیاری در زمینهٔ ظرفیت بی‌فایده دچار هستند. اشکال‌های زیر نمونه‌ای از آن‌ها است:

  • دستگاه تهویهٔ مطبوع ظرفیت کافی دارد؛ ولی هوارسانی به مصارف فاوا کافی نیست.
  • دستگاه PDU ظرفیت کافی دارد؛ ولی برای قرار دادن کلیدهای قطع مدار جای کافی وجود ندارد.
  • فضای استفاده‌نشده در طبقه وجود دارد؛ ولی ظرفیت برق برای نصب تعداد بیشتری از تجهیزات باقی نمانده است.
  • دستگاه‌های تهویهٔ مطبوع در مکان اشتباه قرار دارند.
  • بعضی از PDUها به اضافه‌مصرف دچار شده‌اند؛ در حالی که بقیه با مقدار اندکی بارگذاری می‌شوند.
  • برخی از قسمت‌ها دچار گرمای بیش از حد شده‌اند؛ ولی بخش‌های دیگری در محیطِ خنک هستند.

استفاده از این نوع ظرفیت ممکن است بسته به موقعیت و معماری سیستم برق و سرمایش میسر نباشد. از سوی دیگر ممکن است بتوان با کمی سرمایه، به‌شکل موثر آن را به کار گرفت. ظرفیت بی‌فایده چنان‌که که از نام آن نیز پیدا است، هزینه‌بر است. معمولا باید بخشی از تجهیزات نصب‌شده را برداشت یا اجزای جدیدی به برق و سرمایش اضافه کرد.

این نوع ظرفیت برای بهره‌برداران مرکزداده دشواری مهمی در کار مدیریت ظرفیت است. به‌سختی می‌توان برای کاربران یا مدیران روشن ساخت مرکزداده‌ای که با ظرفیت برق و سرمایش ۱ مگاواتی نصب‌شده است، چگونه هنگامی که تنها با ۲۰۰ کیلووات از مصرف کلی کار می‌کند، نمی‌تواند سرورهای جدید خشابی را خنک کند.

سیستم کارآمدِ مدیریت ظرفیت، افزون بر اینکه ظرفیت بی‌فایده را شناسایی و آشکار می‌سازد، همچنین به مشتریان کمک می‌کند از همان اول جلویش را بگیرند.

مدیریت ظرفیت

در بخش پیشین چهارچوبی برای سنجش عرضه و تقاضای برق و سرمایش ارائه کردیم. اکنون می‌توان بر مبنای اندازه‌گیری‌هایی که کارشناسان انجام داده‌اند و با یافته‌های این مقاله نیز ترکیب شده است، یک سیستم مدیریت ظرفیت برق و سرمایش پیش‌بینی کرد که در واقع هم‌اکنون نیز در بعضی از مراکزداده به‌شکل ابتدایی به کار می‌رود. امروزه در صنعت مرکزداده شاهد پیدایش مجازی‌سازی سرورها و همچنین تجهیزات فاوایی هستیم که به‌شکل دینامیکی تقاضای برق و سرمایش خود را تغییر می‌دهند. بدین ترتیب استفاده از دستگاه‌های اندازه‌گیری الکتریکی و مکانیکی و ابزار دقیق تحت شبکه که با نرم‌افزارهای مدیریت ظرفیت برق و سرمایش ترکیب شده‌اند، تنها راهکار عملی و ممکن محسوب می‌شود. از نگاه بهره‌برداران چنین سیستمی کارکردهای زیر را دارد:

  • ارائهٔ گزارش از ظرفیت
  • تنظیم برنامهٔ ظرفیت
  • اعلام هشدار هنگام انحراف از برنامهٔ ظرفیت
  • شبیه‌سازی تغییرات پیشنهادی

ارائهٔ گزارش از ظرفیت

این گزارش باید وضعیت کنونیِ عرضه و تقاضای مرکزداده را که شامل ظرفیت ذخیره و ظرفیت بی‌فایده و دیگر ویژگی‌های ظرفیتی پیش‌گفته است، در سطوح زیر ارائه دهد:

  • گزارش در سطح سالن (اتاق): اطلاعات دربارهٔ عرضه و تقاضای کلی و ظرفیت‌های مختلف برای تمامی محیط سالن. اغلب در آن به امکانات UPS تاسیسات، ژنراتور، چیلر، برج خنک‌کننده، همچنین پست برق بیشتر توجه می‌شود.
  • گزارش در سطح ردیف: اطلاعات دربارهٔ عرضه و تقاضای برق و سرمایشِ یک ردیف یا هر ناحیهٔ منطقی دیگر مرکزداده. اغلب با تجهیزات توزیع برق و سرمایش که چیدمان ردیفی دارند، همچون PDU یا سیستم‌های ردیفی سرمایش نیز مرتبط است. به‌ویژه هنگامی که در سطح رک، جزئیات پیکربندیِ یک رک خاص نامشخص باشد، برای اهداف برنامه‌ریزی بسیار ارزشمند است.
  • گزارش در سطح رک: اطلاعات دربارهٔ عرضه و تقاضای برق و سرمایش یک رک مشخص. داشتن این اطلاعات برای روشن‌کردن مشکلات یا ارزیابی تاثیر اجرای دستگاه فاوای مشخص ضروری است. همچنین ممکن است به مدارهای توزیع در سطح رک یا سیستم‌های سرمایش رکِ بسته نیز مرتبط باشد.
  • گزارش در سطح سازمانی: هرچه پربازده‌بودن و موثر بودنِ رایانش مهم‌تر باشد و صرفه‌جویی در بودجهٔ انرژی هرچه بیشتر برعهدهٔ عملیات مرکزداده گذاشته شود، مدیران و مسئولان دربارهٔ مصرف و ظرفیتِ استفاده‌شده در مراکزدادهٔ شرکت خود، به بینشِ بیش‌ازپیش نیازمند خواهند بود.

سیستم موثر مدیریت ظرفیت، انواع اطلاعات را در قالب مدل سلسله‌مراتبی «بالا به پایین» نمایش می‌دهد که شامل طرح گرافیکی از چیدمان مرکزداده نیز می‌شود. در شکل ۴ نمای سطح سالن و در شکل ۵ نمای سطح سازمان را مشاهده می‌کنید.

نمونه‌ای از چیدمان مرکز داده با استفاده از نرم‌افزار کارکرد مرکز داده StruxureWare اشنایدر الکتریک
شکل ۴ – مقاله ۱۵۰

نمونه‌ای از نرم‌افزار کارکرد مرکز داده StruxureWare اشنایدر الکتریک: Vizor app
شکل ۵ – مقاله ۱۵۰
شکل ۴: نمونه‌ای از چیدمان مرکزداده
با استفاده از نرم‌افزار کارکرد مرکزدادهٔ
StruxureWare اشنایدر الکتریک
شکل ۵: نمونه‌ای از نرم‌افزار کارکرد مرکزدادهٔ
StruxureWare اشنایدر الکتریک: Vizor app؛
نمایش دادهٔ ظرفیت سطح سازمان (برای موبایل و iPad)

تنظیم برنامهٔ ظرفیت

تعیین و تنظیم برنامهٔ ظرفیت باید در هنگام طراحی مرکزداده انجام بشود. هنگامی که دستگاه‌های توزیع برق و سرمایش در تاسیسات نصب می‌شوند، ظرفیت آن‌ها به شاخص اصلی برنامه‌ریزیِ ظرفیت تبدیل می‌گردد. با راهکارهای توسعه‌پذیر امروزی می‌توان برنامهٔ ظرفیت برق و سرمایش مرکزداده را چنان ترتیب داد که با طرح رشد و توسعهٔ فاوا هم‌خوانی داشته باشد. با این شیوه، هزینهٔ ظرفیت و بهره‌وری برق بهینه خواهد شد.

افزون بر فراهم‌کردن ظرفیت موثر، بسیار اهمیت دارد که ظرفیت با نیاز فاوا به‌شکل مطمئن متناسب باشد. در بسیاری از مواقع، به فراهم‌کردن ظرفیت کافیِ بیشتر توجه می‌شود؛ ولی متناسب‌بودنِ ظرفیت با نیاز واقعی فاوا از نظر دور می‌ماند. پیامد همه‌گیر چنین وضعیتی، برآورد بیشتر از نیاز و هدررفت هزینهٔ سرمایه‌ای در بخش انرژی، قراردادهای خدمات و پشتیبانی زیرساخت برق، همچنین در مصرف آب است.

ابزارهای طراحی مرکزداده به تنظیم برنامهٔ ظرفیت کمک می‌کنند و به همین دلیل نیز می‌باید با سیستم مدیریت زیرساخت‌های مرکزداده (DCIM) یکپارچه باشند. از نمونهٔ چنین ابزار نرم‌افزاری که اشنایدر الکتریک عرضه کرده، می‌توان به مجموعهٔ ابزارهای طراحی مرکزداده با عنوان InfraStruXure و دیگری StruxureWare که ویژهٔ مجموعهٔ زیرساخت فیزیکی مرکزداده است اشاره کرد.

اعلام هشدار در هنگام انحراف از برنامهٔ ظرفیت

هرگاه وضعیت محیط مرکزداده از بازهٔ مشخص‌شده در برنامهٔ مدیریت ظرفیت خارج بشود، سازوکار هشدار ظرفیت باید به کار بیفتد. هشدار را می‌توان در همان جا که رخ می‌دهد به‌شکل اخطارهای بصری یا صوتی اعلام کرد. یا از طریق ایمیل یا با سیستم پیجینگ به‌اطلاع مدیریت رساند.

هشدارهای ظرفیت با رخ‌دادن رویدادهایی اعلام می‌شود که کاربر از پیش تعریف کرده است:

  • هنگامی که مصرف برق تجهیزات نصب‌شده در رک، از اندازهٔ بیشینهٔ مصرف که برنامهٔ مدیریت ظرفیت برای هر رک یا هر ردیف یا سالن (اتاق) تعیین کرده است بیشتر بشود.
  • هنگامی که به‌دلیل ازکارافتادگی یا رخ‌دادن اشکال در زیرسیستم‌های برق یا سرمایش، کمبود ظرفیت در سطح رک یا ردیف یا سالن رخ دهد.
  • هنگامی که سیستم‌های برق یا سرمایش از تامین افزونگی معین‌شده در برنامهٔ مدیریت ظرفیت ناتوان شوند.
StruxureWare Data Center Expert نمونه‌ای از سیستم نظارت مرکزی مرکز داده
شکل ۶ – مقاله ۱۵۰

شکل ۶: StruxureWare Data Center Expert نمونه‌ای از سیستم نظارت مرکزی

در بسیاری از رویدادهای پیش‌گفته، در واقع هیچ اشکال سخت‌افزاری بروز نکرده است. سیستم نظارت سنتی در چنین حالتی، رخداد غیرمعمول تشخیص نمی‌دهد. در واقع بیشتر هشدارهایی که سیستم مدیریت ارسال می‌کند، ماهیت تحلیل رویداد و آینده‌نگرانه یا پیشگیرانه دارد. باید توجه داشت که سیستم مدیریت ظرفیت در مرکزداده ابزارهای نظارتی دیگر را تکمیل می‌کند؛ مانند: خطای آنی، امنیت، نشت آب، دما. نمونه‌ای از سیستم نظارتی که هشدارهای آنی را هم‌زمان با هشدارهای مدیریت ظرفیت ارسال می‌کند StruxureWare Central عرضه‌شده توسط اشنایدر الکتریک است (شکل ۶).

شبیه‌سازی تغییرات پیشنهادی

سیستم شبیه‌سازِ موثر DCIM، افزون بر تعیین وضعیت کنونی باید قابلیت تحلیل ظرفیت در وضعیت پیشین و وضعیت فرضی پیشنهادی را نیز داشته باشد. این سناریوها ممکن است شامل موارد زیر باشد:

  • شبیه‌سازی حالت خرابی؛ همچون ازکارافتادن یک یا چند دستگاه در بخش برق یا سرمایش
  • تحلیل رشد برنامه‌ریزی‌شده؛ با درنظرگرفتن مصرف واقعی ظرفیت
  • ارائهٔ پیشنهاد دربارهٔ افزودن یا حذف یا جابه‌جایی تجهیزات
  • استخراج رویکرد بر اساس پیشینهٔ دادهٔ موجود
نرم‌افزار کارکرد مرکز داده StruxureWare اشنایدر الکتریک
شکل ۷ – مقاله ۱۵۰

شکل ۷: نرم‌افزار کارکرد مرکزداده StruxureWare اشنایدر الکتریک. این ابزار قابلیتی دارد که تغییر تجهیزات فاوا را به‌شکل بهینه‌ و سریع و آسان ممکن می‌سازد.

کارکردهای مدیریت ظرفیتِ زیرساخت فیزیکی باید بتواند این سناریوها را با برنامهٔ فعلی مقایسه کند و بسنجد. کاربر می‌باید با مدل کارآمد راهنمایی شود تا از میان این گزینه‌ها بهترین سناریو را انتخاب کند؛ برای نمونه برای حداکثر کردن بهره‌وری برق، یا اشغال کمترین فضای کف. شکل ۷ نمونه‌ای است از اینکه چگونه می‌توان با نظر به DCIM مطمئن شد برای اضافه‌کردن تجهیزات جدید فاوا در مکان مشخص‌شده، منابع برق و سرمایش و فضای کافی وجود دارد. این کار به اعمال تغییر در تجهیزات کمک می‌کند.

نظارت بر برق و سرمایش دستگاه‌های فاوا

در راستای اغلب اهداف، ممکن است رک به نظر جعبهٔ سیاهی برسد که برق مصرف می‌کند؛ بدون اینکه از مقدار مصرف و نوع یا مکان دستگاه‌های فاوای درون آن اطلاعی در دست باشد. تا زمانی که مصرف برق به‌شکل مستقیم از سطح رک اندازه‌گیری می‌شود، وابستگیِ سیستم مدیریت ظرفیتِ پیش‌گفته به اطلاعاتی که از تجهیزات به دست می‌آید اندک است. با مشخص‌بودن مقدار مصرف برق می‌توان الزامات سرمایش را دقیق‌تر تخمین زد. تا هنگامی که مقادیر سطح رک در بازهٔ تعریف‌شده و سازگار با برنامهٔ ظرفیت باشند، برای اطمینان‌یافتن از اینکه سیستم برق و سرمایش نیازهای ضروری را برآورده می‌کند، نیاز به هیچ اطلاعات دیگری نیست. بدین ترتیب می‌بینیم که مدیریت ظرفیت با به‌کار گرفتن ابزارهای درست، مزایای بسیاری برای عملیات فاوا دارد؛ بدون آنکه به مدیریت تخصصی دارایی برای تجهیزات فاوا نیازی باشد. بی‌شک آگاهی از اطلاعات دستگاه‌های فاوای درون رک و قابلیت پایش منظمِ مقدار مصرف انرژیِ هر دستگاه نیز مزایای خودش را دارد که عبارت‌اند از:

  • آگاهی از مشخصات مصرف برق هریک از اجزای فاوا
  • آگاهی از بیشینه و کمینهٔ تغییرات زمانیِ مصرف برق هریک از دستگاه‌ها، در بازهٔ زمانی مشخص
  • آگاهی از الزامات جریان هوای غیرمعمول یا حالت‌های غیرمعمولِ کارکرد فن
  • امکان استفادهٔ بهینه از فضای فیزیکی درون رک (ظرفیت فضا)
  • امکان ارزیابیِ دقیق تاثیرات ناشی از کم و زیاد کردن یا تغییردادن تجهیزات

برای استفادهٔ کارآمد از دانش به‌دست‌آمده از مدیریت تخصصی دارایی، باید داده (Data) در سیستم مدیریت ظرفیت به‌درستی درک شود.

خلاصه‌ای از سیستم قدرتمند مدیریت ظرفیت مرکز داده
شکل ۸ – مقاله ۱۵۰

شکل ۸: خلاصه‌ای از سیستم قدرتمندِ مدیریت ظرفیت

به‌طور کلی بیشتر مراکزدادهٔ کوچک تا متوسط، برای تغییر وضعیت به بلوغ فرایند نرسیده‌اند و کارکنانی در اختیار ندارند که از فهرست نصب تجهیزات فاوا در رک نگهداری کنند. ازاین‌رو نباید سیستم مدیریت ظرفیت به این اطلاعات وابستگی داشته باشد؛ ولی باید بتواند هرگاه به آن‌ها دسترسی داشت، بیشترین بهره را ببرد. مدیریت سادهٔ ظرفیت همگام با رشد و توسعهٔ سازمان‌ها، به راهکارهای دقیق‌تری تبدیل می‌شود که مدیریت تغییرات و دارایی نیز از آن جمله است. تعامل میان مدیریت تغییرات و مدیریت ظرفیت به‌شکل دوسویه و مستقیم است. زیرا مدیریت تغییرات برای اینکه بتواند تاثیر تغییرات پیشنهادی را پیش‌بینی کند، به اطلاعات مدیریت ظرفیت بسیار وابسته است.

نتیجه‌گیری

برای داشتن برنامه‌ریزی و عملیاتِ موثر بر مرکزداده، «مدیریت ظرفیت» بخش ضروری است. ضرورت بهره‌گیری از آن با افزایش چگالی و اندازه و پیچیدگیِ مرکزداده بیشتر می‌شود. در این مقاله یکی از روش‌های مدیریت ظرفیت را بیان کردیم. نشان دادیم که مدیریت ظرفیت به اطلاعات جزئی و دقیق دستگاه‌های فاوا در سطح رک، وابسته نیست. افزون بر این چنانچه آن را با سیستم‌های سنتی مدیریت دارایی مقایسه کنیم، می‌بینیم که هم بسیاری از مزایای اصلی را دارد و هم برای اجرا و نگهداری ساده‌تر است. اگر مدیریت ظرفیت مطابق با روش این مقاله اجرا بشود، اطلاعاتی راهگشا از وضعیت مرکزداده به دست می‌آید که با سیستم‌های نظارت سنتی فراهم‌شدنی نیست. امروزه می‌توان سیستم‌های نرم‌افزاری DCIM را با تجهیزات اندازه‌گیری برق و سرمایش ترکیب کرد و ابزار ضروری را برای مدیریت موثر و کارآمد ظرفیت فراهم ساخت. چنین ابزاری ویژگی «out of the box» دارد که از هرگونه تغییر و پیکربندی بی‌نیاز است و پس از پایان نصب بی‌درنگ کار خود را آغاز می‌کند.

پانویس

[1] این مطلب بخشی از کتاب «آئین‌نامهٔ مهندسی مرکزداده» و ترجمهٔ فارسی مقالهٔ زیر است:

APC White Paper 150: “Power and Cooling Capacity Management for Data Centers” (Revision 3)

نویسنده نیل راسموسن (Neil Rasmussen) [آشنایی با نویسنده و مطالعه‌ی مقالات فارسی او]، مترجم نازلی مجیدی، بازنویسی و ویراستاری پرهام غدیری‌پور، به‌کوشش دکتر بابک نیکفام، تهیه‌شده در باشگاه مراکزداده

[2] APC White Paper 155: Calculating Space and Power Density Requirements for Data Centers

[3] APC White Paper 118: “Virtualization and Cloud Computing: Optimized Power, Cooling and Management Maximizes Benefits”

[4] APC White Paper 143: Data Center Projects: Growth Model

درج دیدگاه

برای درج دیدگاه کلیک کنید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سوال امنیتی *