مقدمه
طبق اظهارات موسسه ی Uptime (که جزیی از گروه 451 بوده) بازار سیستم های مدیریت زیرساخت ها از 500 میلیون دلار در سال 2010 تا 7.5 میلیارد دلار در سال 2020 رشد خواهد داشت.[1] مدیران اجرایی در تجارت و IT دریافته اند که با بهبود برنامه ریزی زیرساخت های فیزیکی ، پیکربندی مجدد محدود سیستم و تغییرات کوچک و محدود در فرایندها، می توان به اندازه ی صدها و هزاران دلار در هزینه های عملیاتی و انرژی صرفه جویی کرد.
سیستم هایی که شامل ابزارهای مدرن نرم افزاری در مدیریت زیرساخت های فیزیکی (که عبارتند از برق و سرمایش) مرکز داده هستند، به مدیریت این اختیار را داده تا از این صرفه جویی ها به عنوان یک اهرم مفید استفاده کنند. سیستم های گزارش دهی قدیمی که برای پشتیبانی مراکز داده های قدیمی و سنتی طراحی شده اند، برای مراکز دادهی جدید و پرسرعت امروزی که می بایست به طور مداوم تغییرات ظرفیت و مصارف دینامیکی را مدیریت کنند، کفایت نمی کنند.
برخی از اپراتورهای مرکزداده از هیچ یک از ابزارهای مدیریت زیرساخت های فیزیکی استفاده نمی کنند که این امر می تواند پر ریسک باشد. به طور مثال در یک شرکت کوچک تولیدی، اپراتوری که تنها 15 رک را تحت مدیریت خود داشته ممکن است تصور کند که با دانش سنتی و تجربی عملیاتی که در طول سالها کسب کرده است می تواند هر نوع شرایط بحرانی و تهدیدآمیزی را پاسخگو بوده و مشکلات را حل و فصل کند. اگرچه، در طول سال ها ظرفیت این 15 رک بیشتر شده و صورت حساب های انرژی افزایش یافته و سیستم های تغذیه و خنک کننده دیگر جوابگو نمی باشند. زمانی می رسد که تنها با اضافه کردن یک سرور جدید، آن شاخه مدار با اضافه مصرف مواجه شده و تمامی رک از کار خواهد افتاد.
در ابزارهای نرم افزارهای جدید مدیریتی برنامه ریزی و اجرا (به شکل 1 مراجعه شود) تخصیص برق و سرمایش (در مرحله ی برنامه ریزی) را بهبود بخشیده، در زمان خطا و از کار افتادگی قسمتی از اتاق IT (در مرحله ی عملیاتی) یک تحلیل اثر سریع فراهم آورده و از داده های پیشین (در مرحله ی تحلیل) جهت ارتقای عملکرد آینده ی اتاق IT بهره می برد.
این سه نوع از ابزارهای برنامه ریزی و اجرا(برنامه ریزی، عملیات و تحلیل) در قسمت های بعدی این مقاله توضیح داده خواهد شد. ابزارهای تجهیزات نرم افزاری مرکز داده ( به طور مثال سیستم های مدیریت ساختمان) در این مطلب نمی گنجد. برای تعریف و توضیح ابزارهای نرم افزار زیرسخت های فیزیکی که در دیگر تجهیزات مرکز داده وجود داشته و همچنین مجموعه ی زیر ساخت ها و زیر سیستم ها IT، به گزارش “طبقه بندی ابزارهای نرم افزاری مدیریت مرکز داده”[2] مراجعه شود.
شکل 1: ابزارهای نرم افزاری مطرح شده در این مقاله، زیرمجموعهای از برنامه ریزی و اجرا میباشد.
بعضی از مدیران مرکز داده، هرگز نسل اول از ابزارهای مدیریت زیرساخت های فیزیکی را نپذیرفته و از آن استفاده نکردند چرا که این ابزارها دامنه ای محدود داشته و به طور قابل ملاحظه ای بر مداخله ی نیروی انسانی وابسته بودند. این نسل اول از ابزارها یک لیست پیش فرض از دستگاه ها ایجاد کرده و چنانچه دمای ورودی CRAC، از آستانه ی معین شده فراتر رود، هشدار خواهد داد. اپراتور مجبور است به تنهایی در یابد که خطا در کدام یک از دستگاه ها رخ داده است. این ابزارها از ایجاد همبستگی بین دستگاه زیرساخت فیزیکی و سرور ناتوان بوده و همچنین قادر نبوده اند اقدامات اولیه جهت پیشگیری از خرابی مانند بالا بردن سرعت فن ها برای کاهش حرارت در یک نقطه، را آغاز کنند.
ابزارهای جدید مدیریت به گونه ای طراحی شده اند که مشکلات را با کمترین تکیه بر مداخله ی نیروی انسانی تشخیص داده و حل کنند.امروزه ابزار های DCIM با ایجاد ارتباط و اتصال بین منابع تغذیه، خنک کننده و فضا با هر سرور، قادرند به طور فعالانه در مورد مشکلات احتمالی در زیرساخت های فیزیکی و نحوه ی تاثیر آن ها بر مصرف IT مشخص، به سیستم های مدیریت IT اطلاع دهند. با توجه به ظرفیت های دائما متغیر برق و سرمایش، این آگاهی به موقع از مشکلات به خصوص در محیط های ابری مجازی و بسیار دینامیکی، در قرارگیری سرور ها اهمیت بسیار زیادی دارد.
این ابزارهای هوشمند و پیشرفته همچنین کمک می کنند تا پیش از آن که تصمیمات مرتبط با برنامهی آمادهسازی گرفته شود، در مورد خطوط کسب و کار و عواقب اقدامات صورت گرفته در آن اطلاع رسانی شود. به طور مثال، تصمیمات کسب و کار که منجر به صرف بیشتر انرژی در مرکز داده می شود، بر تاثیرات کربن و مالیات کربن تاثیر خواهد داشت. همچنین با وجود این ابزارهای جدید استرداد وجه انرژی مصرف شده امکان پذیر بوده که این امر روش های اتخاذ تصمیماتی را که به هماهنگی نتایج کسب و کار با مصرف انرژی مربوط است، تغییر می دهد.
برنامهریزی: پیامد/تاثیر تصمیمات
ابزارهای جدید نرم افزار برنامه ریزی با استفاده از UI، شرایط فیزیکی فعلی مرکز داده را نشان داده و تاثیراتی که براساس تجهیزات فیزیکی آینده اضافه شده و تغییرات ایجاد شده را شبیه سازی می کند. این توانایی به بعضی از سوالات رایج در بحث برنامه ریزی پاسخ می دهد. (به شکل 2 مراجعه شود.) به طور مثال، ابزارهای مدرن در برنامه ریزی می توانند تاثیر یک سرور فیزیکی جدید را بر توزیع برق و سرمایش پیش بینی کنند. ابزارهای نرم افزار برنامه ریزی می توانند تاثیر حرکات و تغییرات را بر فضای مرکز داده ها و همچنین بر ظرفیت های برق و سرمایش محاسبه کنند.
سوالات رایج پاسخ داده شده توسط ابزار برنامه ریزی: · سرور مجازی و یا فیزیکی بعدی در کجا قرار داده خواهد شد؟ · آیا در زمان تعمیرات و نگهداری و یا خرابی، همچنان افزونگی برق و سرمایش را خواهم داشت؟ · آیا برای داشتن عملیات قابل اعتماد، به گسترش سرورهای تیغهای نیاز دارم؟ · یک سرور جدید چگونه بر شاخه مدار خود اثر خواهد گذاشت؟ · تاثیر تجهیزات جدید بر افزونگی من و حاشیه ی امن، چه خواهد بود؟ · آیا تجهیزات برق و سرمایش موجود ظرفیت جایگیری یک تکنولوژی جدید را دارند؟ |
شکل 2: سوالات متداول در برنامه ریزی
علایم برنامه ریزی ضعیف
مثال های آورده شده نشان از انواع مشکلات و موضوعاتی دارند که در نتیجه ی یک برنامه ریزی ضعیف ایجاد می شوند:
- یک ارزیابی اخیر در تجهیزات برق و سرمایش یک مرکز داده نشان داده است که در سطح کف طبقه که می بایست سرد باشد، تعداد زیادی نقاط پرحرارت وجود داشته است. از سوی دیگر، بقیه ی سطوح که انتظار می رفت گرم باشند، سرد بودند. علت آن این بود که اگرچه مرکز داده دارای ظرفیتی با کیلووات کافی بوده، ولی در مورد جایگیری تجهیزات هیچ برنامه ریزی واقعی صورت نگرفته است. با وجودی که ظرفیت و حجم هوا کافی بوده ولی توزیع و جریان هوا ناکافی بوده است.
- یک رک از سرورها در حینی که یک مدیر IT به طور ناخواسته موجب ایجاد اضافه بار بر یک سیم رابط برق که قبلا اشباع شده بود شد، گم شد.
- درایوها و حافظه های برداشته شده از سرورها که برای یک پروژه ی نصب خریداری شده بودند، برای یک پروژه ی دیگر مدیر اختلاس شده است. هیچ ابزار نظارت و ارزیابی مدیریتی وجود نداشته که اقداماتی مانند برداشتن تجهیزات از یک رک را گزارش دهد. از آنجا که هیچ ردیابی اتوماتیکی در ارزیابی رک ها صورت نمی گیرد، مشخص است که بر برنامهریزی پروژه ایراداتی وارد است. زمانی که روز نصب فرا رسید، منابع پروژه به دلیل این کمبود در تجهیزات، با هزینهی اضافی قابل توجهی مواجه شد. متاسفانه، بیشتر ساعات روز برای یافتن تجهیزات اختلاس شده هدر رفت.
- یک شرکت بزرگ تولیدکننده، مرکز داده ی خود را مجازی سازی کرده و بیشترین کاربریهای حیاتی در کسب و کار خود را در یک گروه از سرور ها، تلفیق کردند. از آنجا که در این راه، برای مجازی سازی پلتفرم هایشان(یا همان توانایی انتقال ماشین آلات مجازی(VM) خود) از مکانیسم بازیابی استفاده می کردند، تصورشان بر این بود که در مقابل خرابی و از کار افتادگی سخت افزاری مصون هستند. متاسفانه، آنها در طول برنامه ریزی شان، متوجه نشده بودند که هر یک از سرورها به یک UPS واحد وابسته بودند. این بدان معنی است که وقتی UPS از کار افتاد، هیچ UPS دیگری برای حفاظت از سرورهای متاثر از آن، در دسترس نبود.
آثار خرابی ها و تغییرات را درک کنید
مدیران اجرایی کسب و کارها و اپراتورهای مرکز داده هر دو یک هدف مشترک را دنبال می کنند که شامل حفاظت از اعتبار عملیات ها حتی در زمان بروز خطا در مرکز داده می باشد. بینش و درک درست از آثار احتمالی خطاها کمک می کند تا مدیران کسب و کارها نسبت به در دسترس بودن فرایندهای تجاری احساس امنیت کنند. مهمتر از آن، این بینش به اپراتورهای مرکز داده کمک می کنند تا در جهت کوتاه کردن زمان بهبود اوضاع پس از پیشامد مشکل و یا حتی در قدم اول در جهت پیشگیری از بروز آن ها ، گام بردارند. به عبارت ساده، ابزارهای برنامه ریزی به دوام کسب و کار و آرامش خاطر صاحبان آن کمک می کنند.
ابزارهای مدرن نرم افزار برنامه ریزی عملکردهای زیر را خواهند داشت:
- تجهیزات IT و مکان آنها در رک را به روشی گرافیکی نمایش داده که موجب می شود اپراتورها دیگر مجبور نباشند برای یافتن چنین اطلاعاتی در میان صفحات گسترده جستجو کرده و یا در مرکز داده حضور فیزیکی داشته باشند.
- آثار حرکات و تغییرات را بر روی ظرفیت برق و سیستم توزیع سرمایش را با روش بصری نمایش می دهد. (به شکل 4 مراجعه شود.) (این موجب می شود که اپراتورها از انجام محاسبات پیچیده ی ریاضی معاف شده و از پیش امدن خطاهای جدی که منجر به از کار افتادگی های غیر قابل پیش بینی شده، جلوگیری شود.)
- جهت شناسایی آثار حیاتی بر کاربردهای تجاری، عواقب و پیامدهای خرابی در سیستم های برق و سرمایش را بر تجهیزات IT شبیه سازی می کند. (این امر یک ارزیابی اساسی از ریسک ها فراهم می آورد که بیش از آن که تصمیم گیری بر پایه ی برداشت های حسی بوده، بر مبنای محاسبات علمی می باشد.)
- به مدیریت فعالانه در قالب رک ها و محدودیت های وزنی هر تایل در کف طبقه، کمک می کند. (این امر از ایجاد شرایط مخربی که یکپارچگی رک را به خطر انداخته و یا تخریب و سقوط یک رک در داخل کف کاذب آسیب دیده جلوگیری می کند.)
- فرضیه های سرمایش فضا را در مرکز داده با تقریب CFD شبیه سازی می کند. (به این وسیله تحلیلی از جریان هوا ارائه می دهد که از تحقیقات CFD قدیمی بسیار سریع تر بوده است. )
- توصیه هایی برای مکان نصب تجهیزات IT در رک ارائه می دهد. انتخاب مکان بر اساس ظرفیت های موجود فضا، مصرف برق و سرمایش و پورتهای شبکه صورت می گیرد. (این امر کمک می کند که از مشکلات ناشی از اضافه بار در نوک شبکه و یا بروز نقاط پر حرارت جلوگیری شود.)
ابزارهای برنامه ریزی کارایی عملیاتی مرکز داده را بهبود بخشیده و محیطی مناسب برای ارتقای فرایندها فراهم می آورند. سناریوی قدیمی را درنظر بگیرید که در آن اپراتور در تلاش است تا تعیین کند که آیا رکی که ظرفیت برق در آن از حد مورد انتظار فراتر رفته است، دارای نوعی مشکل و نا هنجاری بوده و یا این خطا جزیی از روند توسعه است. در این حالت، اپراتورها با برداشت های شخصی خود پیش رفته و مشکل را به حال خود رها می کردند. چنانچه اشتباه کرده بودند، دفعه ی بعدی که ظرفیت مصرف برق در آن رک فراتر از حد معمول رود، یک کلید برق جریان را قطع خواهد کرد.
زمانی که این اتفاق می افتد، تمامی سرورهای در مسیر آن کلید برق که ممکن است در حال اجرای عملیات حیاتی نیز باشند، به طور ناگهانی از کار خواهند افتاد. از سوی دیگر، ابزارهای برنامه ریزی قادرند به طور فعالانه تخصیص بار کاری در رک را شبیه سازی کرده تا پیش از آن که یک حرکت و یا تغییری اتفاق افتد، احتمال نقض آستانه ی تعریف شده توسط کاربر را بررسی کنند. برق استفاده شده توسط هر دستگاه در رک اندزه گیری شده تا در نتیجه ی آن، تصمیمات گرفته شده در مورد تعادلِ مصرف، بیش از بینش فردی، بر علم تکیه داشته باشند.
امروزه ابزارهای زیرساخت فیزیکی در دسترس از طرف یک رک که مقدم بر کلید برق قرار داده شده است، هشدارهایی می فرستند. این سیستم هشدار زودهنگام به اپراتورها این فرصت را داده تا پیش از ازکار افتادگی، تنظیمات لازم را ایجاد سازند. در مورد استفاده ی حداقل، حداکثر و متوسط برای آن رک و هر رک دیگر در مرکز داده، گزارش هایی نوشته می شود.(به شکل 3 مراجعه شود.) اگر رک به آستانه ی بالاتر از ظرفیتش نزدیک شود، گزینه های پیشبینی و شبیه سازی شدهای ارائه شده و بازبینی می شوند تا بهترین راه برای بهبود شرایط بحرانی تعیین شود. برنامه ریزی بر توانایی در شبیه سازی نتایج، طراحی ظرفیت و مدیریت فهرست ها و جریان کاری دلالت دارد.
شکل 3: جمعآوری داده برای شبیهسازی آنی(صفحهای از نرم افزار StruxureWare Data Center Operation اشنایدر الکتریک)
سناریویی را در نظر بگیرید که در آن چگونگی جایگذاری سرور فیزیکی بعدی توسط یک اپراتور تعیین می شود. در مرکز داده قدیمی و سنتی، اپراتور یک بازرسی دستی در میان رک ها انجام داده تا دریابد کجا فضای خالی و پورت شبکه برای قرار دادن سرور موجود است. ممکن است پشت رک ها را لمس کند تا مطمئن شود که حرارت بیش از حد نداشته باشد. سپس، سرور جدید را آورده و در رک قرار می دهند و به پریز وصل می کنند، با این امید که بهترین انتخاب را انجام داده و بهترین نتیجه را بگیرند.
شکل 4: ابزارهای برنامه ریزی می توانند در تحلیل آثار جابجایی و تغییرات بر برق و سرمایش مرکز داده به کار گرفته شوند.(صفحهی نمونه از نرم افزار StruxureWare Data Center Operation اشنایدر الکتریک )
نرم افزار StruxureWare Data Center Operation اشنایدر الکتریک
از آنجا که ابزارهای مدیریت عملیات دائما در حال جمع آوری اطلاعات از دستگاه های مختلف در رک هستند، این ابزارها قادرند از این اطلاعات در جهت شبیه سازی با زمان واقعی از جایگذاری سرور بر اساس برق، سرمایش، فضا، دسترسی به پورت و محدودیت های وزنی سرور، استفاده کنند.(به شکل 4 مراجعه شود.) پس از آن، ابزارها یک دستورالعمل برای قرار دادن سرور در رک مناسب و درست ارائه می دهند.
استفاه از ابزارهای برنامه ریزی می تواند با جلوگیری از خرابی و از کار افتدگی، منجر به صرفه جویی در زمان و پول شود. این منافع تا ایجاد یک محیط بسیار مجازی شده و ابری پیش می روند. انتخاب و بکارگیری میزبان در بهره گرفتن از منافع یک زیرساخت ابری، عواملی حیاتی به شمار می روند. با ماشین آلات مجازی متعدد و نرمافزارهای اجرا شده بر هر میزبان، سالم و در دسترس بودن هر یک از ماشین آلات فیزیکی مجازی اهمیت بسیار بیشتری پیدا خواهد کرد. استفاده از ابزارهای برنامه ریزی موجب می شود تا بتوانیم اطمینان حاصل کنیم که هر یک از ماشین آلات مجازی برق و سرمایش کافی مورد نیاز خود را برای ادامه ی عملیات دارا هستند.
در حالی که نرم افزارهای برنامه ریزی به بهبود کارایی و اثربخشی عملیات کمک می کنند، دسترسی به مرکز داده نیز می تواند در متقاعد کردن مدیر ارشد در مورد لزوم ارتقا در مرکز داده، مفید واقع شود. (به : قسمت “تجزیه و تحلیل: شناسایی قدرت و ضعف عملیاتی” در این مطلب مراجعه شود.) توانایی جدید گزارش دهی که اخیرا از سیستم های مدیریت به دست آمده می تواند در توجیه هزینه های مربوط به ارتقای مرکز داده به کار گرفته شود. استفاده از ابزارهای پیشرفته ی برنامه ریزی نیز قادر است به خبرگان مرکز داده کمک کند تا برای بازرسی و دیگرالزامات، خود را آماده سازند.
بکارگیری یک UI جدید باعث می شوند کار با ابزارهای مدیریتی آسان تر شود. امرزه رک ها می توانند در سه بعد، یا از بالا به پایین یا از نمای روبرو نمایش داده شوند.(به شکل 5 مراجعه شود.) ابزارهای مدیریتی بین داده ها از واحدهای CRAC، PDUها و UPS ها ارتباط و همبستگی ایجاد می کند. تمامی این زنجیره مورد نظارت و کنترل قرار می گیرد. ابزارها رکهای خنک شده توسط واحد CRAC را به تجهیزات IT درون آن رک مرتبط می سازد. در نتیجه، می توان تاثیرات یک اشکال در زیرساخت فیزیکی (مانند خرابی در واحد CRAC) را بر داراییهای فاوای موجود و در حال استفاده پیش بینی کرد.
شکل 5: نمای روبرو از ردیف رک های IT در اتاق IT (صفحهی نمونه از نرم افزار StruxureWare Data Center Operation اشنایدر الکتریک)
نرم افزار StruxureWare Data Center Operation اشنایدر الکتریک
عملیات: انجام وظایف بیشتر در زمان کمتر
ابزارهای اتومات جدید در جریان کار، به اپراتورها این اجازه را داده که به تخصیص دستورکارها، فضاهای رزروشده و پیگیری وضعیتها پرداخته و در زمان وارد و خارج شدن تجهیزات، داشتن سوابق ممیزی برای تاریخچه و دیدگاهی کامل و شفاف نسبت به چرخه ی تغییر فراهم آورد. شکل 6، انواع سوالات عملیاتی که توسط ابزارهای مدرن مدیریت زیرسات های فیزیکی پاسخ داده شده اند را نمایش می دهد.
علایم عملیات ضعیف
مثال هایی که در ادامه آورده می شوند، انواع مشکلاتی که در اثر یک اجرا و برنامه ریزی ضعیف عملیات به جود می آیند را نشان می دهند. ابزارهای مدیریت زیرساخت های امروزی می توانند به اپراتورهای مرکز داده کمک کنند تا کارایی بالاتری داشته و فرایندهای موجود را ارتقا دهند.
- در یک مرکز داده ی مالی بزرگ، آماده سازی و نصب سرورها به قدری تبدیل به امری پیچیده شده بود که تنها مهندسین با دستمزدهای بسیار بالا می توانستند از عهده ی انجام آن برآیند.
- یکی از مدیران قدیمی و با تجربه ی مرکز داده ای در نیویورک نگران آماده سازی سرورها در شعبهی جدید مرکز داده واقع در لندن بود چرا که معتقد بود کارمندان در شعبه ی لندن، نسبتا بی تجربه بوده و نمی دانند که دقیقا کجا برای قرار دادن سرور مناسب خواهد بود. او از نیویورک به لندن پرواز کرده تا تنها بر مکان رک مورد نظر خود یک یادداشت قرار داده و آن مکان را برای سرور ذخیره کرده تا اطمینان یابد هیچ اشتباهی در این امر رخ نخواهد داد. او همچنین مایل بود اطمینان حاصل کند که سیستمهای برق و سرمایش قادرند سرورهای اضافی را پشتیبانی کنند.
- یکی از صاحبان مرکز دادهای متوسط در فلوریدا برای سال ها، آگاهانه ظرفیت خنک کنندهی خود را بیشتر از اندازهی لازم انتخاب کرده تا مطمئن شود مرکز داده با مشکل سرمایش مواجه نخواهد شد او همچنین قادر نبود مالک تعدادی از سرورهای واقع در مرکز داده خود را شناسایی کند. در نهایت مشخص شد که او حتی بسیار بیشتر از مقداری که در ابتدا تصور کرده بود در حال خنک کردن مرکز بوده و حتی 10% از سرورهایی که خنک می شدند، به ندرت مورد استفاده قرار می گرفتند.
- یک اپراتور در مرکز داده ی صنعت مالی عهده دار نصب 9 سرور جدید بود. او یک رک را در یک مرکز داده ی تقریبا خالی قرار داده و سرور را در رک نصب کرد. او روشن شدن تمام سرورها را چک کرده و پس از شروع به کار تمامی آن ها، تصور کرد که نصب سرورها موفقیت آمیز بوده است. روز بعد او متوجه شد که UPS ای که تامین کننده ی سرورهای جدید بوده به حالت Bypass درآمده است. آن طور که مشخص شد، باری که در طول شب بر سرورهای جدید نصب شده اعمال شده بود به مقدار حداکثر رسیده و موجب اضافه بار در UPS و در ریسک قرار دادن صدها سرور شده است.
- در یک مرکز داده ی بزرگ در صنعت بهداشت و درمان که شامل هر دو پیکربندی کم ظرفیت(بدون افزونگی) و پرظرفیت (با افزونگی 2N) بوده، یکی از سرورهای کمظرفیت به اشتباه در رک پرظرفیت نصب شده بود. این خطا تا زمان حذف سرور مشخص نشد. در انتها به کار اندازی سرور منجر به هزینه ای معادل 20 دقیقه بیشتر از زمان لازم، در هزینه های الکتریکی شد.
- یک شرکت بزرگ مهندسی، با استفاده از رایانش تحت شبکه ، حجم بالایی از کارهای خود را مجازی سازی کرده بود. به مدیر VM ها نیز اجازه داده بود که برای پاسخگوی بهتر به درخواست های گوناگون و حفظ دسترسی مناسب، VM ها را مرتب جابجا کند. در یکی از موارد، CPU سرور خیلی شلوغ بود و مدیر VM این اپلیکیشن ها را به سرور دیگری در رک متفاوتی که دارای CPU ازاد بوده، جابجا کرد. اما در نهایت این رک جدید هم از سطح مصرف مورد انتظار اولیه بالاتر رفته و به دلیل اضافه مصرف در PDU ، بلافاصله کل سرورهای این رک خاموش می شود.
سوالات رایجی که با ابزارهای عملیاتی پاسخ داده شده اند: · جریان کاری من در حال حاضر چیست؟ · در صورت به وجود آمدن نقاط پر حرارت در مرکز داده، چگونه می توانم آن را مکان یابی کنم؟ · سلامت کلی در مرکز دادهی من چیست؟ · یکی از فن های CRAC را از دست داده ام، الان چه کاری می بایست انجام دهم؟ · ظرفیت مصرف برق من در یک رک از حد معمول فراتر رفته، چه کار باید انجام دهم؟ · PUE من چیست؟ |
شکل 6: سوالات کلیدی در عملیات
ابزارهای نرم افزار عملیاتی جدید اقدامات مربوط به عملیات زیر را اجرا می کنند:
- تجهیزاتی که با برق تک فاز و سه فاز کار می کنند را پیگیری کرده و از آن که هر سه فاز سیستم برق یک بار مصرفی متعادل را تحمل می کنند اطمینان حاصل کنید. (این بدان معناست که یک اپراتور جهت تعیین بار متعادل در سیستم برق، به سازنده و یا تکنسین برق کمتر وابسته باشد.)
- مسیر برق – از UPS تا رک و تا هر دستگاه- را در رک، مصرف اندازه گیری شده و ظرفیت رک نمایش دهید.(این امر به اپراتور کمک می کند تا به جای کشف با روش آزمون و خطا، سریعا بتواند تعیین کند که کدام سرورها در صورت خرابی یک رک و یا UPS مشخص تحت تاثیر قرار می گیرند.)
- مقدار حداکثر و مقدارِ متوسط استفاده از برق را برای هر رک گزارش دهید. (این امر به توجیه تصمیمات در مورد محل قرار گیری سرور جدید کمک می کند.)
- روشی برای ثبت سوابق ممیزی فراهم آورید تا تمامی تغییرات ایجاد شده در دارایی ها و دستور کارها در طول یک زمان مشخص شامل پیشینه ی زمان صدور هشدار ها و برطرف شدنشان، ثبت شوند. (در زمانی که می خواهید مشخص کنید که چرا یک سیستم از کار افتاده است، به جای تکیه بر نظرات مختلف از افراد در مورد آن که کدام یک از تجهیزات در چه زمانی جابجا شده، اپراتورها می توانند از سیستم برای یافتن شواهد واقعی بهره برند.)
- ظرفیت های اضافی را شناسایی کرده و مشخص کنید که کدام دستگاه می تواند حذف شده و در جای دیگری استفاده شود. (این امر به صرفه جویی در هزینه ی انرژی توسط تخصیص دوبارهی دستگاه های قابل استفاده در اتاق IT می شود.)
- یک مبنای اثربخشی در مورد مصرف برق (PUE) بر اساس استفادهی روزانه ایجاد کنید و پیشینه ی آن را ثبت و پیگیری کنید. (این امر به اپراتور اجازه می دهد که تجزیه و تحلیل کرده و از کارساز بودن کاهش در هزینه های مدیریت و استراتژی های صرفه جویی در انرژی در واقعیت، اطمینان یابد.)
- برخی ابزارها وجود دارند که قادرند بین اطلاعات برق، سرمایش، رک و مابقی زیرساخت های فیزیکی و مدیر VM مستقیما ارتباط برقرار سازند. چنین همکاری می تواند منجر به اطمینان از آن شوند که ماشین آلات مجازی و نرم افزار های مربوطه شان و بار کاری تنها بر میزبانهای فیزیکی اعمال می شوند که منابع برق و سرمایش سالمی دارند. این امر علاوه برکاهش نیاز به افزونگی در زیرساخت های فیزیکی، قابلیت اطمینان در IT را نیز افزایش خواهد داد. برای آن که در مورد چگونگی تاثیر یک محیط بسیار مجازی شده بر زیرساخت فیزیکی مرکز داده بیشتر بدانید، به گزارش “محاسبات مجازی و ابری: مدیریت، سرمایش و برق بهینه منافع را به حداکثر می رسانند”[3] مراجعه کنید.
ابزارهای نرم افزار مدیریت اجرا و برنامه ریزی امروزی امکان ارتقا تا رویه های عملیاتی استاندارد را فراهم می آورند. در شکل 7، هر دو جریان های کاری سنتی و بهبودیافته با نظر به از دست رفتن یک فن در واحد CRAC، مقایسه شده اند. شکل 8 و 9 نیز بیانگر مثال هایی متفاوت از روش های گوناگون در مدیریت مسایل مربوط به مصرف انرژی در مرکز داده هستند.
شکل 7: روش سنتی و جدید: هدررفت در فن CRAC
در یک روش سنتی، اپراتور انسانی با این دلایل بحث می کند : “من سه واحد CRAC و 15 رک دارم. CRAC شماره ی 3 به طور ناقص عمل می کند در نتیجه، تنها نگرانی من در این زنجیره، 5 رک انتهایی می باشد.” این دانش ضمنی انسانی از محاسبات و وابستگی ها تنها در زمانی می تواند کافی باشد که تعداد محدودی از رک ها می بایست مدیریت شوند.
اگرچه، هر قدر که محیط اتاق IT رشد می کند، قابل مدیریت شرایط و مشکلات ، کمتر و کمتر می شود. نقاط پر حرارت در نوک شبکه با اضافه بار در زمانی اتفاق می افتند که اپراتورها بر آخرین چیزی که به خاطر می آورند و یا گروهی از پیش فرض های قدیمی خود تکیه می کنند. این زمانی است که مشکلات پدید می آیند.در یک سطح بالاتر و پیچیده تر، ابزارهای مدیریت کارها را بسیار موثرتر و دقیق تر از ذهن انسان انجام می دهند.
روش سنتی در پیگیری فهرستهای ورودی و خروجی تجهیزات اتاق IT شامل نصب یا حذف یک دستگاه و سپس ثبت آن در دفتر (توسط فرد تعیین شده) می باشد. این رویه برای هر دستگاهی به اندازه ی یک دیسک و یا نوار و بزرگتر از آن، اجرا می شود. تمامی محفظه های درایو ها در طول شب، توسط ماموران امنیتی حفاظت شده و چنانچه یکی از آن ها گم شود، مامورین از طریق فهرست افراد دسترسی داشته و تصاویر امنیتی اتاق های سرور پیگیری می کنند تا دریابند چه کسی ممکن است آن را برداشته باشد.
با استفاده از نرم افزارهای عملیاتی، تنها با یک دستگاه کوچک دستی، می توان تمامی اطلاعات مربوط به فهرست های موجودی را در اختیار داشت. با کمک یک اسکنر می توان بارکدها را اسکن کرده و روند انجام دستورالعمل ها و شناسایی تجهیزات را سرعت بخشید. در بکارگیری شبکه wireless، مکان سرورها به طور خود به خود، با هم سینک شده و مشخصات دارایی ها و دستگاه ها با جزییات ثبت می شود. جستجوها تحت عنوان نام فروشندگان، مدل و نوع تجهیزات صورت گرفته و اطلاعات در یک فایل با فرمت اکسل، ذخیره می شود.
سناریویی را تصور کنید که در آن، اپراتور مرکز داده تلاش دارد که از سلامت کلی زیرساخت های فیزیکی سرمایش و برق اطمینان حاصل کند. در مرکز داده ی سنتی، اپراتور می بایست سالم بودن هر یک از دستگاه ها را به طور جداگانه اندازه گیری کرده و از آن مطمئن شود. این اطلاعات حاصل از اندازهگیری، در صفحات گسترده ثبت شده و به طور دستی برای گزارش ها دسته بندی می شوند.
ابزارهای مدیریت، می توانند به کشف، مدیریت و نظارت متمرکز دستگاه های در 24 ساعت شبانهروز و تمام روزهای هفته بپردازند. در زمان پیشامد مشکلات، هشدارهای فوری زیرساخت ها براساس شرایط و آستانهی تعریف شده از طرف کاربران، فرستاده میشوند. گزارشها و نمودارها به سرعت برای تشخیص ماهیت مشکل ارائه میشوند.
مشکل: مدیریت کارایی انرژی
به طور معمول، مراکز داده در سطح بالایی انرژی مصرف می کنند. در طراحی و عملیات مرکز داده، همواره تمرکز بر ظرفیت و قابلیت اطمینان گذاشته شده است. این امر منجر به شرایط ناخوشایندی همچون غیر بهینه بودن مراکز در زمینه ی مصرف انرژی شده است. در واقع، یافتن مکانی که مهندسی مناسبی در زمینهی کارایی انرژی در آن صورت گرفته باشد، بسیار دشوار است چرا که تصمیمات مستقلی که در رابطه با طراحی تجهیزات، یکپارچه سازی سیستم ها، برنامه های کنترلی، نصب کنندهها، پیمانکاران، مدیران IT و اپراتورها گرفته می شود، در راستای عملکرد کلی و نهایی انرژی می باشند.
پژوهشها نشان داده اند که هزینه های انرژی، بخش قابل ملاحظه ای از کل هزینه های عملیاتی فاوا را تشکیل داده و در برخی موارد، این مقدار حتی از کل هزینههای سخت افزاری IT نیز فراتر می رود.[4] این فشار هزینه ها از یک سو، و درک اهمیت کارایی مراکز داده در مصرف انرژی از سوی دیگر، موجب شده است که بسیاری از اپراتورها مصرف انرژی خود را کاهش دهند. حتی در زمانی که اپراتورها به اندازه گیری مصرف انرژی روی آوردند نیز مشکل دیگر پیش روی آنان این بود که همواره فاقد تجهیزات لازم برای اندازه گیری بوده اند. به همین دلیل نیز ابزارهای جدید در مدیریت انرژی راه خود را به سیستم های مدیریت اتاق IT باز کردند.
شکل 8: روش های سنتی و جدید در انتقال بار
این ابزارهای جدید، انتقال مصرف را برای اپراتورهای اتاق های IT تسهیل میکنند.(به شکل 8 مراجعه شود.) در یک محیط مجازی سازی شده، زمانی که مصرف برق به آستانه ی تعیین شده از طرف کاربر رسید، مدیر VM می تواند تمامی VM ها، نرم افزارها و بارِ کاری نسبی شان را به میزبان های فیزیکی دیگر منتقل کند. در مثال صرفه جویی انرژی شکل8، در طول شب که تقاضا کاهش می یابد، مصرفهای مجازی در یک رک تلفیق می شوند. این بدان معناست که مابقی رک ها در جهت کاهش مصرف انرژی خاموش می شوند.
البته باید توجه داشت که دسترسی به اطلاعات زمان واقعی مصرف برق، نیازمند PDU ها با رک اندازه گیری شده یا تجهیزات لازم برای کنترل و نظارت بر هر شاخه از مدار در راستای نرم افزار DCIM بوده تا در عین این که مقادیر را جمع آوری و گزارش کرده، مطالب بررسی شده را نیز به تجهیزات مشخص IT ارتباط داده شوند. همان طور که پیشتر توضیح داده شد، برخی از ابزارهای DCIM می توانند مستقیما با مدیر VM در مصرف برق و سرمایش و داده ها سهیم شوند. این یکپارچه سازی بین مدیر و ابزارهای DCIM منجر به اطمینان از قرارگیری ایمن و خود به خود VM های جدید و موجود از قبل می گردد. شکل 9 حاکی از آنست که چگونه عملکردهای مبتنی بر نرم افزار در مدیریت انرژی، منجر به کاهش هزینههای عملیاتی گشته است.
شکل 9: روش سنتی و جدید: تنظیمات هوشمند درجه حرارت
تحلیل: شناسایی قدرت و ضعفهای عملیاتی
هدف از انجام تحلیل، دستیابی به تصمیمی بهینه و واقعی بر اساس اطلاعات موجود است. به طور مثال، ممکن است برای تمام تغییرات در دارایی های یک اتاق کامپیوتر یک روش ثبت سوابق ممیزی ایجاد شود. در صورتی که هر شب در یک ساعت مشخص، جهش ناگهانی در مصرف برق رکی یکسان مشاهده شده و این جهش به طور خطرناکی به آستانه ی قطع مدار توسط کلید برق نزدیک باشد، لازم است که جهت کاهش مصرف برق، در مورد تغییر جریان کار در آن رک تصمیماتی اتخاذ شود.
تحلیل های صورت گرفته بر داده های عملیاتی زیرساخت های فیزیکی می تواند ریشه و علت مشکلات (که چه چیزی کند عمل کرده و چه چیزی هزینه بر است) را نیز مشخص کند. راه دیگر در ایجاد ارزش تجاری در مرکز داده، ترکیب شبیه سازی پیشبینی کننده و تحلیلی می باشد. شکل 10 انواع سوالاتی که به بررسی استفاده از ابزارهای مدرن در مدیریت زیرساخت های فیزیکی مرکز داده می پردازند، را نمایش میدهد.
گزارش های عملکرد قطعی برق در قسمت رک، ردیف و توزیع برق را پیگیری می کند. زمانی که در یک ناحیه سرورها به دفعات بیشتری از کار می افتند، معمولا دلیلی اساسی وجود داشته که می بایست شناسایی شود. بدون داشتن چارچوب مرجع در مرکز داده، برای اپراتوری که قصد کاهش هزینه ها و افزایش کارایی را داشته، ارزش و اعتبا معیارها محدود خواهد بود.
سوالات رایج پاسخ داده شده توسط ابزارهای تحلیلی: · در مرکز داده من چه چیزی دارم؟ · چه کسی و در چه زمانی با کدام یک از تجهیزات کارکرده است؟ · آیا ظرفیت سرمایش و مصرف برق من استاندارد است؟ · بروز رسانی سیستم عامل های (firmware) چه زمانی لازم است؟ · در چه تاریخی مرکز داده، با کمبود ظرفیت برق و سرمایش مواجه خواهد شد؟ اولین دستگاهی که از کار می افتد کدام خواهد بود؟ · باتری های UPS در چه زمانی باید شارژ شوند؟ · در چه زمانی سرمایه گذاری بعدی در زیرساخت های فیزیکی مرکز داده ضروری خواهد بود؟ · چگونه می توانم سرمایه ی مورد نیاز برای زیرساخت های آتی و محصولات جدید را پیش بینی کنم؟ |
شکل 10: سوالات کلیدی در تحلیل
ابزارهای مدرن در نرم افزارهای تحلیلی دارای کارکردهای زیر هستند:
- ناسازگاری های موجود بین مصرف برنامهریزی شدهی انرژی بر اساس اطلاعات برچسب انرژی و مصرف واقعی انرژی بر اساس اطلاعات واقعی مصرف راشناسایی می کند. (بدین وسیله اپراتورها میتوانند پیش بینی های دقیق تری از ظرفیت طرح داشته و به بودجه بندی و تصمیمات خرید کمک کنند.)
- گزارش هایی از فهرست موجودی ارائه میهد که بر اساس نوع دستگاه، عمر کارکرد، سازنده و مشخصات آن سامان دهی شده است. (اپراتورها میتوانند به سرعت دارایی های مورد استفاده، بدون گارانتی و دارایی هایی که می بایست ارتقا داده شوند را شناسایی کنند.)
- گزارشهایی از مصرف انرژی توسط زیر سیستم ارائه میشود. (به شکل 11 مراجعه شود) (اپراتورها قادر خواهند بود رک یا زیرسیستمی که بیشترین هزینهی انرژی را ایجاد کرده را شناسایی کرده و تشخیص دهند که آیا مطابق معیارهای استاندارد (بنچ مارک)، مصرف انرژی در اثر تغییرات اخیر در اتاق IT در حال افزایش بوده و یا خیر.)
- جزییات مربوط به مصارف انرژی را فراهم آورده که در مرتبط ساختن هزینههای عملیاتی به هر گروه از کاربران در واحد کسب و کار نقش دارد و استرداد وجه انرژی را تسهیل می نماید. (همچنین اپراتورها رویه های مصرف انرژی در واحدهای تجاری مختلف را تغییر داده و صاحبان کسب و کار قادر خواهند بود در زمینه ی انتخاب تکنولوژی به کار گرفته شده، تصمیمات بهتری اتخاذ کند.)
شکل 11: تحلیل های مصرف انرژی (یک نمونه از صفحه ی نرم افزار کارایی انرژی عملیات ها StruxureWare اشنایدر الکتریک)
عدم هماهنگی و سازگاری ظرفیت های برق، سرمایش، توزیع برق و توزیع سرمایش با مشخصات کف مرکز داده و فضای رک، به بروز ظرفیت های مازاد و بلا استفاده منجر می شود. مثال: وقتی که مدیر عامل در مرکز داده قدم زده و با رک های متعددی مواجه می شود که تنها با نیمی از ظرفیتشان کار میکنند و می پرسد که چرا مدیر مرکز داده ادعا میکند مرکز داده با ظرفیت کامل در حال کار است.
مثال هایی از ظرفیت مازاد و بلا استفاده مرکز داده در ادامه آمده است:
- دستگاه تهویه مطبوع ظرفیت کافی داشته ولی توزیع و جریان هوا با بار IT متناسب نبوده و کفایت نمی کند.
- یک PDU ظرفیت کافی داشته ولی فاقد مکان های لازم برای کلیدهای برق در مدار است.
- سطح مورد نیاز در کف طبقه وجود داشته ولی هیچ مقداری توان اضافه در دسترس نیست.
- دستگاههای تهویه مطبوع در مکانهای نادرست قرار داده شده اند.
- برخی از PDU ها اضافه بار داشته در حالی که برخی دیگر به مقدار جزیی بارگذاری شده اند.
- در بعضی نواحی حرارت بیش از حد مشاهده شده در حالی که جاهایی دیگر سرد هستند.
مدیریت ظرفیت مازاد امری خسته کننده برای خبرگان مرکز داده به شمار میرود. برای مدیران مرکز داده بسیار دشوار خواهد بود تا برای مدیریت و کاربران توضیح دهد که چرا یک مرکز داده با توان 1MW حاصل از سیستم های نصب شده برق و سرمایش، قادر به خنک کردن یک سرور تیغهای جدید که تنها با 200kW از بار کلی خود کار میکند نیست.
یک ابزار مدیریت کارایی ظرفیت، نه تنها ظرفیت های مازاد را شناسایی و برجسته میسازد، بلکه در درجهی اول میتواند از بروز مشکلات ایجاد شده توسط کارکنان مرکز داده نیز جلوگیری کند. برای دریافت اطلاات بیشتر در مورد چگونگی مدیریت ظرفیت مازاد، به گزارش “مدیریت ظرفیت برق و سرمایش در مراکز داده”[5] مراجعه کنید.
نتیجه گیری:
با وجود چالشهایی همچون رایانش با تراکم بالاتر، بارهای کاری دینامیکی و نیاز به مصرف کارامدتر انرژی، سازمان ها به نرم افزارهایی نیازمندند که برنامه ریزی و عملیات با هزینه ی پایین و تحلیل در جهت بهبود جریان کار را امکان پذیر سازد. تنها عواملی که میتوانند به تعهد در ایجاد ارزش تجاری کسب شده بیافزایند، شامل بینش وسیع تر، کنترل بیشتر و اتوماسیون بهتر است.
تواناییهای جامع مدیریتی که امروزه در دسترس همگان است، به خبرگان مرکز داده این امکان را داده تا ظرفیتهایشان را در کنترل هزینههای انرژی به حاکثر رسانده و به صاحبان کسب وکار در زمینهی نحوهی استفادهی کارآمدتر از داراییهای IT مشاوره دهند. با به اشتراک گذاری نکات کلیدی اطلاعاتی، داده های مربوط به پیشینه ی مرکز و اطلاعات پیگیری دارایی ها و همچنین با گسترش توانایی استرداد وجه انرژی از کاربران، ابزارهای جدید در برنامهریزی و اجرا به کاربران این امکان را میدهند تا اقدامات خود را با هوش تجاری/ کسب و کار[6] سازمان همسو سازند. به طور خلاصه، استفادهی کارا از نرمافزارهای امروزی مدیریت زیرساخت های IT مرکز داده به افزایش بهرهوری و قابلیت اطمینان در مرکز داده شما و در عین حال افزایش ارزش کلی تجاری میانجامد.
[1] – Andy Lawrence, The 451 Group, Data Center Infrastructure Management: Consolidation, But Not Yet, December 7, 2010
[2] – White Paper 104, Classification of Data Center Management Software Tools
[3] – White Paper 118, Virtualization and Cloud Computing: Optimized Power, Cooling and Management Maximizes Benefits
[4] – US Department of Energy, “Creating Energy Efficient Data Centers”, U.S. Department of Energy, May
2007
[5] – White Paper 150, Power and Cooling Capacity Management for Data Centers.
[6]– هوش کسب و کار (BI) مجموعهای از نظریات، روشها، فرایندها، معماریها و فناوریهایی است که برای تبدیل داده خام به اطلاعات مفید و معنادار استفاده میشود.
درج دیدگاه