موضوعات اساسی برنامهریزی مدیریت بحران در بسترهای مجازی
اطلاعات و سیستمهای اطلاعاتی یکی از احساس ترین منابع سازمانها محسوب میشوند و هر سازمانی با توجه به گستره فعالیتهایش در زمان انتخاب و طراحی یک بستر اطلاعاتی دغدغه حفاظت از اطلاعات را به طور جدی دنبال میکند. اکثر سازمانهای آینده نگر همیشه برنامه ای برای زمان بروز بحران آمده میکنند که به آن Disaster Recovery Plan نیز گفته میشود. اما ضرورت استفاده از یک برنامه جامع مدیریت بحران را چه کسی و چه مسائلی تعیین میکنند؟
از دست رفتن اطلاعات و یا بروز خرابی در سیستمهای اطلاعاتی امری است که همه کارشناسان IT با آن آشنا هستند. خرابی دیسکهای ذخیرهسازی اطلاعات، بروز عیب سخت افزاری در کنترولرها، جایگزین شدن اطلاعات جدید بر روی اطلاعات قدیمی و مسائلی از این دست موضوعی است که با وجود تمامی پیشرفتهای صورت گرفته در سیستمهای سخت افزاری و نرمافزاری هنوز نیز به چشم میخورد. سازمانهای بزرگ که از بودجههای آنچنانی در طرحهای سازمانی برخوردارند اغلب برنامههای مدیریت بحران جامعی دارند اما ما که مانند آن سازمانها نمیتوانیم به این موضوع بودجه تخصیص دهیم بهتر است به موضوعات کلیدی این طرح توجه کنیم. در اینجا به هفت موضوع اساسی در طراحی یک برنامه مدیریت بحران کارآمد اشاره میکنم.
مرحله اول: شناسایی و ارزیابی فعالیتها
اولین کار تهیه یک فهرست است. یک کاغذ سفید و یک قلم آماده کنید و اطلاعات، منابع و دستگاههای حساس موجود در زیرساخت اطلاعاتی سازمان را فهرست کنید. سپس به سراغ میزان دسترسی (Uptime) این سیستمها بروید، تمامی سیستمهای سازمان که به طور 24 ساعت در حال استفاده هستند و یا در برخی اوقات از آنها استفاده میکنید را یادداشت کنید و مطمئن شوید موردی از قلم نیفتاده است. با بررسی این دو لیست اولیه میتوانید سرویسهای اساسی را شناسایی و ارزیابی کنید.
مرحله دوم: تعیین اولویت
به یاد داشته باشید که شما مسئول انجام بهینه فعالیتهای سازمان هستید و استفاده از زیرساختهای نرمافزاری نامتناسب و دستگاههای گران قیمت نه تنها کمکی به شما نخواهد کرد بلکه نقطه ضعف عملکرد شما در طراحی یک برنامه مدیریت بحران محسوب میشود. در سازمانهای متوسط و کوچک به راحتی میتوان با یک اولویت گذاری صحیح بازیابی اطلاعات از هزینههای سرسام آور قطعی آنها جلوگیری کرد. بسیار مهم است که در این مرحله پس از اولویت گذاری اولیه فعالیتها با مدیران اجرایی و یا مدیران کلیدی سازمان مشورت کنید تا با ایجاد هماهنگی و مشارکت آنها در تصمیم گیری آنها نیز از اهمیت موضوعات به خوبی مطلع شوند و در مراحل بعدی نیز به شما یاری رسانند.
مرحله سوم: بودجه بندی
حال که فعالیتها شناسایی، ارزیابی و اولویت گذاری شدهاند بهترین زمان است که شما بودجه خود را جهت خرید زیرساخت مناسب، لایسنسها و دستگاههای مورد نیاز برآورد نمایید. استفاده از یک نرمافزار پشتیبانگیری تخصصی مانند Symantec Backup Exec یا VEEAM Backup و یا استفاده از یک زیرساخت مجازی که در آن قابلیت تهیه برنامه مدیریت بحران به طور جامع طراحی و با نرمافزارهای شرکتهای دیگر سازگار است میتواند از گزینه های شما باشد. اما این موضوع که کدام بهتر است تنها بستگی به شرایط شما، بودجه شما و تخصص شما دارد. توصیه میکنیم آن مقدار هزینه کنید که اطلاعات برای شما ارزش دارند. سازمانهای بسیاری که برنامه ای جهت مدیریت بحران نداشتهاند هزینه های کلانی بابت بازیابی اطلاعات پرداختهاند پس هم اکنون به یک ارزیابی صحیح و منطقی از هزینه و فایده مسائل برسید و بودجه مناسبی را برای این طرح تخصیص دهید.
مرحله چهارم: وابستگی فعالیتها
اغلب نرمافزارها با یکدیگر در ارتباط هستند و در زمان بروز بحران بایستی این موضوع را در نظر بگیرید. توصیه میکنم از سرویسهای اساسی شبکه مانند DNS، DHCP، فایل سرور شروع کنید و اطمینان یابید در زمان بروز قطعی، این سرویسها را در کمترین زمان ممکن یا بدون قطعی در دسترس خواهید داشت.
مرحله پنجم: تحلیل تخصیص منابع
در زیرساختهای مجازی سازی مدیریت بحران بسیار آسانتر شده است. در این زیرساختها با تخصیص بهینه منابع میتوانید در صورت بروز خرابیهای سخت افزاری و یا نرمافزاری به سرعت سرور واقعی دیگری را جایگزین سرور قبلی کنید و تا زمان تعمیر سخت افزار دستگاه تمام سرویسها را در شرایط فعال داشته باشید. بنابراین در این مرحله میتوانید با تحلیل و پیش بینی مسائل محتمل بخوبی وضعیت را کنترل کنید. همچنین آمارها و لاگ فایلهای سیستمها میتوانند بیشترین کمک را به شما برسانند تا بتوانید تحلیلی بر اساس اطلاعات واقعی داشته باشید.
مرحله ششم: ساده اما کارا
سعی کنید تمامی برنامهها و فرآیندهای برنامه مدیریت بحران را به طور ساده ولی کارا طراحی کنید. به مراتب دیده شده است که فرآیندهای پیچیده و بسیار ریزبین در زمان بحران جوابگو نبوده و در نهایت با شکست روبرو شده است. تا حد امکان از سیستمهای هوشمند و خودکار استفاده کنید و در این مسیر تلاش کنید تعامل نیروی متخصص خود را برای کنترل شرایط و نظارت بر آن به پایینترین میزان ممکن برسد. این گونه میتوانید وقت را به موضوعات مهمتر اختصاص دهید و در زمان بحران نیز از بروز اشتباه سهوی جلوگیری کنید.
مرحله هفتم: تست برنامه بحران
یکی از مراحل مهم برنامه تست و بررسی فرآیند در عمل است. یک سناریوی فرضی ایجاد کنید و در زمانی خارج از زمان کار آن را پیاده کنید. حتی میتوانید این سناریو را به طور واقعی برای کارشناسان IT خود شبیه سازی کنید اما در حقیقت به آنها اطلاع ندهید و بگذارید واقعاً در شرایط بحران فعالیت کنند تا تمامی مسائل به خوبی بررسی شود. برنامه مدیریت بحران تنها در صورتی عملیاتی و جوابگو خواهد بود که این مرحله را با موفقیت پشت سر بگذارید.
به یاد داشته باشید برنامه مدیریت بحران نیازمند بررسیهای دورهای است و بایستی در دورههای 6 ماه تا یک ساله با توجه به شرایط مورد بازنگری قرار گیرد. تکنولوژیهای مجازی سازی در تهیه یک طرح مدیریت بحران جامع نقشی اساسی ایفا می کند و با استفاده از قابلیت های Snapshot، Clone، High Availablity و کلاسترینگ بروز بحران را به حداقل برسانید.
سلام…
سلام
تشکر
میشه نرم افزارهایی که خاص این کار طراحی شدند رو معرفی کنید.
من از نرم افزار Backup Exec برای این کار استفاده می کنم و تاحدودی مسائل رو پوشش دادم. پروسه disaster recovery به دقت زیادی نیاز داره و نرم افزارها خیلی شسته رفته این کار رو انجام میدن. نرم افزار قوی تری از Backup exec سراغ دارید؟
مرسی، نرم افزارهای بسیار…
مرسی، نرم افزارهای بسیار زیادی برای این کار وجود داره یکی از مهم ترین آنها VMware Site Recvery Manager است. چون سوال کردید سعی می کنم در آینده یک فهرست از این نوع نرم افزارها را با اشاره به قابلیت های خاص هر کدوم منتشر کنم.
Backup Exec هم نرم افزار قوی است و plan های خاصی برای Distaster recovery داره. برای محیط هایی که از تکنولوژی ها مختلف استفاده میشه گزینه خوبی است.
مقاله مفیدی بود ممنون
مقاله مفیدی بود ممنون