RTO

המדריך המלא ל RPO ו RTO

בהגדרתם הבסיסית, הפשוטה, שירותי ענן מנוהלים הם שירות לניהול השימוש שלכם בשירותי ענן שבהם אתם משתמשים. מה שירותים אלה כוללים? מה ההבדל בין ענן לבין ענן מנוהל? ומהם יתרונות הענן המנוהל?

בכל הנוגע להתאוששות מאסון יש שני מונחים בולטים ושימושיים במיוחד: RPO ו-RTO. מה פירוש המונחים האלה? מהם ההבדלים בין השניים? ומה חשיבותם?

מה ההבדל בין RTO ל-RPO?

המונח RPO הוא ראשי התיבות של הביטוי Recovery Point Objectives, בעוד ש-RTO הוא ראשי התיבות Recovery Time Objectives. אז מה ההבדל בין שני המונחים? RPO מתייחס לזמן שיעבור בין גיבוי לגיבוי, בעוד ש-RTO מתייחס לזמן שייקח להתאושש בהיבט ספציפי. כלומר הראשון הוא מונח מתחום ההיערכות למקרה כשל, בעוד שהשני הוא בהקשר התמודדות עם מקרים כאלה בפועל. למעשה, גם את RTO (זמן ההתאוששות המבוקש) חייבים לקחת בחשבון עוד בהתחלה בשלב ההיערכות לכשלים. אך הוא מקבל ביטוי בפועל בזמן התאוששות, בשונה מ-RPO אשר מיושם באופן שוטף ומסייע להיערך למקרי כשל. כדי לחדד ולהבהיר עוד יותר את שני המונחים האלה ואת ההבדלים ביניהם, נתעמק כעת בכל מושג בפני עצמו.

מה המטרה של RTO?

Recovery Time Objectives מתמקד כפי שמעיד המונח ב-recovery time. מדובר בהגדרה מספרית של זמן, שהוא הזמן המרבי שבו מעוניינים לקבל התאוששות של תהליך עסקי ספציפי בעקבות מקרה כשל אשר פגע בו. RTO עשוי להתייחס גם לזמן המרבי, שבו מעוניינים להיות מוכנים לפעילות בסביבת התאוששות חלופית. מדוע כל זה חשוב?

  • הזמן להיערך הוא עכשיו – חיוני להגדיר מטרות כאלה מראש. מקרי אסון וכשלים מתאפיינים לרוב בכאוס במידה כזו או אחרת, לכן אינכם יודעים מה בדיוק יתרחש. לכן מומלץ להתכונן למקרים כאלה מראש ולא להמציא מענה על המקום, ללא תכנון מוקדם וללא כלים מתאימים להתמודדות. כאשר מגדירים מטרות קונקרטיות ומספריות, הדבר מחייב היערכות מעשית בכדי לממש אותן. הכנת תהליכי גיבוי מתאימים, תהליכי התאוששות בהתאם לכך, נהלים, תיעוד מסודר, תרגול הנהלים והתהליכים וכן הלאה. זה כמו לדבר על הרווח בעסק. ייתכן שיש לכם כמה מקורות הכנסה, יש אינספור הוצאות, אבל האם העסק רווחי? ובאיזו מידה? מה שדרוש זה לצלול לתוך המספרים והפרטים הטכניים. הדבר חיוני בהקשר התאוששות מאסון, בדיוק כמו בהקשר הניהול הכספי. כמו שבניהול כספי הזמן להתעמק בדברים הוא עכשיו ולא בסוף החודש או הרבעון, כך גם לגבי תשתיות המחשוב – לא לחכות למקרה הכשל.
  • Time is money – יש אתרים שהפעילות השוטפת שלהם בכל דקה היא קריטית לרווחי העסק. זה אומר שכל הפסקה בפעילותו, גם אם זה ב-4 בבוקר שעון ישראל תתבטא בהפסדים לא קטנים. כך שזמן הוא כסף בפעולת האתר התקינה וגם לאורך התקלה (בצורת הפסדים כספיים), אך גם מבחינת מהירות ההתאוששות. ככל שתתאוששו מהר יותר, כך הנזק הכספי יצומצם.
  • פגיעה גם בלקוחות ובצדדים אחרים – נזקים עקב שיבושים בפעולת מערכות מחשוב הם לא תמיד ולא בהכרח כספיים. אם ניקח כדוגמה את רכבת ישראל, זהו גוף שמספק לציבור גם מידע חיוני מאוד לגבי לוחות הזמנים של הרכבות. אם מנגנון זה משתבש או לא זמין, למשל עקב מתקפת האקרים, היקף גדול למדי של נוסעים עשוי לסבול מכך.
  • תלויות הדדיות – נדיר שעסק שלם קורס ומשותק בבת אחת. לרוב סביר להניח שעסקים ייתקלו בעיקר במקרי כשל נקודתיים יחסית. כלומר, רק במערכת מסוימת או בקבוצת מערכות שקשורה זו לזו באיזו צורה. מצד שני, מערכות אלה עשויות להיות קריטיות למדי ולא רק בפני עצמן. אם מערכות אחרות או תהליכי עבודה קריטיים תלויים בהן, העניינים מסתבכים במקרי כשל. זו עוד סיבה לצורך בהתאוששות מהירה.

מה המשמעות של RPO?

Recovery Point Objectives עוסק בתדירות הגיבויים ויש לכך חשיבות מכרעת, מאחר שהגיבויים הם בסיס מרכזי להתאוששות. במקרה כשל של מערכת מחשוב עשוי להיות אובדן (או שיבוש) מידע מתמשך. למשל במצב של הידבקות בתוכנת כופר (ransomware) אשר מוחקת קובץ אקראי אחד כל דקה, במטרה ללחוץ על העסק להיכנע לתנאי הסחיטה של התוקפים. ככל שעובר הזמן הנזק יגדל, מספר הקבצים שיאבדו יעלה, ובהתאם מספר הקבצים שיהיה צורך לשחזר. כעת השאלה היא מהו משך הזמן שתוכלו לספוג את הנזקים? האם זה דקה של נזק? עשר דקות? אולי שעה? התשובה לכך תלויה מאוד בנסיבות האישיות של כל עסק, כולל אופי הקבצים שבהם מדובר מבחינת חשיבותם העסקית. מתי בוצע הגיבוי לאחרונה? כל אלו תלויים באופן ההתנהלות השוטפת של העסק.

מהם התהליכים ב-RTO ו-RPO?

בקרה

חייבת להיות בקרה איכותית על המתרחש במערכות המידע. ללא בקרה כזו, זיהוי מצבי כשל ואסון יהיה איטי מדי. כמו כן, תמונת המצב שתוכלו לגבש בהתחלת האירוע (והיא קריטית לגבי אופן התגובה היעיל) תהיה חלקית ולא מדויקת. יש היבטים ופתרונות טכניים רבים לנושא זה, כגון לוגים ממערכות שונות וניתוחם, ניטור מצב רשתות בסיוע שרות Network Operations Center, דשבורדים שמקלים על התמצאות במידע ועוד.

חדשנות וטכנולוגיה

ככל שתשתיות המחשוב מורכבות יותר, כך עשויה להתווסף מורכבות גם לתהליכי ההתאוששות מאסון. במקרה של שירותי ענן העניינים שונים מעט, מאחר שהם נמצאים פיזית אצל ספק חיצוני ומרוחק ולכן לא ייפגעו ממקרה אסון שפוגע בעסק עצמו. ואכן, עסקים רבים כיום משתמשים בשילוב שירותי מחשוב פנימיים וחיצוניים (“ענן היברידי"). היבט נוסף של חדשנות בהקשר שירותי הענן ו-DRP, הוא ששירותי ענן עשויים לסייע להתאושש באמצעות שירותי עזר לנושא זה, תודות לעובדה שהם מאפשרים להתחיל להשתמש במערכות שונות במהירות רבה. הדבר עשוי להיות שימושי כתחליף למערכת שנפגעה.

האסטרטגיה חשובה מההתחלה

נושאים כגון RTO, RPO והתאוששות מאסון של מערכות המחשוב הם לכאורה נושאים טכניים מאוד. זה אכן גם כך, אך חשוב מזה – ההשלכות שלהם מהוות נושאים עסקיים ואפילו אסטרטגיים. וכך מומלץ לחשוב עליהם. הזכרנו קודם את הצורך לטפל בהקדם ובאופן פרואקטיבי, בנושא ההתאוששות מאסון, כולל היבטים מעשיים כגון RTO ו-RPO. עסקים רבים דוחים ביצוע דברים כאלה, משום שתכנונים אסטרטגיים והיערכות לאסון הם לא מקורות לרווח מיידי. בשלב התכנון, זו רק השקעת משאבים שהיא לעתים לא קטנה, כך שהדבר מחייב חשיבה במבט על לטווח ארוך. לא כדאי להסתפק בכיבוי שריפות ובטיפול בשוטף ובאילוצים, אלא לפנות את הזמן וכל משאב אחר שנחוץ כדי לטפל מהיסוד ומראש בנושאים קריטיים אלה.

עוד חשוב לזכור כי זמנים שקובעים לא חייבים להיות דווקא הכי מהר שאפשר. יש להתאים את הכל לדרישות כל עסק ספציפי ולתהליכים העסקיים שבהם מדובר, למשל בהתייחס לחשיבות העסקית של אותם תהליכים. חיוני לבצע גם חישובים של הסיכונים הכספיים בכל מקרה כשל שאליו נערכים. בהקשר האסטרטגי של מקרי כשל, חשוב לראות את התמונה הרחבה. למשל, השלכות שליליות בעקבותיהם על תדמית העסק, שתגרום לנטישת לקוחות קיימים ותפגע בהשגת לקוחות חדשים. כמו כן, כדאי לזכור שלא כל דבר קל לכימות מספרי מבחינת השלכותיו הכספיות. גם כאן, היבט הפגיעה בתדמית מדגים זאת.

הפיקו לקחים מאירוע עבר

חשוב להפיק לקחים מאירועים שכבר התרחשו. למשל, עדכון ערכי Recovery Time Objectives. כך, תחקיר והפקת תובנות מעשיות בעקבות מקרים קטנים ושוליים ייתרמו להיערכות למקרים חמורים יותר.

גיבוי שרתים

לאור תפקידם המכריע כחלק מתשתיות המחשוב בעסקים, חיוני כמובן להגן במיוחד על שרתים. הגנה כזו עשויה להיות מורכבת, אך באמצעות שיטות כגון אוטומציה ניתן לפשט זאת ולצמצם את המשאבים שהעסק יידרש להשקיע בכך באופן שוטף. ניתן לגבות לענן כך שהגיבוי יהיה מוגן יותר, יתבצע בעלויות נוחות מאוד וידרוש כמה שפחות טרחה ומשאבים. ניתן כיום לבצע תהליכים מסוג זה, באופן מאובטח מאוד ועם עומס מינימלי שמנגנוני הגיבוי מטילים על המערכת.

גיבוי לענן

גיבוי לענן מספק כיום אפיק עזר חשוב ביותר להתמודדות עם משברים בתשתיות המחשוב. מה לגבי מהירות התקשורת מול שירות כזה? האם זה משנה? ומה לגבי גיבוי בתדירות גבוהה במיוחד (וכאן נכנס לתמונה גם היבט ה-Recovery Point Objectives)? מה לגבי העיכוב שעשויה להכניס התקשורת מול ספק השירות בהקשר זמן ההתאוששות (Recovery Time Objectives) אם מתאוששים באמצעות שירות ענן? והאם עצם התלות בתקשורת מולו צריכה להפריע לכם? כל עסק יענה על כך לעצמו, אבל אלה כמה נקודות שכדאי לקחת בחשבון בהקשר זה: תחום שירותי הענן, כולל היבטי התקשורת מולו, הוא בשלב זה וותיק ובשל מאוד. אינספור עסקים משתמשים בשירותים כאלה באופן שוטף, כולל בשירותים קריטיים ממש כגון שירותי גיבוי והתאוששות מאסון. אם עובדים עם ספק שירותי ענן אמין, התקשורת מולו יכולה וצריכה להיות מצוינת כך שתקבלו מענה בכל זמן על כל בעיה.

תוכנית שחזור

תכנית שחזור של מערכת ספציפית או תהליך עסקי היא הביטוי המעשי של מה שחשוב לעשות לגביה במקרה כשל. מכך נגזרים גם סדרי עדיפות והיקף המשאבים שהעסק יהיה מוכן להשקיע בהיערכות לכשל ובהתאוששות ממנו. בקונטקסט כללי ורחב יותר, ניהול סיכונים כלל ארגוני כולל בתוכו את הנושא המשני של ניהול סיכונים במחשוב. במסגרתם, הטיפול בהמשכיות עסקית (BC – Business Continuity) מתבטא בגיבוש תהליכים קונקרטיים של התאוששות מאסון (DR – Disaster Recovery) ושחזור מערכות.

מהם השירותים הרלוונטיים?

יש כמה וכמה שירותי ענן אשר עשויים לסייע לכם בהקשר זה, כגון:

  • שירותי התאוששות מאסון – שירותי עזר כגון שירות התאוששות מאסון שמציעה GNS. שירות זה מספק פתרונות גיבוי מקצועיים, לצד יכולות שחזור מהיר ומאובטח. גיבויים אוטומטיים מאפשרים זמני ההתאוששות מינימאליים. השירות מצטיין בזמינות גבוהה ומאפשר התאמה אישית לצרכי העסק. מבחינה כספית, מדובר בעלות של החל מ-$500 לחודש ותשלום רק עבור מה שצורכים בפועל, כולל סביבת התאוששות שהוקצתה בפועל במקרה אסון.
  • שירותי המשכיות עסקית – שירות המשכיות עסקית הוא פתרון רחב שצריך לקחת בחשבון החל משלב תכנון האסטרטגיה. בין תכונותיו הבולטות: שירות DR בענן עם פריסה גלובלית רחבה של שרתי החברה. גיבוי ושחזור אוטומטיים, כולל שחזור יישומים ושרתים וירטואליים, הכל לפי הגדרות ה-RTO וה-RPO המבוקשות. כמו כן, שירות זה כולל שירות תמיכה 24/7. מחיר השירות עומד על החל מ-499 דולר לחודש.
  • שירותי מחשוב לעסקים – המשכיות עסקית והתאוששות ממקרי כשל מושפעים מאוד מתשתיות המחשוב של העסק בכללן. חברת GNS מציעה קשת שירותי מחשוב לעסקים כולל תשתיות מחשוב בענן, אחסון וגיבוי בענן, עזרי אבטחת מידע, שירות LAN בענן, רישוי מספקים מובילים כגון מיקרוסופט ועוד.

סיכום

כדי לתת מענה איכותי ואמין באמת לאתגר ההמשכיות העסקית, חייבים להתעמק בפרטים הקטנים ולתכנן זאת באופן יסודי. היכרות עם המונחים RTO ו-RPO ובעיקר הבנת הרעיון שעומד מאחוריהם יסייעו לכם לממש זאת בצורה היעילה ביותר.