האתר הישראלי להנדסת תכנה

דף ראשי | מפת האתר | רשימת מושגים | מקורות נוספים | אודות
גילוי תקלות התאוששות מתקלות

הערכת נזקים

בשלב זה עוסקת המערכת בנסיון להבין איזה נזק אירע בעקבות התקלה שזוהתה. הנזק שעלול להגרם הוא מגוון למדי, אבל כללית ניתן לחלק אותו לפגיעה בשלמות נתוני המערכת ולפגיעה ביכולת הביצוע של חלקים מהמערכת.

שלמותם של נתוני המערכת עלולה להפגע כתוצאה ממידע מזובל שנכתב למבני הנתונים של המערכת, מתנועות שהספיקו להתבצע רק בחלקן (ולא הספיקו לבצע את עדכון מבנה הנתונים במלואו), אם כתוצאה מכשל חיצוני למערכת (כגון הפסקת חשמל) או כתוצאה מכשל פנימי במערכת (קריסת המערכת עקב שגיאה). על כל פנים, ישנן מספר דרכים להעריך את שלמותם של הנתונים ואת אמינותם של מבני הנתונים המחזיקים בהם:
סיכום ביקורת – אלגוריתם מתמטי כלשהו המופעל על הנתונים ומפיק מספר אופייני אשר ניתן להשוואה לערך הנוכחי כאשר יש חדש לחוסר עקביות בנתונים. הסיכוי כי אוסף נתונים המכיל שגיאה יפיק מן האלגוריתם את אותו הערך שהתקבל מאוסף הנתונים במצבו התקין הוא אפסי.
קישורים יתירים – הוספת קישורים נוספים בין הישויות במבני הנתונים המאפשרים להצליב את המידע בו כדי לגלות סתירות פנימיות. למשל, עץ בינארי רגיל מכיל הצבעות מהאב לשני בניו. בעץ עם יתירות יכילו גם הבנים הצבעה אל אביהם. כך, במקרה של שיבוש במבנה הנתונים ניתן יהיה לגלות את הסתירה ולהתריע על הנזק.

פגיעה ביכולת הביצוע של המערכת עלולה להגרם אם כתוצאה מתקלה כלשהי קרס תהליכים מסוימים במחשב, שהריצו למעשה מודולים שונים של המערכת. כתוצאה מהקריסה קיימים כעת מודולים במערכת שלא ימשיכו להתבצע ולמעשה ישביתו בכך חלקים מהמערכת.
ניתן להעריך נזק כזה בעזרת קוצבי זמן ניטור – אלו בדיקות קצובות על ידי שעון המערכת המוודאות שתהליך כלשהו הגיע לנקודת ביקורת מסוימת. לתהליך המפוקח באופן כזה ישנו משתנה אותו עליו לדרוך בכל פעם שהקוד עובר נקודה מסוימת. התהליך המנטר מתעורר אחת למשך זמן הבדיקה שהוגדר ובוחן את משתנה הבדיקה. באם הוא מגלה שהמשתנה לא נדרך מאז בדיקת הניטור האחרונה הוא מסיק שהתהליך המנוטר קרס, ומתריע על כך. משך הזמן שיקבע לבדיקת הניטור תלוי במהירות בה נדרשת המערכת להתריע על תקלות מסוג זה.

גילוי תקלות לתחילת הדף התאוששות מתקלות
©איתן 2003. כל הזכויות שמורות למערכת המידע איתן