תקלה עולמית בפייסבוק,אינסטגרם וואטסאפ – מה כנראה קרה?
מה התקלה שגרמה לפייסבוק, אינסטגרם וואטסאפ לקרוס? ה Facebook BGP
קודם כל בואו נבין מהו BGP ,
Border Gateway Protocol
בקצרה, BGP הוא "מפה" שאומרת לכל הראוטרים בעולם אך להגיע ליעד מסוים בצורה הקצרה והיעילה ביותר, המפה מפורסמת ע"י FB עצמם וכנראה שהיא נמחקה.
ה AS של פייסבוק הוא בקיצור ASN הקוד הוא AS32934 והוא אמור כל הזמן לעדכן את ה Prefix (כתובת ה IP ביחד עם ה Subnet שלהם) של איזה רשתות ה AS מחזיק מאחוריו, והוא צריך לעדכן את הAS האחרים, כך שחבילת מידע מגיע אל AS אחד הוא ידע לאיפה להעביר ולאיזה כתובת IP לשלוח את המידע
כל זה באמצעות טבלאות הBGP שמפרסמות את ה Prefix של פייסבוק אל ה AS האחרים.
Cloudeflare, טוענים שבשעה 16:51 (זמן עולמי, UTC) הם פתחו תקלה בIANA שהכותרת שלו "תקלה בתרגום כתובת הDNS של Facebook.com) ואחר כמה דקות, כל השירותים של פייסבוק הפסיקו לעבוד.
כאשר הדפדפן שלכם מבקש את Facebook.com, הוא תחילה פונה לDNS בשביל לתרגם את הכתובת לכתובת IP, אבל התוצאה היא שאין כתובת IP, נניח והיה כתובת IP הבעיה היא כעת טבלת ה BGP:
בקצרה: ברגע שיש לכם כתובת IP, הBGP יחשב מה הדרך המהירה ביותר להגיע , דרך איזה AS להגיע.
Autonomous System
ה autonomous system הם "מרכזים" של ראוטרים שמנוהלים על ידי ישות אחת, נניח ספקית האינטרנט שלכם, בדרך אתם עוברים כמה ספקיות או חברות כאלו על מנת להגיע לפייסבוק.
נניח ואתם רוצים להגיע מהמחשב בבית שלכם אל אתר מסוים, אתם תחילה תגיעו לAS מסוים בישראל שהוא מאגד בתוכו המון ראוטרים והם AS אחד , שם יוחלט ע"י טבלת ה BGP מהיא הדרך המהירה ביותר להגיע ליעד מסוים.
הAS שהם קבוצת ראוטרים, מחזיקים טבלאות BGP של כל רשת ע"מ לדעת איך להגיע אל אותה הרשת, לאחר מכן יוחלט מה הדרך המהירה ביותר להגיע אליה.
כל ישות כזו (AS) מפרסמת את ה AS שלה לאחרים בשביל לדעת כיצד להגיע ליעד מסוים.
נניח יש AS123 שרוצה להגיע ל AS098 , עכשיו יש כמה דרכים להגיע אל היעד, ה AS של פייסבוק יפרסם לכולם מה הדרך הכי מהירה להגיע אליו והם יפרסמו את זה הלאה.
BGP של פייסבוק
למרות שיש כמה דרכים להגיע, הבעיה היא שכאשר ה AS של פייסבוק הפסיק לפרסם את טבלאות ה BGP שלו, הוא למעשה "הפסיק" להתקיים ברשת האינטרנט.
Cloudfalre אומרים כי בשעה 16:58 הם הבחינו שפייסבוק הפסיקו לפרסם את ה DNS Prefix שלהם (כתובות IP עם הSubnet שלהם) ומציגים שהראוטר שלהם לא מציג את טבלת הBGP של פייסבוק.
יותר מכך, הם פשוט הפסיקו לפרסם את טבלאות ה BGP ומבחינת ה AS האחרים ברשת האינטרנט, Facebook הפסיקו "להתקיים" כי אין מידע איך להגיע לAS שלהם.
מתוך המאמר של Cloudflare.com
תבינו, הטבלה פה צריכה להיות עצומה, עם המון המון כתובות IP וה Prefix שלהם.
הם מתארים שלמרות שעדייi היו ניתובים לרשת שלהם, בעיה אחרת הייתה שברגע שהם רשם הדומיינים של עצמם, והDNS הפסיק לעבוד, אנשים לא יכולים לתרגם את Facebook.com ולכן לא יכולים להגיע.
צריך לזכור, בגלל שפייסבוק היא ISP והיא גם AS של עצמה היא מגדירה את כל הBGP שלה ומפרסמת את הכתובות שלה לכל העולם, הכוונה היא שהיא נותנת את הטבלאות לAS האחרים בכדי שידעו אך להגיע לשרתים שלה.
אחת הסיבות שהדומיין שלהם "כביכול" זמין לרכישה, זה בגלל שהם רשם הדומיינים של עצמם
אחת ההשערות של מומחים ברחבי העולם היא שאנשי הסיסטם והתקשורת שנמצאים בחוות השרתים, ברגע התקלה, לא התעסקו מעולם בBGP וזה יוצר בעיה גדולה יותר שכן צריך כעת להגדיר ידנית את כל טבלאות ה BGP שנמחקו (כנראה בטעות)
לכן כשאתם מנסים להגיע לפייסבוק אתם לא מצליחים מצד אחד לתרגם את הכתובת Fcebook.com ומצד שני גם כאשר יש כתובת IP אז אתם לא מצליחים להגיע לפייסבוק כי אתם מגיעים לנקודה בה "למידע" אין את הידע אך להגיע.
עדכוני קונספירציה: כמה ציוצים בטוויטר טוענים ש: (כל הנכתב מטה הוא בגדר לכאורה)
- אנשי התשתיות של פייסבוק לא הצליחו להיכנס לחוות השרתים כיוון שהגישה אליהם נותקה, המערכות בקרה מחוברת לרשת וברגע שאין רשת, הגישה נפסקה
- טענה נוספת שהגיעו אנשים "לפרוץ" פיזית את הדלתות בשביל לקבל גישה לחוות השרתים
- אנשי התשתיות רגילים לגשת לשרתים ולהגדרות מ"גישה מהבית" ופתאום אין גישה לרשת של פייסבוק והם צריכים להגיע פיזית
- גם כאשר הגיעו לחווה , רובם לא ידע איך להגדיר את הטבלאות BGP מחדש כיוון שבודדים מהחברה והתשתיות מבצעים את הפעולות האלו.