רוב הסיכויים שנפגעת מבעיות אינטרנט אתמול. הפסקת ה-AWS השפיעה על למעלה מ-2,500 חברות ושירותים ברחבי העולם – עלותה מוערכת לכל המעורבים בכ-2.5 מיליארד דולר.
והכל היה בגלל אזור שרת אחד בצפון וירג'יניה – נקודת כשל אחת הורידה אלפי חברות ושירותים ציבוריים חיוניים ברחבי העולם.
כאשר AWS מתעטש, חצי מהאינטרנט חולה בשפעת.
וזה קרה למרות ששיטות העבודה המומלצות של AWS קובעות שחברות משתמשות באזורי שרתים הקרובים ביותר למאגר משתמשי הקצה הגדול ביותר של השירות שלך. אז איך זה קרה? והאם זה רק חשף עד כמה האינטרנט בעצם שביר? התראת ספוילר: כן. תן לי להסביר.
איך התרחשה הפסקת AWS?
אמזון פרסמה הצהרה על ההפסקה, אך מדובר ב-Nothingburger שכנראה פורסם מסיבות משפטיות. עורכת הבינה המלאכותית שלנו אמנדה קאסוול סיפקה תובנה הרבה יותר מפורטת לגבי האופן שבו התרחשה הפסקת ה-AWS.
אבל אם לסכם ממש מהר, המשבר החל בתוך מרכז הנתונים העמוס ביותר של Amazon Web Services בצפון וירג'יניה (US-EAST-1), שם כשל ברשת ליבה גרם לבעיה במערכת שמות הדומיין (DNS). חשבו על ה-DNS כעל ספר הטלפונים המרכזי של האינטרנט, ו-DynamoDB (שירות מסד נתונים קריטי) היה הערך החשוב ביותר שלו.
ספר הטלפונים המטאפורי החל למחוק באופן ספונטני את הכתובת של המחסן הראשי. כל המערכות הפנימיות לשירותי מפתח ניסו פתאום להתקשר למסד הנתונים של DynamoDB, אך ה-DNS לא הצליח לספק את הכתובת הדיגיטלית הנכונה. ללא הוראות לאן לשלוח את הנתונים, כל האפליקציות הללו נתקעו, קצו פסק זמן והחלו לקרוס.
כשל ראשוני זה גרם לאחר מכן לכשל מדורג מסיבי על פני כל הענן. תארו לעצמכם רשת חשמל: כאשר תחנת משנה מרכזית אחת עוברת למצב לא מקוון, הזינוק הפתאומי של התנועה מציף את התשתית שנותרה. US-EAST-1 היא אותה תחנת משנה מרכזית ששולטת בזרימת החשמל בכל שאר התחנות, שמחזיקה גם ב"ספר הטלפונים" הזה.
קבל גישה מיידית לחדשות מרעננות, לביקורות החמות ביותר, למבצעים מעולים וטיפים מועילים.
זה גרם לשירותים כמו EC2 (מחשבים וירטואליים) ולמבדה (קוד ללא שרת) להיכשל, ויצרו צבר מאסיבי של בקשות. גם לאחר שאמזון תיקנה את ערך "ספר הטלפונים", הרשת עדיין הייתה עמוסה מדי, ודרשה שעות של עבודה ידנית ו"הגבלת קצב" (האטה זמנית של תנועה חדשה) כדי לנקות את העומס ולהחזיר את היציבות במלואה.
מי הושפע?
כן, כולנו קוננו על הבעיות הגדולות. Snapchat ו-Reddit נפלו, כך גם Fortnite, PlayStation Network, שירותי סטרימינג שונים והרבה מאוד אתרים מבוססי תוכן. פסי Duolingo ו-Wordle היו בסיכון, אבל היו קורבנות מפתיעים יותר בהתחשב במיקום.
אם יש לך בית חכם ואבטחה אישית, רוב הסיכויים שלא תוכל לעשות הרבה בבית שלך. כאשר פעמוני דלת/מצלמות צלצול ומכשירי אמזון אלקסה היו תלויים בענן באמצעות AWS, האוטומציות והשגרה קרסו באופן מיידי. למי שמשתמש ב-Life360 לשקט נפשי משפחתי, גם זה ירד.
החינוך גם חטף מכה, כאשר הפלטפורמה החינוכית הגדולה Canvas נפלה – מה שהותיר את התלמידים לא יכולים לגשת לעבודות קורסים או להגיש מטלות. גם הטכנולוגיה הפיננסית עשתה צלילה, מכיוון שכמה בנקים גדולים בבריטניה חוו הפסקות, כמו גם Venmo ו-Coinbase בארה"ב
אבל הדבר המדאיג ביותר היו שירותים ציבוריים קריטיים, תחבורה ומערכות ארגוניות. רשות המסים של בריטניה HMRC נפלה, אתרי האינטרנט של יונייטד איירליינס ודלתא היו במצב לא מקוון, מה שאומר שאנשים לא יכלו להזמין טיסות, וזום, סלאק ו-Xero לא היו. הכל בגלל מרכז אחד במערב וירג'יניה!?
קווי החוץ שורטטו לראשונה העונה כדי לשלול את השער השני של טיאגו עבור ברנטפורד ❌אין טכנולוגיית אופסייד חצי אוטומטית זמינה היום עקב הפסקת ה-AWS 👀 pic.twitter.com/7vxv6fZ3CE20 באוקטובר 2025
כמו כן, באופן מצחיק, בעיות הפסקות AWS הורגשו בעולם הספורט, כאשר טכנולוגיית החוץ האוטומטית למחצה המשמשת בפרמיירליג כדורגל ירדה – מה שהפך את ה-VAR במשחק ווסטהאם לתהליך מעורב יותר.
מה צריך לקרות עכשיו?
הנה השאלה של 2.5 מיליארד דולר עבור שירותי האינטרנט של אמזון – מדוע לכל הרוחות הרבה מהתשתיות המרכזיות בעולם תלויות בנקודת כשל בודדת כמו זו? כן, אני יודע שזו אפשרות "ברירת המחדל", אבל זה מבוסס אך ורק על ההקשר ההיסטורי. והקשר היסטורי לא אמור להפוך ולו אזור אחד למערכת העצבים המרכזית לתעבורה יומית באתר.
העולם הדיגיטלי מסתמך על קומץ חברות טכנולוגיה ענקיות עבור שירותים קריטיים כמו זה, אז האם הגיע הזמן שהרגולטורים והחברות יחייבו שינוי?
הפעולות הגדולות
גם כאן יש תקדים לפעולה ממשלתית, וצריך לשאול את השאלות האלה שוב ושוב. אם אישים פוליטיים נתקלים במאמר זה, אנא קח את השאלות הללו והעבר אותן לאמזון! ואם יורשה לי להציע שני פתרונות:
- הפוך ריבוי אזורים לחובה: ארכיטקטורת המערכת של שירותי מפתח היא קריטית מכדי להתבסס במקום אחד בלבד. צריך להיות כשל חי באזור נפרד, כמו אירופה או אסיה, כדי לעקוף זאת בעתיד.
- ממשלות צריכות להיות קשוחות יותר: כללים עבור שירותים קריטיים כמו בנקאות, חינוך, תחבורה ושירותי ממשלה צריכים לכלול תוכנית גיבוי ב-IT שלהם. זה אומר דרישות קשות יותר כמו אסטרטגיות ריבוי עננים.
מה אתה יכול לעשות?
אבל מה איתך? כי אם ההיסטוריה תחזור על עצמה, כולנו יכולים לחזור למצב הקיים עד לפעם הבאה ש-AWS ישתעל ורוב האינטרנט ידבק בשפעת.
ובכן, הדבר הראשון שאתה יכול לעשות הוא להפוך את הבית החכם שלך לעמיד בפני הפסקות. פעמוני דלת ומכשירי אלקסה תלויים לחלוטין בענן. אתה צריך לחפש מכשירים הפועלים על מערכות פרוטוקול מקומיות כמו Matter, מה שהופך את השליטה המקומית לדרישת ליבה.
אבל המשחק הארוך עבורך (ולי, וכל השאר) הוא לדרוש יתירות טובה יותר מהטכנולוגיה שבה אתה משתמש מדי יום. והדרך שבה חברות מקשיבות היא לפגוע בהן היכן שזה כואב – הארנק שלהן.