Nowości

Zakłócenia T-Mobile spowodowały ogólnokrajową awarię, ale FCC nie karze przewoźnika

 T-Mobile, która mówi:
Powiększać / T-Mobile na nowojorskim Times Square 15 października 2020 r.

Getty Images | Obrazy SOPA

Federalna Komisja Łączności zakończyła dochodzenie w sprawie T-Mobile w sprawie awarii sieci, którą przewodniczący Ajit Pai nazwał „niedopuszczalną”. Jednak zamiast ukarać operatora telefonii komórkowej, FCC po prostu wydaje publiczne zawiadomienie, aby „przypomnieć” firmom telefonicznym o „najlepszych praktykach przyjętych w branży”, które mogły zapobiec wyłączeniu T-Mobile.

Po 12-godzinnej awarii w całym kraju 15 czerwca, która zakłóciła usługi SMS-ów i połączeń telefonicznych, w tym połączenia alarmowe pod numer 911, Pai napisał, że „Awaria sieci T-Mobile jest niedopuszczalna” i że „FCC wszczyna dochodzenie. Domagamy się odpowiedzi– tak samo jak amerykańscy konsumenci ”.

Pai ma historię twardych rozmów z przewoźnikami i nieprzestrzegania kar, które mogą mieć większy efekt odstraszający niż surowo sformułowane ostrzeżenia. Wydaje się, że stało się to ponownie wczoraj, kiedy FCC ogłosiła wyniki dochodzenia w sprawie T-Mobile. Pai powiedział, że „awaria T-Mobile była porażką”, ponieważ przewoźnik nie postępował zgodnie z najlepszymi praktykami, które mogły temu zapobiec lub zminimalizować, ale nie ogłosił żadnej kary. Sprawa wydaje się być zamknięta na podstawie wczorajszego ogłoszenia, ale skontaktowaliśmy się dzisiaj z biurem przewodniczącego Pai, aby zapytać, czy zbliża się jakakolwiek kara dla T-Mobile. Zaktualizujemy ten artykuł, jeśli otrzymamy odpowiedź.

FCC szczegółowo opisuje błędy T-Mobile

W raporcie z dochodzenia personelu zidentyfikowano kilka błędów popełnionych przez T-Mobile podczas przerwy w dostawie, która rozpoczęła się, gdy T-Mobile instalował nowe routery w południowo-wschodnich Stanach Zjednoczonych. W przypadku awarii światłowodowego łącza transportowego w regionie sieć T-Mobile powinna przenieść ruch na inne łącze. Jednak operator „źle skonfigurował wagę łączy do jednego ze swoich routerów”, co „uniemożliwiło przepływ ruchu do nowego aktywnego routera zgodnie z przeznaczeniem”. T-Mobile nie wdrożył żadnego bezpiecznego procesu, aby zapobiec błędnej konfiguracji lub ostrzec inżynierów sieci o problemie.

Rynek Atlanty „został odizolowany” od reszty sieci, przez co wszyscy użytkownicy LTE w okolicy stracili łączność. Błąd oprogramowania pogorszył sytuację, uniemożliwiając urządzeniom mobilnym w okolicy Atlanty ponowną rejestrację w IP Multimedia Subsystem przez Wi-Fi. Zamiast kierować próby rejestracji urządzenia do innego węzła, „system rejestracji wielokrotnie kierował próby ponownej rejestracji dla każdego urządzenia mobilnego do ostatniego węzła zachowanego w jego rejestrach, który był niedostępny z powodu izolacji rynku”.

Błąd oprogramowania istniał w sieci T-Mobile od miesięcy. „Ten błąd oprogramowania prawdopodobnie nie powodował problemów przed wystąpieniem tej przerwy, ponieważ przerwa była pierwszą zauważalną izolacją rynku od czasu, gdy T-Mobile zintegrował to oprogramowanie ze swoją siecią” – powiedział FCC. Regularne testy „mogły wykryć usterkę oprogramowania i błędną konfigurację routingu, zanim zdążyłyby wpłynąć na rozmowy na żywo” – powiedział również FCC.

Po rozpoczęciu się kłopotów 15 czerwca inżynierowie T-Mobile „zaostrzyli się [the outage’s] wpływ, ponieważ błędnie zdiagnozowali problem. ”Raport FCC kontynuował:

T-Mobile uważał, że połączenie światłowodowe, które zawiodło wcześniej tego dnia, nadal powoduje trwające przerwy w dostawie. Kierując się tym przekonaniem, T-Mobile ręcznie wyłączył łącze, próbując przekierować z niego ruch. Jednak z powodu wciąż błędnie skonfigurowanych wag Open Shortest Path First te kroki odtworzyły początkowe warunki wyłączenia. Klienci LTE na rynku w Atlancie zostali ponownie odłączeni od sieci LTE i zmuszeni do nawiązywania połączeń przez Wi-Fi, a ich próby rejestracji ponownie zakończyły się niepowodzeniem i wywołały burzę rejestracyjną, która spowodowała dalsze przeciążenie IP Multimedia Subsystem T-Mobile.

Inżynierowie T-Mobile niemal natychmiast zorientowali się, że błędnie zdiagnozowali problem. Nie byli jednak w stanie rozwiązać problemu, przywracając łącze, ponieważ wymagane do tego narzędzia do zarządzania siecią zdalnie korzystały z tych samych ścieżek, które właśnie zostały wyłączone. Kiedy inżynierowie T-Mobile mogli uzyskać dostęp do sprzętu na miejscu i poprawić swój błąd, przywracając połączenie godzinę później, klienci na rynku Atlanty mogli ponownie spróbować zarejestrować się w VoLTE [Voice over LTE]. Jednak to ponownie spowodowało dodatkowe przeciążenie, ponieważ inżynierowie T-Mobile nie zajęli się jeszcze błędem oprogramowania, który uniemożliwiał ukończenie rejestracji.

Awaria ma miejsce w całym kraju

Raport FCC wyjaśnił, w jaki sposób awaria rozprzestrzeniła się z rynku Atlanty, obejmując cały kraj. Ruch zewnętrzny przeznaczony dla systemu Atlanta został przekierowany do innych regionów, co „spowodowało wystarczające przeciążenie w tych systemach rejestracji, aby sieć T-Mobile wysyłała próby rejestracji do innych węzłów. Błąd oprogramowania ponownie kierował próby ponownej rejestracji do ostatniego zarejestrowany węzeł, który prawdopodobnie już doświadczał poważnych zatorów ”. Wkrótce potem rejestracje „IP Multimedia Subsystem, VoLTE i Voice over Wi-Fi zaczęły zawodzić w całym kraju”.

Zdecydowana większość klientów T-Mobile nie była w stanie połączyć się z Voice over LTE lub Voice over Wi-Fi, w związku z czym „wróciła do sieci 3G i 2G T-Mobile z komutacją obwodów, aby wykonywać i odbierać połączenia, podczas gdy urządzenie kontynuowało próby rejestracji w sieci VoLTE. ” Spowodowało to przeciążenie sieci 3G i 2G, co spowodowało niepowodzenie wielu połączeń telefonicznych. Węzły sieci nadal utrzymywały zasoby dla tych sesji połączeń po zakończeniu połączeń, przytłaczając zasoby obliczeniowe węzłów i powodując jeszcze więcej błędów połączeń.

Zostaw komentarz

Maciek Luboński
Z wykształcenia jestem kucharzem , ale to nie przeszkadza mi pisać dla Was tekstów z wielu ciekawych dziedzin , których sam jestem fanem.Piszę dużo i często nie na tak jak trzeba , ale co z tego skoro tak naprawdę liczy się pasja.

Najlepsze recenzje

Video

gallery

Facebook