Skyguide: Gute Noten fürs Pannen-Management

19. Dezember 2022: Eine gravierende technische Panne sorgte am 15. Juni 2022 dafür, dass die Schweizer Flugsicherung Skyguide während rund fünf Stunden keinen Flugverkehr abfertigen konnte. Der Bund mit dem zuständigen Departement für Umwelt, Verkehr, Energie und Kommunikation (UVEK) hat eine externe Untersuchung zum Vorfall in Auftrag gegeben. Diese kommt zum Schluss, dass die Reaktion der Skyguide auf den Vorfall angemessen war und bestätigt das von Skyguide identifizierte Verbesserungspotenzial in der Netzwerkinfrastruktur. Der Bericht zeigt aber auch: Es gab schon zwei Tage vor der Störung Warnsignale im Netzwerk.

Am 15. Juni 2022 hat es bei der Schweizer Flugsicherung Skyguide eine technische Störung gegeben. Aus Sicherheitsgründen hat sie sodann entschieden, den von ihr überwachten Luftraum zu schliessen («Clear the sky»). Skyguide hat in der Folge während rund fünf Stunden keinen neuen Flugverkehr aufgenommen. Heute wurde ein Bericht zum Vorfall von Accenture als externer Untersuchungsstelle veröffentlicht. Sie kommt zum Schluss, dass Skyguide ein umfassendes Krisenmanagement etabliert hat und dieses am 15. Juni 2022 effizient und effektiv angewandt wurde. Der Entscheid, den Schweizer Luftraum zu schliessen war laut der externen Beurteilung angemessen, da nicht vorhergesagt werden konnte, wie gravierend die Störung ist und wann sie behoben werden kann. Die Untersuchung zeigte auch, dass Skyguide den Vorfall intern detailliert aufgearbeitet hat. Die in ihrem internen Bericht identifizierten Punkte und Empfehlungen erachten die externen Gutachter als valide und sinnvoll.

Ein Mangel bei einem Netzwerk-Switch wurde als Ursache der Störung identifiziert. Die Netzwerkkomponente habe nicht über die aktuelle Version der Software verfügt, so der Bericht. Skyguide habe zwar einen funktionierenden Prozess für die Aktualisierung der Netzwerkkomponenten. Dieser Prozess ist aus Sicht der unabhängigen Prüfer aber zu risikoorientiert und zu konservativ. Möglicherweise hätte mit einem früheren Update der Vorfall vom 15. Juni 2022 verhindert werden können. Denn die Untersuchung des Netzwerkes habe gezeigt, dass erste Warnsignale in Form von Logeinträgen auf einzelnen Netzwerkkomponenten bereits am 13. Juni 2022 aufgetreten sind. Es brauche Betriebsprozesse für das Krisenmanagement im Netzwerkbereich, die in solchen Situation zu einer effektiven und effizienten Analyse und Behebung der Warnsignale beitragen können. Zudem fehle Skyguide für ihr Netzwerk eine lückenlose Überwachung («End-to-End-Monitoring»). Diese hätte am 15. Juni zu einer effizienteren Analyse des Fehlers beitragen können und so möglicherweise zu einer rascheren Behebung der Störung geführt, so eine der Folgerungen des Berichts.

Der unabhängige Untersuchungsbericht enthält 14 Empfehlungen. Dazu gehört der Aufbau eines Betriebskontinuitätsmanagements (BCM), um die für die Flugsicherung kritischen Prozesse und Systeme besser zu schützen oder alternative Abläufe zu ermöglichen. Im Rahmen einer umfassenden Notfallwiederherstellungsstrategie sollen Massnahmen erarbeitet werden, die nach dem Ausfall von IT-Komponenten eingeleitet werden. Weiter sollen die Informationen zur Verfügbarkeit der Systeme gegenüber den Flugverkehrsleitenden verbessert und die Notfall-Checkliste für deren Supervisoren adaptiert werden. Aufgrund der eigenen Untersuchung hat Skyguide bereits begonnen, verschiedene Massnahmen umzusetzen und wird auch die Empfehlungen aus der unabhängigen UVEK-Untersuchung umsetzen. pd www.skyguide.ch