banner
Casa / Blog / Nats evidenzia i limiti dell'automazione e le carenze del backup
Blog

Nats evidenzia i limiti dell'automazione e le carenze del backup

Jul 08, 2023Jul 08, 2023

Svelare l'hype dietro l'IT per la creazione di utili strategie per i CIO.

Considerando l'interruzione delle festività di agosto causata da un problema tecnico di controllo del traffico aereo al Nats, ci sono una serie di considerazioni immediate su cui i CIO dovrebbero riflettere. Ci sono rapporti secondo cui dati errati di un piano di volo presentato da una compagnia aerea francese potrebbero aver innescato l'interruzione del Nats. Martin Rolfe, CEO di Nats, ha dichiarato: “Le indagini iniziali sul problema mostrano che si riferisce ad alcuni dei dati di volo che abbiamo ricevuto”. La prima cosa a cui bisogna rispondere è come i dati non validi possano causare un guasto così catastrofico da compromettere sia il sistema principale che quello di backup. L’integrità dei dati è, senza dubbio, la componente più importante delle applicazioni moderne. Senza il flusso di informazioni accurate, le applicazioni basate sui dati non possono funzionare in modo coerente. Tuttavia, se alcuni dati di input causano un malfunzionamento, si spera che il sistema di backup possa essere rapidamente chiamato in causa per riportare il sistema a uno stato stabile. Dovrebbe essere possibile identificare abbastanza rapidamente i dati non corretti che hanno danneggiato il sistema primario e quindi correggerli. Chiaramente, nei sistemi con un elevato throughput di dati, ci sarà un ritardo nel svelare le transazioni avvenute dopo l'invio di dati non validi o malformati. Ma questo è il motivo per cui manteniamo backup e live mirroring per garantire che l'integrità del sistema possa essere ripristinata il più rapidamente possibile. Sebbene i problemi tecnici che interessano il sistema di pianificazione dei voli di Nats siano stati identificati e risolti in poche ore, il ritardo ha causato gravi interruzioni di viaggio tra le compagnie aeree.

Il processo messo in atto da Nats era effettivamente un sistema di sicurezza, che manteneva l’integrità del sistema e consentiva al controllo del traffico aereo di operare, anche se a capacità ridotta. "I nostri sistemi, sia primari che di riserva, hanno risposto sospendendo l'elaborazione automatica per garantire che nessuna informazione errata relativa alla sicurezza potesse essere presentata a un controllore del traffico aereo o avere un impatto sul resto del sistema del traffico aereo", ha affermato Rolfe. il secondo aspetto dell’incidente Nats che i CIO e i leader IT dovrebbero considerare quando assegnano le risorse ai propri piani di continuità aziendale. Sì, dovremmo sempre avere un mezzo per ricorrere a un sistema di sicurezza. Ma se i processi coinvolti nel mantenere il sistema in funzione dopo un guasto causano questo livello di interruzione, funziona davvero? Non ci si può aspettare che un sistema di sicurezza funzioni con lo stesso livello di efficienza del sistema primario, ma le parti interessate devono indagare a fondo scenario peggiore quando viene implementato il fail-safe per valutare quale livello di degrado del servizio è accettabile.