ΙΤ Disaster Recovery στην COSMOTE Χρίστος Χριστόπουλος
Αναγνώριση κρίσιμων Λειτουργιών... … τις οποίες υποστηρίζει η Πληροφορική Καταλήξαμε σε τρεις συγκεκριμένες: Εγγραφή και ενεργοποίηση νέων συνδρομητών (subscription) Customer Care και Billing ERP Βασική εκτίμηση κόστους downtime/ώρα Επικοινωνία και επικύρωση πρόθεσης Συμφωνία των «χρηστών» των υπηρεσιών Πρόβλεψη προϋπολογισμού
Technology Stacks που υποστηρίζουν τις κρίσιμες υπηρεσίες Enterprise Storage Box – Storage Area Network Storage Clustered UNIX Servers Servers Oracle Database “Online” IFS BSCS Application IΤ network Network HP-UX True64 Λειτουργικό Workstations & Web Servers Client Client & Web access Client software Client & Batch Client Application Subscription ERP CC & Billing Υπηρεσία
Ορισμός και ταξινόμηση κινδύνων Εντοπισμός πιθανών κινδύνων που απειλούν τα συστήματα Ταξινόμηση σε global και stack-level. Global επηρεάζουν ολόκληρο το stack (οριζόντια) Stack-level επηρεάζουν ένα stack (κάθετα) Ιεράρχηση κινδύνων με βάση: Τον αντίκτυπο που επιφέρουν Την πιθανότητα εμφάνισης Πλήρης πίνακας ορισμού κινδύνων
Πρόληψη και Αντιμετώπιση Κίνδυνοι που προβλέπονται και προλαμβάνονται Ποιοι είναι; Πως αντιμετωπίζονται; Τα ‘μέτρα’ τα: Έχουμε σε πλήρη ανάπτυξη Έχουμε, αλλά όχι ανεπτυγμένα (υλοποιημένα) Μπορούμε να τα φτιάξουμε Πρέπει να τα αγοράσουμε Κίνδυνοι που απαιτούν ανάκαμψη Ίδια διαδικασία με πιο πάνω
Υλοποίηση (ανάπτυξη, προμήθεια, κλπ) Με βάση τις πληροφορίες που συγκεντρώθηκαν Σε συμφωνία με τους «χρήστες» για το ποσοστό κάλυψης της κάθε λειτουργίας Χρονοδιάγραμμα και προϋπολογισμός έργου Έκδοση ανάλογων RFI και RFP Υπολογισμός εσωτερικού κόστους ανάπτυξης Ολοκλήρωση του έργου Λεπτομερής σχεδιασμός της λύσης σε συνεργασία με τους προμηθευτές Προμήθεια και ανάπτυξη των ‘μέτρων’ Επαναληπτική διαδικασία δοκιμασίας ‘Sign-off’
Σημερινή υλοποίηση Υποδομή: Εγκατάσταση ικανής υποδομής συστημάτων στα δύο sites Εγκατάσταση δικτυακής υποδομής Εγκατάσταση υποδομής storage Dedicated high bandwidth line across sites Λειτουργίες: Online data replication για τις τρεις υπηρεσίες (EMC – CNT) Καθημερινή μεταφορά backup ταινιών από και προς το κύριο site Διαδικασίες: Δοκιμές μετάπτωσης των υπηρεσιών από ένα site στο άλλο Λειτουργία στο εναλλακτικό site για μικρά χρονικά διαστήματα.
Εμπειρίες υλοποίησης & λειτουργίας Για αποφυγή προβλημάτων: Συμφωνία με τους χρήστες για το απαιτούμενο ποσοστό κάλυψης (ευθέως ανάλογο και του κόστους) Σχεδιασμός με ‘περιθώρια’ στο bandwidth Πολύ καλή τεκμηρίωση όλων των διαδικασιών(SOPs) Στάθμιση της απόφασης “switch over” στο εναλλακτικό site Επιπρόσθετα οφέλη: Εκτέλεση περιοδικών εργασιών στο εναλλακτικό site για αποσυμφόρηση του κύριου. Παράδειγμα: Archiving παλαιών στοιχείων από τις βάσεις. Προγραμματισμένη μεταφορά λειτουργιών από το ένα site στο άλλο για την μείωση του planned downtime.
Επίλογος και μέλλον Σαφώς όχι πλήρες, αλλά ικανό σχέδιο. Για το μέλλον επιθυμούμε τα εξής: Ανάπτυξη περαιτέρω τεχνογνωσίας εσωτερικά: Για να είμαστε περισσότερο ‘pro active’ Για να βελτιώσουμε το ‘change management’ Για να βελτιώσουμε το ‘testing’ Ένταξη στην διαδικασία και άλλων κρίσιμων λειτουργιών που υποστηρίζει η Πληροφορική Ένταξη του disaster recovery πλάνου της Πληροφορικής στο υπό διαμόρφωση εταιρικό BCP
Σας ευχαριστώ πολύ!