Παρακολουθούμε την μετακόμιση, μέσα από την ματιά των υπεύθυνων συναδέλφων μας

Η καρδιά των υπολογιστικών υπηρεσιών της Interamerican χτυπά πλέον στο Athens Data Center Campus της εταιρίας Lamda Hellix στο Κορωπί. Η μεταφορά τους εκεί έχει ήδη αποσπάσει ένα χρυσό βραβείο, στην κατηγορία «Best Cloud Computing/Data Center Project» των Digital Finance Awards 2022, χάρη στην πρωτοποριακή ιδέα της εφαρμογής πρακτικών Agile και CI/CD όχι σε λογισμικό αλλά σε Data Center, η οποία μείωσε τον χρόνο διακοπής υπηρεσιών κατά 75%, βελτίωσε τον συνολικό χρόνο εκτέλεσης του έργου κατά το ήμισυ και ελαχιστοποίησε το ρίσκο από απρόβλεπτους παράγοντες.

Επιμελήθηκε η Βίβιαν Αραβανή, IT Strategy & Governance Business Support
Content contributors:
Μάριος Συντιχάκης, IT Strategy & Governance Leader
Βαγγέλης Σαλιάρης, Chapter Leader
Έφη Μήτση, Senior Software Engineer

To 2022 βρίσκει το κέντρο δεδομένων μας να λειτουργεί από το Athens Data Center Campus της εταιρίας Lamda Hellix στο Κορωπί. Η τελική φάση της μεταφοράς του εκεί από το κτίριο της οδού Δοϊράνης 240, εξελισσόταν επί ενάμιση μήνα και απασχόλησε μια ομάδα 20 περίπου μηχανικών της Interamerican και της Kyndryl. Συνολικά το έργο, στο οποίο συνεργάστηκαν 7 εταιρίες, διήρκησε 6 μήνες, το μισό διάστημα από τη διεθνή πρακτική με βάση στοιχεία της εταιρίας Gartner.

Ας πάρουμε όμως τα πράγματα από την αρχή. Τι είναι ένα data center; Ο Μάριος Συντιχάκης, IT Strategy & Governance Leader εξηγεί: «Ένα data center είναι το μέρος στο οποίο βρίσκεται εγκατεστημένο το δίκτυο κεντρικών υπολογιστών, μονάδων αποθήκευσης δεδομένων και τηλεπικοινωνιακών ζεύξεων ενός οργανισμού. Όλες οι κρίσιμες εφαρμογές και τα δεδομένα που χρησιμοποιούμε ζουν εκεί ή περνούν από εκεί».

«Η μεταφορά ενός κέντρου δεδομένων ενέχει εξαιρετικά υψηλό ρίσκο, όχι μόνο γιατί αφορά ευαίσθητο εξοπλισμό υψηλής τεχνολογίας και αξίας δεκάδων εκατομμυρίων ευρώ, αλλά κυρίως διότι αποθηκεύει δεδομένα και εξυπηρετεί επιχειρησιακές λειτουργίες ανεκτίμητης αξίας. Όταν δεν λειτουργεί το κέντρο δεδομένων μας, πρακτικά δεν λειτουργεί η ίδια η εταιρία μας.

Για να το αντιμετωπίσουμε σχεδιάσαμε και υλοποιήσαμε μια καινοτόμο ιδέα σταδιακής, ψηφιακής μεταφοράς η οποία εξελισσόταν ενώ οι εφαρμογές βρίσκονταν σε λειτουργία. Κάτι σαν να μεταφέρεις ένα ξενοδοχείο ενώ οι φιλοξενούμενοι βρίσκονται στα δωμάτιά τους. Με αυτό τον τρόπο, καταφέραμε να μειώσουμε το χρόνο διακοπής υπηρεσιών του Ομίλου κατά 75%, να μειώσουμε το συνολικό χρόνο εκτέλεσης του έργου κατά 50% και να ελαχιστοποιήσουμε τον κίνδυνο από απρόβλεπτους παράγοντες. Αυτός ήταν και ο λόγος που το έργο απέσπασε το χρυσό βραβείο της κατηγορίας Best Cloud Computing/Data Center Project των Digital Finance Awards 2022», συμπληρώνει.

Ως προς τους λόγους της μετακόμισης, αναφέρει: «Για πολλά χρόνια η καρδιά των υπολογιστικών υπηρεσιών της Interamerican χτυπούσε στην οδό Δοϊράνης. Οι τρέχουσες αλλά κυρίως οι μελλοντικές ανάγκες μας, προϋπέθεταν τη λειτουργία του κέντρου δεδομένων μας σε ένα κτίριο που θα πληροί τις αυστηρότερες προδιαγραφές ασφάλειας, προστασίας από φυσικές καταστροφές και κακόβουλες επιθέσεις, ενώ ταυτόχρονα να εξασφαλίζει ταχύτατη διασύνδεση με δίκτυα τηλεπικοινωνιών και υπηρεσίες υπολογιστικού νέφους ενσωματώνοντας φιλικές προς το περιβάλλον τεχνολογίες ώστε να ευθυγραμμίζεται με τη δέσμευση της Interamerican για χαμηλό περιβαλλοντικό αποτύπωμα».

Ένα νέο περιβαλλοντικά βιώσιμο Data Center

Γνωρίζοντας την υψηλή ενεργειακή κατανάλωση ενός data center, η επιλογή ενός χώρου που στόχο έχει να βελτιώσει την ενεργειακή απόδοση των υποδομών του και να είναι απόλυτα ευθυγραμμισμένος με την εθνική και διεθνή νομοθεσία, ήταν ζητούμενο. Το κτήριο της Lamda Hellix στο Κορωπί έχει σχεδιάσει διαδικασίες που:

  • ελαχιστοποιούν τα απόβλητα και αποτρέπουν τη ρύπανση
  • εξοικονομούν ενέργεια
  • εκμηδενίζουν το αποτύπωμα άνθρακα
  • εξαλείφουν τους κινδύνους για την υγεία και την ασφάλεια ενώ
  • ανακυκλώνουν τα απόβλητα με ασφάλεια και υπευθυνότητα.

Επίσης, έχει αναπτύξει ειδικές διαδικασίες μέτρησης όπου περιλαμβάνουν ένα διευρυμένο δίκτυο μονάδων τηλεμετρίας, παρέχοντας δεδομένα σε πραγματικό χρόνο για περαιτέρω ανάλυση.

Fun ( but serious) facts για ένα κέντρο δεδομένων

Το κέντρο δεδομένων της Interamerican περιλαμβάνει σημαντικό εξοπλισμό πληροφορικής και επικοινωνιών.

  • 1 υπολογιστική μονάδα υψηλών επιδόσεων IBM zSystems 13.
  • 20 υπολογιστικές μονάδες IBM System X και Lenovo ThinkSystem.
  • 4 μονάδες αποθήκευσης δεδομένων IBM DS Series και V Series.
  • 25 μονάδες μεταγωγής και δρομολόγησης δεδομένων Cisco.
  • 30 τηλεπικοινωνιακές ζεύξεις δεδομένων και τηλεφωνίας.
  • Κεραίες ασύρματης επικοινωνίας.

Σε υπολογιστικούς όρους το κέντρο δεδομένων συναθροίζει 450 διακομιστές με 1400 υπολογιστικούς πυρήνες, 6 Terabytes κεντρικής μνήμης, εκατοντάδες θύρες επικοινωνιών και 160 Terabytes δεδομένων.

Από το backstage της μετακόμισης

Η μετάβαση όλων αυτών των συστημάτων στο νέο κέντρο δεδομένων σχεδιάστηκε και εκτελέστηκε με τέτοιο τρόπο ώστε να εξασφαλιστεί η μέγιστη δυνατή διαθεσιμότητα των υπηρεσιών της Interamerican οι οποίες βασίζονται στα συστήματα αυτά και να ελαχιστοποιηθεί ο κίνδυνος απώλειας δεδομένων.

Είναι χαρακτηριστικό ότι μόνο το 30% των διακομιστών και των δεδομένων μεταφέρθηκε με φυσικό τρόπο ενώ το υπόλοιπο 70% μεταφέρθηκε ψηφιακά. Έτσι, επί 6 εβδομάδες η εταιρία μας λειτουργούσε απρόσκοπτα από δύο διαφορετικά κέντρα δεδομένων τα οποία απείχαν μεταξύ τους 16 km.

«Για μένα ήταν μια υπέροχη εμπειρία γιατί μου έδωσε τη δυνατότητα να σκεφτώ πως θα ήταν εφικτό να μην χαθούν κλήσεις εφόσον το gateway που υποδέχεται ένα μεγάλο όγκο κλήσεων των τηλεφωνικών μας κέντρων θα έβγαινε εκτός λειτουργίας λόγω μετακόμισης για αρκετές ώρες. Οι τροποποιήσεις που χρειάστηκαν να γίνουν ώστε οι εισερχόμενες κλήσεις να εξυπηρετούνται από άλλο gateway είχαν ενδιαφέρον και ήταν αρκετά δημιουργικές. Είχα μια ιδιαίτερη ανησυχία για το τι θα γινόταν αν το gateway που χρειάστηκε να κλείσει λόγω μετακόμισης δεν ήταν εκ νέου λειτουργικός», μας λέει η Έφη Μήτση, Senior Software Engineer.

Ο Βαγγέλης Σαλιάρης, Chapter Leader της ομάδας Technology Infastructure από πλευράς του μας αναφέρει «Η μετάβαση όλων αυτών των συστημάτων στο νέο κέντρο δεδομένων σχεδιάστηκε και εκτελέστηκε με τέτοιο τρόπο ώστε να εξασφαλιστεί η μέγιστη δυνατή διαθεσιμότητα των υπηρεσιών πληροφορικής της Interamerican οι οποίες βασίζονται στα συστήματα αυτά και να ελαχιστοποιηθεί ο κίνδυνος απώλειας δεδομένων.

Το έργο απαιτούσε επίσης άψογο συγχρονισμό και συνεργασία τόσο με τους εξωτερικούς συνεργάτες που εμπλεκόντουσαν στη μεταφορά και ακόμα περισσότερο με τους τηλεπικοινωνιακούς παρόχους οι οποίοι είχαν κρίσιμο ρόλο στο εγχείρημα. Υπήρξαν συνεργάτες που αξίζουν παραπάνω εύσημα καθώς πέραν των υπηρεσιών που προσέφεραν, βοήθησαν και με την παροχή προσωρινού δικτυακού εξοπλισμού.

Η χρήση τελευταίων τεχνολογιών όπως VMWare Live migration επέτρεψε το μεγαλύτερο μέρος των μεταφορών των συστημάτων να γίνει ηλεκτρονικά, με “ζωντανή” αντιγραφή ενεργών συστημάτων από την μια τοποθεσία στην άλλη χωρίς να χαθεί ούτε δευτερόλεπτο η δικτυακή επικοινωνία, και η τεχνολογία Dark Fiber που μας προσέφερε διασύνδεση 10Gbps μεταξύ των σημείων διευκολύντας και επιταχύνοντας τις μεταφορές των συστημάτων. Σημαντικό ρόλο επίσης είχε η τοπολογία των υπαρχουσών υποδομών με διπλούς failover εξοπλισμούς και τηλεπικοινωνιακές γραμμές, που επέτρεψαν την μεταφορά του εξοπλισμού χωρίς να υπάρχει διακοπή στις υπηρεσίες μας.

Θα πρέπει να αναφερθεί ότι σχεδόν όλες οι μεταφορές εξοπλισμών, τηλεπικοινωνιακών γραμμών κτλ., ξεκινούσαν στις 5:00 το πρωί.

Σίγουρα υπήρχαν περιπτώσεις που όλοι οι συνάδελφοι είμασταν ανήσυχοι, καθώς πάντα υπάρχει και ο απρόβλεπτος παράγοντας. Παραδείγματα τέτοια ήταν όλες οι μεταφορές του δικτυακού εξοπλισμού με το εταιρικό αυτοκίνητο, όπου δεν ξεπεράσαμε τα 60 km/h, το άγχος της μεταφοράς κρίσιμων και μοναδικών συστημάτων όπως το Maiframe, audio codes, threat emulator, DDos protection κ.α. Παρά τον σχεδιασμό, τις μετρήσεις και τις διαβεβαιώσεις των παρόχων, ανησυχία υπήρχε επίσης και μετά τις πρώτες μεταφορές μηχανημάτων στην Lamda Hellix, καθώς όλη η κίνηση πλέον “περνούσε” από την νέα γραμμή διασύνδεσης, για το αν θα υπάρξουν καθυστερήσεις στην απόκριση.

Το μεγαλύτερο δίλλημα που παρουσιάστηκε πριν την έναρξη του έργου, ήταν η απόφαση για το εάν θα προχωρήσουμε το εγχείρημα με ζωντανή μεταφορά συστημάτων χωρίς ουσιαστική πτώση των υπηρεσιών ή εάν θα προχωράγαμε με πλήρες shutdown όλων των υποδομών για 48-96 ώρες.

Φυσικά δεν πήγαν όλα τέλεια: Υπήρξε περίπτωση που συγκεκριμένος εξοπλισμός των παροχών δεν “κούμπωνε” στα rack της Lamda Hellix και χρειάστηκαν δημιουργικές λύσεις. Περιπτώσεις που οι συνάδελφοι των τηλεπικοινωνιακών παρόχων άφησαν το έργο στη μέση επειδή έπρεπε να αλλάξουν βάρδια. Το αποκορύφωμα ήταν όταν οι λυχνίες και των δύο υπολογιστών εκκίνησης του System Z/13 άρχισαν να αναβοσβήνουν με πορτοκαλί χρώμα. Συνέβη αυτό που θεωρούσαμε αδιανόητο και μας κράτησε σε αγωνία για 12 επιπλέον ώρες, μέχρι να εντοπιστεί το πρόβλημα και να έρθει το ανταλλακτικό».

Εν τω μεταξύ η Interamerican είχε φροντίσει σε συνεργασία με την Kyndryl και την IBM να μεταφερθεί εκεί το εφεδρικό System Z για κάθε ενδεχόμενο.

Η τελική φάση της μεταφοράς έπρεπε να γίνει Σαββατοκύριακο και να έχει ολοκληρωθεί πριν τις 31/12. Απαιτούσε διακοπή λειτουργιών για 6 ώρες εφόσον δεν παρουσιαζόταν κάποιο απρόοπτο. Οι ημερομηνίες 24-25/12 αποκλείστηκαν λόγω των εορτών. Το ίδιο και οι ημερομηνίες 18-19/12 καθώς ήταν κοντά στο ετήσιο κλείσιμο λογαριασμών. Για τις 11-12/12 ήταν προγραμματισμένη η μεταφορά του εφεδρικού κέντρου δεδομένων μεγάλης συστημικής τράπεζας (η οποία παρεμπιπτόντως ολοκληρώθηκε μετά από 10 ημέρες) στην σουίτα ακριβώς διπλά από την δική μας. Έτσι, αποκλείστηκε και αυτή. Επιλέχθηκε τελικά το Σάββατο 4/12 και έγινε σχετική ενημέρωση. Μετά από μερικές ημέρες όμως αυτό άλλαξε: Εκείνη την ημέρα θα έβρεχε και ο εξοπλισμός απαγορεύεται να έρθει σε επαφή με υγρή ατμόσφαιρα ακόμη και συσκευασμένος. Έτσι η μόνη διαθέσιμη επιλογή ήταν πλέον η Κυριακή 5/12.

Το data center σήμερα

Το νέο data center μας προσφέρει εξαιρετικά πλεονεκτήματα όπως η ελαχιστοποίηση κινδύνου από φυσικά φαινόμενα και διακοπές παροχής ηλεκτρικού ρεύματος, αλλά και η πρόσβαση σε δίκτυα δεδομένων υψηλής ταχύτητας για διασύνδεση με υπηρεσίες cloud, μεταξύ άλλων.

Η φυσική μας παρουσία εκεί είναι πλέον σπάνια αλλά δεν ανησυχούμε γιατί ξέρουμε ότι βρίσκεται σε πολύ καλά χέρια.