Το ΕΚΠΑ πρωτοπόρο στην έρευνα ενάντια στα σιωπηλά σφάλματα των σύγχρονων υπολογιστών στα κέντρα δεδομένων

Η ερευνητική ομάδα Αρχιτεκτονικής Υπολογιστών του Καθηγητή του Ε.Κ.Π.Α. κ. Δημήτρη Γκιζόπουλου επελέγη ως η μόνη εκτός ΗΠΑ ομάδα για να συνεργαστεί μέσω το Open Compute Project (OCP) consortium (αποτελούμενο από τους κολοσσούς Meta, Google, Microsoft, Intel, AMD, NVIDIA, ARM) στην επίλυση του ανησυχητικού προβλήματος των Σιωπηλών Σφαλμάτων Δεδομένων (Silent Data Errors ή Silent Data Corruptions) των σύγχρονων υπολογιστικών συστημάτων στο υπολογιστικό νέφος (cloud).

kapodistriako

Το πρόβλημα εμφανίζεται με μεγάλη συχνότητα και σφοδρότητα σε όλους τους σύγχρονους μικροεπεξεργαστές που χρησιμοποιούνται σε μεγάλη κλίμακα στα τεράστια Κέντρα Δεδομένων (Data Centers) και δημιουργεί σοβαρές ανησυχίες για την ακεραιότητα των παραγόμενων αποτελεσμάτων. Ένα σιωπηλό σφάλμα προέρχεται από ατέλειες του πυριτίου των σύγχρονων τσιπ των υπολογιστών καθώς και άλλους παράγοντες και οδηγεί στην εκτέλεση λανθασμένων υπολογισμών. Τα λανθασμένα αποτελέσματα των υπολογισμών δεν γίνονται αντιληπτά από τις υπάρχουσες μεθόδους στο υλικό (hardware) και λογισμικό (software) των υπολογιστικών μηχανών του νέφους.

Η επιστημονική ομάδα του κ. Γκιζόπουλου στο Τμήμα Πληροφορικής και Τηλεπικοινωνιών του Ε.Κ.Π.Α. αναπτύσσει αποδοτικές μεθόδους ανίχνευσης των ατελειών των μικροεπεξεργαστών (CPUs, GPUs και AI accelerators) πριν αυτές οδηγήσουν σε σιωπηλά σφάλματα στα προγράμματα των χρηστών του υπολογιστικού νέφους.

Η σχετική ανακοίνωση του OCP: https://www.opencompute.org/blog/ocps-server-resilience-initiative-sdc-academic-research-awards-announced.

Εκτός της ομάδας του κ. Γκιζόπουλου στο Ε.Κ.Π.Α., οι άλλες ερευνητικές ομάδες βρίσκονται σε πανεπιστήμια των Ηνωμένων Πολιτειών.