Τμήμα Διοίκησης Τεχνολογίας Μάνος Ρουμελιώτης Πανεπιστήμιο Μακεδονίας Αξιοπιστία Υπολογιστικών Συστημάτων
Τμήμα Διοίκησης Τεχνολογίας • Ορισμοί • Ελάττωμα, Σφάλμα και Αποτυχία • Υπολογισμός Αξιοπιστίας • Σύνθετα συστήματα • Ικανότητα συντήρησης • Διαθεσιμότητα Θέματα
Τμήμα Διοίκησης Τεχνολογίας Η Αξιοπιστία ενός συστήματος ορίζεται ως η πιθανότητα ότι το δεδομένο σύστημα θα εκτελεί την επιθυμητή λειτουργία του κάτω από προδιαγεγραμμένες συνθήκες για συγκεκριμένη χρονική περίοδο. Αξιοπιστία MTBF (Mean Time Between Failures): Ο μέσος χρόνος που ένα σύστημα θα λειτουργήσει ανάμεσα σε δύο αποτυχίες. Ο MTBF εκφράζεται συνήθως σε ώρες και είναι πιο χρήσιμο μέτρο για τον χρήστη απ’ ότι η αξιοπιστία.
Τμήμα Διοίκησης Τεχνολογίας Ελάττωμα, Σφάλμα και Αποτυχία •Ελάττωμα είναι η μη κανονική κατάσταση που μπορεί να προκαλέσει μείωση ή και πλήρη απώλεια της ικανότητας ενός συστήματος να εκτελεί την απαιτούμενη λειτουργία του. •Σφάλμα είναι η ασυμφωνία ανάμεσα στην παρατηρούμενη κατάσταση και την θεωρητικά ορθή κατάσταση. •Αποτυχία είναι η ανικανότητα ενός συστήματος να εκτελέσει τις απαιτούμενες λειτουργίες του εντός προδιαγραφών.
Τμήμα Διοίκησης Τεχνολογίας Παράδειγμα Έστω ότι έχουμε μια μνήμη υπολογιστή, η οποία βομβαρδίζεται με ιόντα υψηλής ενέργειας: •Αν τα ιόντα προκαλέσουν αλλοίωση σε κάποιο κελί της μνήμης, τότε έχουμε ελάττωμα •Αν το κελί αυτό της μνήμης αλλάξει τιμή από 0 σε 1 ή το αντίστροφο, τότε έχουμε σφάλμα •Αν το κελί αυτό διαβαστεί, προφανώς θα διαβαστεί η λάθος τιμή, οπότε έχουμε αποτυχία
Τμήμα Διοίκησης Τεχνολογίας Υπολογισμός αξιοπιστίας Η αξιοπιστία ενός συστήματος συχνά μοντελοποιείται ως: R(t) = e -λt •όπου λ είναι ο ρυθμός αποτυχίας εκφρασμένος ως το ποσοστό των αποτυχιών ανά 1000 ώρας ή ανά ώρα. Όταν το γινόμενο “λt” είναι μικρό, τότε: •R(t) = 1 - λt
Τμήμα Διοίκησης Τεχνολογίας Σχέση ανάμεσα στον MTBF και τον ρυθμό αποτυχίας MTBF είναι ο μέσος χρόνος λειτουργίας του συστήματος ανάμεσα σε αποτυχίες και δίνεται από τον τύπο: –MTBF = ∫ 0 ∞ R(t) dt = ∫ 0 ∞ e -λt dt = 1/λ –Δηλαδή, ο MFBF είναι το αντίστροφο του ρυθμού αποτυχίας –Αν το «λ» είναι ο αριθμός των αποτυχιών ανά ώρα, τότε ο MTBF εκφράζεται σε ώρες
Τμήμα Διοίκησης Τεχνολογίας Παράδειγμα •Ένα σύστημα έχει 5000 στοιχεία με ρυθμό αποτυχίας 0.04% ανά 1000 ώρες. Υπολογίστε το λ και τον MTBF. •λ = (0.04 / 100) * (1 / 1000) * 5000 = 2 * αποτυχίες/ώρα •MTBF = 1 / (2 * ) = 500 ώρες
Τμήμα Διοίκησης Τεχνολογίας Αξιοπιστία και MTBF •R(t) = e –λt = e –t / MTBF •Επομένως, –MTBF = - t / ln(R(t)) Αξιοπιστία R(t) MTBF 2 MTBF 0.36 χρόνος t
Τμήμα Διοίκησης Τεχνολογίας Παράδειγμα •Ένας υπολογιστής περιέχει στοιχεία που το καθένα έχει λ = 0.4%/(1000 ώρες). Για ποια περίοδο έχει το σύστημα αξιοπιστία 99%; •MTBF = - t / ln(R(t)) = - t / ln(0.99) –t = - MTBF * ln(.99) = 0.01 / λ μ –Όπου λ μ είναι ο μέσος ρυθμός αποτυχίας –N = αριθμός στοιχείων = –λ = ρυθμός αποτυχίας ενός στοιχείου •= 0.4% / (1000 ώρες) = 0.004/1000 = 4 * ανά ώρα •Επομένως, λ μ = N λ = * 4 * = 4 * ανά ώρα •και, t = 0.01 / (4 * ) = 15 λεπτά
Τμήμα Διοίκησης Τεχνολογίας Εν σειρά και παράλληλη αξιοπιστία RRRRR 1234N Συνολική αξιοπιστία = R t = R * R * R…. R = R N 1. Σύνδεση εν σειρά 2. Παράλληλη σύνδεση R R R 1 2 N R t = 1 – (πιθανότητα να αποτύχουν όλα τα στοιχεία) R t = 1 – (1 - R) N
Τμήμα Διοίκησης Τεχνολογίας Ικανότητα συντήρησης •Ικανότητα συντήρησης ενός συστήματος είναι η πιθανότητα ανεύρεσης και επιδιόρθωσης ενός σφάλματος εντός δεδομένων χρονικών περιθωρίων. •Η ικανότητα συντήρησης δίνεται από: –M(t) = 1 – e -µt –όπου μ είναι ο ρυθμός επιδιόρθωσης –και t τα είναι τα επιτρεπτά χρονικά περιθώρια για την επιδιόρθωση –µ = 1/(Μέσος χρόνος επιδιόρθωσης) = 1/MTTR –M(t) = 1 – e -t/MTTR
Τμήμα Διοίκησης Τεχνολογίας Διαθεσιμότητα •Διαθεσιμότητα ενός συστήματος είναι η πιθανότητα ότι το σύστημα θα λειτουργεί εντός προδιαγραφών οποιαδήποτε στιγμή της ωφέλιμης ζωής του. •Διαθεσιμότητα = Χρόνος λειτουργίας / (Χρόνος λειτουργίας + Χρόνος βλάβης) •Χρόνος βλάβης = Αριθμός αποτυχιών * MTTR •Χρόνος βλάβης = Χρόνος λειτουργίας * λ * MTTR Επομένως, –Διαθεσιμότητα = Χρόνος λειτουργίας / (Χρόνος λειτουργίας + (Χρόνος λειτουργίας * λ * MTTR) •= 1 / (1+( λ *MTTR) –Διαθεσιμότητα = MTBF / (MTBF + MTTR)
Τμήμα Διοίκησης Τεχνολογίας Βιβλιογραφία •Ebeling, Charles E., (1997), An Introduction to Reliability and Maintainability Engineering, McGraw- Hill Companies, Inc., Boston. •Kapur, K.C., and Lamberson, L.R., (1977), Reliability in Engineering Design, John Wiley & Sons, New York. •Kececioglu, Dimitri, (1991) "Reliability Engineering Handbook", Prentice-Hall, Englewood Cliffs, New Jersey •Leemis, Lawrence, (1995) Reliability: Probabilistic Models and Statistical Methods, 1995, Prentice- Hall. ISBN ISBN •MacDiarmid, Preston; Morris, Seymour; et al., (1995), Reliability Toolkit: Commercial Practices Edition, Reliability Analysis Center and Rome Laboratory, Rome, New York. •Modarres, Mohammad; Kaminskiy, Mark; Krivtsov, Vasiliy (1999), "Reliability Engineering and Risk Analysis: A Practical Guide, CRC Press, ISBN ISBN •Neubeck, Ken (2004) "Practical Reliability Analysis", Prentice Hall, New Jersey •O'Connor, Patrick D. T. (2002), Practical Reliability Engineering (Fourth Ed.), John Wiley & Sons, New York. •Shooman, Martin, (1987), Software Engineering: Design, Reliability, and Management, McGraw-Hill, New York. •Tobias, Trindade, (1995), Applied Reliability, Chapman & Hall/CRC, ISBN ISBN •Springer Series in Reliability EngineeringSpringer Series in Reliability Engineering