Πριν από εβδομήντα χρόνια, ο συγγραφέας επιστημονικής φαντασίας Isaac Asimov φαντάστηκε έναν κόσμο όπου τα ρομπότ θα εξυπηρετούσαν τους ανθρώπους με αμέτρητους τρόπους και τους εξοπλίζει με ενσωματωμένες διασφαλίσεις γνωστές ως Τρεις Νόμοι Ρομποτικής του Asimov, για να τους αποτρέψουν, μεταξύ άλλων στόχων, βλάπτοντας ένα άτομο. Οι νέοι αλγόριθμοι μηχανικής μάθησης προσφέρουν εγγυήσεις ασφάλειας και δικαιοσύνης.
Η εγγύηση της ασφαλούς και δίκαιης συμπεριφοράς της μηχανής εξακολουθεί να αποτελεί ζήτημα σήμερα, λέει ο ερευνητής μηχανικής μάθησης και επικεφαλής συγγραφέας Philip Thomas του University of Massachusetts Amherst. «Όταν κάποιος εφαρμόζει έναν αλγόριθμο μηχανικής μάθησης, είναι δύσκολο να ελέγξει τη συμπεριφορά του», επισημαίνει. Αυτό διακινδυνεύει ανεπιθύμητα αποτελέσματα από αλγόριθμους που κατευθύνουν τα πάντα, από την αυτοκίνηση των οχημάτων μέχρι και τις αντλίες ινσουλίνης έως την ποινική καταδίκη, λένε ο ίδιος και οι συν-συγγραφείς.
Ο Thomas και οι συνεργάτες του Yuriy Brun, Andrew Barto και ο διδακτορικός φοιτητής Stephen Giguere στο UMass Amherst, ο Bruno Castro da Silva στο Federal University του Rio Grande del Sol της Βραζιλίας και η Emma Brunskill στο University of Stanford εισήγαγαν αυτή την εβδομάδα ένα νέο πλαίσιο για το σχεδιασμό αλγορίθμων μηχανικής μάθησης που διευκολύνουν τους χρήστες του αλγορίθμου να καθορίσουν τους περιορισμούς ασφάλειας και δικαιοσύνης.
«Ονομάζουμε αλγόριθμους που δημιουργήθηκαν με το νέο μας πλαίσιο Seldonian από τον χαρακτήρα του Asimov τον Hari Seldon», εξηγεί ο Thomas. «Αν χρησιμοποιήσω έναν αλγόριθμο Seldonian για τη θεραπεία του διαβήτη, μπορώ να διευκρινίσω ότι η ανεπιθύμητη συμπεριφορά σημαίνει επικίνδυνα χαμηλά επίπεδα σακχάρου στο αίμα ή υπογλυκαιμία», ενώ προσπαθείτε να βελτιώσετε τον ελεγκτή της αντλίας ινσουλίνης, να κάνετε αλλαγές που θα αυξήσουν τη συχνότητα της υπογλυκαιμίας. «Οι περισσότεροι αλγόριθμοι δεν σας δίνουν έναν τρόπο να θέσετε αυτόν τον τύπο περιορισμού στη συμπεριφορά · δεν συμπεριλήφθηκε στα πρώιμα σχέδια».
«Αλλά καθιστώντας ευκολότερο να διασφαλιστεί η δικαιοσύνη και να αποφευχθεί η βλάβη γίνεται ολοένα και πιο σημαντική, καθώς οι αλγόριθμοι μηχανικής μάθησης επηρεάζουν τη ζωή μας όλο και περισσότερο», αναφέρει.
Ωστόσο, «μια πρόσφατη μελέτη ανέφερε 21 διαφορετικούς ορισμούς της δικαιοσύνης στη μηχανική μάθηση. Είναι σημαντικό να επιτρέψουμε στον χρήστη να επιλέξει τον ορισμό που είναι κατάλληλος για την εφαρμογή που προορίζεται», προσθέτει. «Η διεπαφή που έρχεται με έναν αλγόριθμο Seldonian επιτρέπει στο χρήστη να κάνει ακριβώς αυτό: να ορίσει τι σημαίνει «ανεπιθύμητη συμπεριφορά» για την εφαρμογή τους».
Στη σειρά του Ιδρύματος Asimov, ο Seldon βρίσκεται στο ίδιο σύμπαν με το ρομπότ του. Ο Thomas εξηγεί: «Όλα έχουν υποχωρήσει, η γαλαξιακή αυτοκρατορία καταρρέει, εν μέρει επειδή οι Τρεις Νόμοι Ρομποτικής απαιτούν βεβαιότητα. Με αυτό το απαιτούμενο επίπεδο ασφάλειας, τα ρομπότ παραλύονται με αναποφασιστικότητα επειδή δεν μπορούν να ενεργήσουν με βεβαιότητα και να εγγυηθούν ότι κανένας άνθρωπος δεν θα επηρεαστεί από τις πράξεις τους».
Ο Seldon προτείνει να το διορθώσουμε στρεφόμενος στην πιθανότητα λογικής για την ασφάλεια. «Αυτή είναι μια καλή προσαρμογή σε αυτό που κάνουμε», λέει ο Thomas. Η νέα προσέγγιση που παρέχει ο ίδιος και οι συνεργάτες του επιτρέπει πιθανούς περιορισμούς και απαιτεί από τον αλγόριθμο να καθορίσει τρόπους που ο χρήστης μπορεί να του πει τι να περιορίσει, εργαλείο για τον ερευνητή της μηχανής μάθησης. Καθοδηγεί να δημιουργήθουν αλγόριθμοι που είναι ευκολότερο για τους χρήστες να εφαρμόζουν υπεύθυνα τα πραγματικά προβλήματα στον κόσμο.
Για να δοκιμάσουν το νέο πλαίσιο, το εφάρμοσαν για να προβλέψουν τους μέσους βαθμούς σε ένα σύνολο δεδομένων 43.000 φοιτητών στη Βραζιλία, δημιουργώντας έναν αλγόριθμο Seldonian με περιορισμούς. Αποφεύγει με επιτυχία αρκετούς τύπους ανεπιθύμητης προκατάληψης λόγω φύλου. Σε μια άλλη δοκιμή, δείχνουν πώς ένας αλγόριθμος θα μπορούσε να βελτιώσει τον ελεγκτή σε μία αντλία ινσουλίνης, ενώ θα εξασφάλιζε ότι δεν θα αυξήσει τη συχνότητα της υπογλυκαιμίας.
Ο Thomas λέει: «Πιστεύουμε ότι υπάρχει τεράστιο περιθώριο βελτίωσης σε αυτόν τον τομέα, ακόμη και με τους αλγορίθμους μας που έγιναν από απλά εξαρτήματα, επιτύχαμε εντυπωσιακά αποτελέσματα. Ελπίζουμε ότι θα συνεχίσονται να αναπτύσσονται νέοι και πιο εξελιγμένοι αλγόριθμοι. Χρησιμοποιώντας το πλαίσιό μας μπορεί να χρησιμοποιηθεί υπεύθυνα για εφαρμογές όπου η μηχανική μάθηση θεωρήθηκε υπερβολικά επικίνδυνη. Είναι μια κλήση σε άλλους ερευνητές να διεξάγουν έρευνα σε αυτό το διάστημα».
Επιστημονικό Άρθρο:
Philip S. Thomas, Bruno Castro Da Silva, Andrew G. Barto, Stephen Giguere, Yuriy Brun, Emma Brunskill. Preventing undesirable behavior of intelligent machines. Science.