Σε λιγότερο χρόνο από όσο θα χρειαστείτε για να διαβάσετε αυτό το άρθρο, ένα σύστημα που βασίζεται στην τεχνητή νοημοσύνη μπόρεσε αυτόνομα να μάθει για ορισμένες βραβευμένες με Νόμπελ χημικές αντιδράσεις και να σχεδιάσει μια επιτυχημένη εργαστηριακή διαδικασία για την κατασκευή τους. Η τεχνητή νοημοσύνη τα έκανε όλα αυτά μέσα σε λίγα λεπτά — και τα κατάφερε με την πρώτη προσπάθεια.
«Είναι η πρώτη φορά που μια μη οργανική νοημοσύνη οργάνωσε, σχεδίασε και εκτέλεσε αυτή την περίπλοκη αντίδραση που εφευρέθηκε από ανθρώπους», λέει ο χημικός μηχανικός του Πανεπιστημίου Carnegie Mellon, Gabe Gomes, ο οποίος ηγήθηκε της ερευνητικής ομάδας που συναρμολόγησε και δοκίμασε το AI- βασισμένο σύστημα. Ονόμασαν τη δημιουργία τους «Συνεπιστήμονας» (Coscientist).
Οι πιο περίπλοκες αντιδράσεις που πραγματοποίησε ο Συνεπιστήμονας είναι γνωστές στην οργανική χημεία ως διασταυρούμενες συζεύξεις καταλυόμενες από παλλάδιο, οι οποίες κέρδισαν στους ανθρώπους του εφευρέτες, το βραβείο Νόμπελ χημείας το 2010 σε αναγνώριση του μεγάλου ρόλου που έπαιξαν αυτές οι αντιδράσεις στη διαδικασία της φαρμακευτικής ανάπτυξης και σε άλλες βιομηχανίες που χρησιμοποιήσαν λεπτεπίλεπτα μόρια με βάση τον άνθρακα.
Δημοσιεύτηκαν στο περιοδικό Nature, οι αποδεδειγμένες ικανότητες του Coscientist δείχνουν τη δυνατότητα των ανθρώπων να χρησιμοποιούν παραγωγικά την τεχνητή νοημοσύνη για να αυξήσουν τον ρυθμό και τον αριθμό των επιστημονικών ανακαλύψεων, καθώς και να βελτιώσουν την αναπαραγωγιμότητα και την αξιοπιστία των πειραματικών αποτελεσμάτων. Η ερευνητική ομάδα τεσσάρων ατόμων περιλαμβάνει διδακτορικούς φοιτητές Daniil Boiko και Robert MacKnight, οι οποίοι έλαβαν υποστήριξη και εκπαίδευση από το Κέντρο Χημειοενζυματικής Σύνθεσης στο Northwestern University και στο Εθνικό Ίδρυμα Επιστημών των ΗΠΑ όπως επίσης και στο NSF Center for Computer-Assisted Synthesis στο Πανεπιστήμιο της Notre Dame, αντίστοιχα.
«Πέρα από τα καθήκοντα χημικής σύνθεσης που επιδείχθηκαν από το σύστημά τους, ο Gomes και η ομάδα του συνέθεσαν με επιτυχία ένα είδος υπερ-αποδοτικού συνεργάτη εργαστηρίου», λέει ο διευθυντής του τμήματος χημείας του NSF, David Berkowitz. «Συναρμολογούν όλα τα κομμάτια και το τελικό αποτέλεσμα είναι πολύ περισσότερο από το άθροισμα των μερών του — μπορεί να χρησιμοποιηθεί για πραγματικά χρήσιμους επιστημονικούς σκοπούς».
Τοποθετώντας τον Συνεπιστήμονα δίπλα
Το κύριο στοιχείο μεταξύ του λογισμικού και των εξαρτημάτων που βασίζονται σε πυρίτιο του Συνεπιστήμονα είναι τα μεγάλα γλωσσικά μοντέλα που αποτελούν τους τεχνητούς «εγκεφάλους» του. Ένα μοντέλο μεγάλης γλώσσας είναι ένας τύπος τεχνητής νοημοσύνης που μπορεί να εξάγει νόημα και μοτίβα από τεράστιες ποσότητες δεδομένων, συμπεριλαμβανομένου του γραπτού κειμένου που περιέχεται σε έγγραφα. Μέσω μιας σειράς εργασιών, η ομάδα δοκίμασε και συνέκρινε πολλά μοντέλα μεγάλων γλωσσών, συμπεριλαμβανομένου του GPT-4 και άλλων εκδόσεων των μοντέλων μεγάλων γλωσσών GPT που κατασκευάζονται από την εταιρεία OpenAI.
Ο Συνεπιστήμονας ήταν επίσης εξοπλισμένος με πολλές διαφορετικές ενότητες λογισμικού τις οποίες η ομάδα δοκίμασε πρώτα μεμονωμένα και στη συνέχεια σε συνεννόηση.
«Προσπαθήσαμε να χωρίσουμε όλες τις πιθανές επιστημονικές εργασίες σε μικρά κομμάτια και στη συνέχεια να κατασκευάσουμε κομμάτι-κομμάτι τη μεγαλύτερη εικόνα», λέει ο Boiko, ο οποίος σχεδίασε τη γενική αρχιτεκτονική του Συνεπιστήμονα και τις πειραματικές του εργασίες. «Στο τέλος τα συγκεντρώσαμε όλα».
Οι ενότητες λογισμικού επέτρεψαν στο Συνεπιστήμονα να κάνει πράγματα που κάνουν όλοι οι ερευνητές χημικοί: να αναζητήσει δημόσιες πληροφορίες σχετικά με χημικές ενώσεις, να βρει και να διαβάσει τεχνικά εγχειρίδια για τον έλεγχο του εξοπλισμού ρομποτικού εργαστηρίου, να γράψει κώδικα υπολογιστή για τη διεξαγωγή πειραμάτων και να αναλύσει τα προκύπτοντα δεδομένα για να καθορίσει τι λειτούργησε και τι όχι.
Ένα τεστ εξέτασε την ικανότητα του Coscientist να σχεδιάζει με ακρίβεια χημικές διαδικασίες που, εάν εκτελούνταν, θα οδηγούσαν σε κοινά χρησιμοποιούμενες ουσίες όπως η ασπιρίνη, η ακεταμινοφαίνη και η ιβουπροφαίνη. Τα μεγάλα γλωσσικά μοντέλα δοκιμάστηκαν και συγκρίθηκαν ξεχωριστά, συμπεριλαμβανομένων δύο εκδόσεων του GPT με μια ενότητα λογισμικού που του επιτρέπει να χρησιμοποιεί το Google για να αναζητά πληροφορίες στο Διαδίκτυο, όπως θα μπορούσε ένας ανθρώπινος χημικός. Στη συνέχεια, οι διαδικασίες που προέκυψαν εξετάστηκαν και βαθμολογήθηκαν με βάση το αν θα είχαν οδηγήσει στην επιθυμητή ουσία, πόσο λεπτομερή ήταν τα βήματα και άλλους παράγοντες. Ορισμένες από τις υψηλότερες βαθμολογίες σημειώθηκαν από τη μονάδα GPT-4 με δυνατότητα αναζήτησης, η οποία ήταν η μόνη που δημιούργησε μια διαδικασία αποδεκτής ποιότητας για τη σύνθεση ιβουπροφαίνης.
Ο Boiko και ο MacKnight παρατήρησαν τον Συνεπιστήμονα να επιδεικνύει «χημικό συλλογισμό», τον οποίο ο Boiko περιγράφει ως την ικανότητα να χρησιμοποιεί πληροφορίες που σχετίζονται με τη χημεία και προηγουμένως αποκτηθείσα γνώση για να καθοδηγεί τις πράξεις κάποιου. Χρησιμοποίησε δημόσια διαθέσιμες χημικές πληροφορίες κωδικοποιημένες με τη μορφή Simplified Molecular Input Line Entry System (SMILES) – έναν τύπο αναγνώσιμου από μηχανή σημειογραφία που αντιπροσωπεύει τη χημική δομή των μορίων – και έκανε αλλαγές στα πειραματικά του σχέδια με βάση συγκεκριμένα μέρη των μορίων εξέταζε εξονυχιστικά μέσα στα δεδομένα SMILES. «Αυτή είναι η καλύτερη δυνατή εκδοχή του χημικού συλλογισμού», λέει ο Boiko.
Περαιτέρω δοκιμές ενσωμάτωσαν ενότητες λογισμικού που επιτρέπουν στον Συνεπιστήμονα να αναζητά και να χρησιμοποιεί τεχνικά έγγραφα που περιγράφουν διεπαφές προγραμματισμού εφαρμογών που ελέγχουν τον ρομποτικό εργαστηριακό εξοπλισμό. Αυτές οι δοκιμές ήταν σημαντικές για τον προσδιορισμό του εάν ο Συνεπιστήμονας μπορούσε να μεταφράσει τα θεωρητικά του σχέδια για τη σύνθεση χημικών ενώσεων σε κώδικα υπολογιστή που θα καθοδηγούσε τα εργαστηριακά ρομπότ στον φυσικό κόσμο.
Φέρτε τα ρομπότ
Ο εξοπλισμός ρομποτικής χημείας υψηλής τεχνολογίας χρησιμοποιείται συνήθως σε εργαστήρια για να αναρροφά, να εκτοξεύει, να θερμαίνει, να ανακινεί και να κάνει άλλα πράγματα σε μικροσκοπικά υγρά δείγματα με ακρίβεια ξανά και ξανά. Τέτοια ρομπότ συνήθως ελέγχονται μέσω κώδικα υπολογιστή που γράφεται από ανθρώπους χημικούς που θα μπορούσαν να βρίσκονται στο ίδιο εργαστήριο ή στην άλλη άκρη της χώρας.
Αυτή ήταν η πρώτη φορά που τέτοια ρομπότ θα ελέγχονταν από κώδικα υπολογιστή γραμμένο από AI.
Η ομάδα ξεκίνησε τον Συνεπιστήμονα με απλές εργασίες που απαιτούσαν να κάνει μια ρομποτική μηχανή χειρισμού υγρών να διανέμει έγχρωμο υγρό σε ένα πιάτο που περιέχει 96 μικρά φρεάτια ευθυγραμμισμένα σε ένα πλέγμα. Του είπαν «χρωματίστε κάθε άλλη γραμμή με ένα χρώμα της επιλογής σας», «ζωγραφίστε μια μπλε διαγώνιο» και άλλες εργασίες που θυμίζουν νηπιαγωγείο.
Αφού αποφοίτησε από το υγρό χειριστή 101, η ομάδα εισήγαγε στον Συνεπιστήμονα περισσότερους τύπους ρομποτικού εξοπλισμού. Συνεργάστηκαν με το Emerald Cloud Lab, μια εμπορική εγκατάσταση γεμάτη με διάφορα είδη αυτοματοποιημένων οργάνων, συμπεριλαμβανομένων των φασματοφωτόμετρων, που μετρούν τα μήκη κύματος του φωτός που απορροφάται από χημικά δείγματα. Στη συνέχεια παρουσιάστηκε στον επιστήμονα ένα πιάτο που περιείχε υγρά τριών διαφορετικών χρωμάτων (κόκκινο, κίτρινο και μπλε) και του ζητήθηκε να προσδιορίσει ποια χρώματα υπήρχαν και πού βρίσκονταν στο πιάτο.
Δεδομένου ότι ο Συνεπιστήμονας δεν έχει μάτια, έγραψε κώδικα για να περάσει ρομποτικά η μυστηριώδης πλάκα χρώματος στο φασματοφωτόμετρο και να αναλύσει τα μήκη κύματος του φωτός που απορροφάται από κάθε φρεάτιο, προσδιορίζοντας έτσι ποια χρώματα υπήρχαν και τη θέση τους στην πλάκα. Για αυτήν την εργασία, οι ερευνητές έπρεπε να δώσουν στο Coscientist μια μικρή ώθηση προς τη σωστή κατεύθυνση, δίνοντάς του εντολή να σκεφτεί πώς τα διαφορετικά χρώματα απορροφούν το φως. Το AI έκανε τα υπόλοιπα.
Η τελική εξέταση του Συνεπιστήμονα ήταν να συνδυάσει τις συναρμολογημένες ενότητες και την εκπαίδευσή του για να εκπληρώσει την εντολή της ομάδας να «εκτελέσει αντιδράσεις Suzuki και Sonogashira», που ονομάστηκαν από τους εφευρέτες τους Akira Suzuki και Kenkichi Sonogashira. Ανακαλύφθηκαν στη δεκαετία του 1970, οι αντιδράσεις χρησιμοποιούν το μεταλλικό παλλάδιο για να καταλύουν δεσμούς μεταξύ ατόμων άνθρακα σε οργανικά μόρια. Οι αντιδράσεις έχουν αποδειχθεί εξαιρετικά χρήσιμες για την παραγωγή νέων τύπων φαρμάκων για τη θεραπεία της φλεγμονής, του άσθματος και άλλων καταστάσεων. Χρησιμοποιούνται επίσης σε οργανικούς ημιαγωγούς σε OLED που βρίσκονται σε πολλά smartphone και οθόνες. Οι πρωτοποριακές αντιδράσεις και οι ευρύτερες επιπτώσεις τους αναγνωρίστηκαν επισήμως με το βραβείο Νόμπελ που απονεμήθηκε από κοινού το 2010 στους Sukuzi, Richard Heck και Ei-ichi Negishi.
Μεγάλη δύναμη, μεγάλη ευθύνη
«Για μένα, η στιγμή του «εύρηκα» ήταν να το δω να κάνει όλες τις σωστές ερωτήσεις», λέει ο MacKnight, ο οποίος σχεδίασε τη μονάδα λογισμικού που επιτρέπει στο Coscientist να αναζητήσει τεχνική τεκμηρίωση.
Ο επιστήμονας αναζήτησε απαντήσεις κυρίως στη Wikipedia, μαζί με μια σειρά από άλλους ιστότοπους, συμπεριλαμβανομένων αυτών της Αμερικανικής Χημικής Εταιρείας, της Βασιλικής Εταιρείας Χημείας και άλλων που περιείχαν ακαδημαϊκές εργασίες που περιγράφουν τις αντιδράσεις των Suzuki και Sonogashira.
Σε λιγότερο από τέσσερα λεπτά, ο Συνεπιστήμονας είχε σχεδιάσει μια ακριβή διαδικασία για την παραγωγή των απαιτούμενων αντιδράσεων χρησιμοποιώντας χημικές ουσίες που παρείχε η ομάδα. Όταν προσπάθησε να πραγματοποιήσει τη διαδικασία του στον φυσικό κόσμο με ρομπότ, έκανε λάθος στον κώδικα που έγραψε για να ελέγξει μια συσκευή που θερμαίνει και ανακινεί υγρά δείγματα. Χωρίς να ζητηθεί από ανθρώπους, ο Συνεπιστήμονας εντόπισε το πρόβλημα, αναφέρθηκε στο τεχνικό εγχειρίδιο της συσκευής, διόρθωσε τον κωδικό της και προσπάθησε ξανά.
Τα αποτελέσματα περιέχονταν σε μερικά μικροσκοπικά δείγματα διαυγούς υγρού. Ο Boiko ανέλυσε τα δείγματα και βρήκε τα φασματικά χαρακτηριστικά των αντιδράσεων Suzuki και Sonogashira.
Ο Gomes ήταν δύσπιστος όταν ο Boiko και ο MacKnight του είπαν τι έκανε ο Συνεπιστήμονας. «Νόμιζα ότι μου κάνανε πλάκα», θυμάται. «Αλλά δεν ήταν έτσι. Δεν ήταν καθόλου. Και τότε ήταν που έκανε κλικ στο ότι, εντάξει, έχουμε κάτι εδώ που είναι πολύ νέο, πολύ ισχυρό».
Με αυτή τη δυνητική δύναμη έρχεται η ανάγκη να το χρησιμοποιήσουμε με σύνεση και να προφυλαχτούμε από κακή χρήση. Ο Gomes λέει ότι η κατανόηση των δυνατοτήτων και των ορίων της τεχνητής νοημοσύνης είναι το πρώτο βήμα για τη δημιουργία ενημερωμένων κανόνων και πολιτικών που μπορούν να αποτρέψουν αποτελεσματικά τις επιβλαβείς χρήσεις της τεχνητής νοημοσύνης, σκόπιμες ή τυχαίες.
«Πρέπει να είμαστε υπεύθυνοι και προσεκτικοί σχετικά με τον τρόπο με τον οποίο αναπτύσσονται αυτές οι τεχνολογίες», λέει.
Ο Gomes είναι ένας από τους πολλούς ερευνητές που παρέχουν συμβουλές και καθοδήγηση ειδικών για τις προσπάθειες της κυβέρνησης των ΗΠΑ να διασφαλίσει ότι η τεχνητή νοημοσύνη χρησιμοποιείται με ασφάλεια, όπως το εκτελεστικό διάταγμα της κυβέρνησης Biden τον Οκτώβριο του 2023 για την ανάπτυξη της τεχνητής νοημοσύνης.
Επιτάχυνση της ανακάλυψης, εκδημοκρατισμός της επιστήμης
Ο φυσικός κόσμος είναι πρακτικά άπειρος σε μέγεθος και πολυπλοκότητα, περιέχει ανείπωτες ανακαλύψεις που περιμένουν να βρεθούν. Φανταστείτε νέα υπεραγώγιμα υλικά που αυξάνουν δραματικά την ενεργειακή απόδοση ή χημικές ενώσεις που θεραπεύουν ασθένειες που δεν θεραπεύονται κατά τα άλλα και παρατείνουν τη ζωή του ανθρώπου. Και όμως, η απόκτηση της εκπαίδευσης και της κατάρτισης που απαιτούνται για να γίνουν αυτές οι ανακαλύψεις είναι ένα μακρύ και επίπονο ταξίδι. Το να γίνεις επιστήμονας είναι δύσκολο.
Ο Gomes και η ομάδα του οραματίζονται συστήματα με τη βοήθεια τεχνητής νοημοσύνης όπως ο Συνεπιστήμονας ως μια λύση που μπορεί να γεφυρώσει το χάσμα μεταξύ της ανεξερεύνητης απεραντοσύνης της φύσης και του γεγονότος ότι οι εκπαιδευμένοι επιστήμονες είναι σε έλλειψη — και πιθανότατα θα είναι πάντα.
Οι ανθρώπινοι επιστήμονες έχουν επίσης ανθρώπινες ανάγκες, όπως ο ύπνος και περιστασιακά να βγαίνουν έξω από το εργαστήριο. Ενώ η τεχνητή νοημοσύνη που καθοδηγείται από τον άνθρωπο μπορεί να «σκέφτεται» όλο το εικοσιτετράωρο, αναποδογυρίζοντας μεθοδικά κάθε παροιμιώδη λίθο, ελέγχοντας εκ νέου τα πειραματικά του αποτελέσματα για δυνατότητα αναπαραγωγής. «Μπορούμε να έχουμε κάτι που μπορεί να λειτουργεί αυτόνομα, προσπαθώντας να ανακαλύψουμε νέα φαινόμενα, νέες αντιδράσεις, νέες ιδέες», λέει ο Gomes.
«Μπορείτε επίσης να μειώσετε σημαντικά το εμπόδιο εισόδου για βασικά οποιοδήποτε πεδίο», λέει. Για παράδειγμα, εάν ένας βιολόγος που δεν είναι εκπαιδευμένος στις αντιδράσεις Suzuki ήθελε να εξερευνήσει τη χρήση τους με έναν νέο τρόπο, θα μπορούσε να ζητήσει από τον Συνεπιστήμονα να τον βοηθήσει να σχεδιάσει πειράματα.
«Μπορείτε να έχετε αυτόν τον μαζικό εκδημοκρατισμό των πόρων και την κατανόηση», εξηγεί.
Υπάρχει μια επαναληπτική διαδικασία στην επιστήμη του να προσπαθείς κάτι, να αποτύχεις, να μάθεις και να βελτιώσεις, την οποία η τεχνητή νοημοσύνη μπορεί να επιταχύνει σημαντικά, λέει ο Gomes. «Αυτό από μόνο του θα είναι μια δραματική αλλαγή».
Επιστημονικό Άρθρο:
Daniil A. Boiko, Robert MacKnight, Ben Kline, Gabe Gomes. Autonomous chemical research with large language models. Nature, 2023