Νέες τεχνικές εκμάθησης μηχανών θα μπορούσαν να ανοίξουν το δρόμο για μεγαλύτερα, πιο επίκαιρα έργα.
Για περισσότερο από μια δεκαετία, τα επιστημονικά προγράμματα για τους πολίτες βοήθησαν τους ερευνητές να χρησιμοποιήσουν τη δύναμη χιλιάδων εθελοντών που βοηθούν στην ταξινόμηση μέσω συνόλων δεδομένων που είναι υπερβολικά μεγάλα για μια μικρή ερευνητική ομάδα. Προηγουμένως, αυτά τα δεδομένα γενικά δεν μπορούσαν να υποβληθούν σε επεξεργασία από τους υπολογιστές επειδή η εργασία απαιτούσε δεξιότητες που μόνο οι άνθρωποι θα μπορούσαν να επιτύχουν.
Τώρα, οι τεχνικές μάθησης υπολογιστών που διδάσκουν τις δεξιότητες αναγνώρισης ειδικών εικόνων στον υπολογιστή μπορούν να χρησιμοποιηθούν σε προγράμματα crowdsourcing για την αντιμετώπιση μαζικώς αυξανόμενων ποσοτήτων υπολογιστών δεδομένων που αποτελούν έναν εκπληκτικό νέο συνεργάτη στα προγράμματα επιστήμης των πολιτών.
Η έρευνα, υπό την ηγεσία του Πανεπιστημίου της Μινεσότα – Twin Cities επελέγη ως κάλυψη για το πιο πρόσφατο τεύχος του επιστημονικού περιοδικού της British Ecological Society, Methods in Ecology and Evolution.
Στη μελέτη αυτή, οι επιστήμονες δεδομένων και οι εμπειρογνώμονες των επιστημονικών προγραμμάτων για τους πολίτες συνεργάστηκαν με οικολόγους που μελετούν συχνά πληθυσμούς άγριων ζώων με την ανάπτυξη παγίδων κάμερας. Αυτές οι παγίδες φωτογραφικών μηχανών είναι απομακρυσμένες, ανεξάρτητες συσκευές, που ενεργοποιούνται από αισθητήρες κίνησης και υπέρυθρης ακτινοβολίας, οι οποίοι παρέχουν στους ερευνητές εικόνες διασταυρωμένων ζώων. Μετά τη συλλογή, αυτές οι εικόνες πρέπει να ταξινομηθούν σύμφωνα με τους στόχους της μελέτης για την παραγωγή χρήσιμων οικολογικών δεδομένων για ανάλυση.
“Στο παρελθόν, οι ερευνητές ζήτησαν από τους επιστήμονες πολίτες να τους βοηθήσουν να επεξεργαστούν και να ταξινομήσουν τις εικόνες μέσα σε ένα λογικό χρονικό πλαίσιο”, δήλωσε ο επικεφαλής συγγραφέας της μελέτης, Marco Willi, ερευνητής του Πανεπιστημίου της Μινεσότα στην επιστήμη των δεδομένων και ερευνητής στην Σχολή Φυσικής και Αστρονομίας. “Τώρα, μερικά από αυτά τα πρόσφατα έργα παγίδευσης φωτογραφικών μηχανών έχουν συγκεντρώσει εκατομμύρια εικόνες.Ακόμα και με τη βοήθεια των πολιτών επιστημόνων, θα μπορούσε να χρειαστούν χρόνια για να ταξινομηθούν όλες οι εικόνες. Αυτή η νέα μελέτη αποτελεί απόδειξη της ιδέας ότι οι τεχνικές μάθησης μηχανής μπορούν να βοηθήσουν σημαντικά μείωση του χρόνου ταξινόμησης”.
Οι ερευνητές χρησιμοποίησαν τρία σύνολα δεδομένων από εικόνες που συλλέχθηκαν από την Αφρική από το Snapshot Serengeti, κατάλογος φωτογραφικών μηχανών και αποστολή ελέφαντα – και ένα σύνολο δεδομένων από το Snapshot Wisconsin με εικόνες που συλλέχθηκαν στη Βόρεια Αμερική. Τα σύνολα δεδομένων που παρουσιάστηκαν μεταξύ εννέα και 55 ειδών εμφάνισαν σημαντικές διαφορές ως προς το πόσο συχνά φωτογραφούσαν διάφορα είδη. Αυτά τα σύνολα δεδομένων διαφέρουν επίσης σε πτυχές όπως μέγεθος μεγέθους δεδομένων, τοποθέτηση κάμερας, διαμόρφωση κάμερας και κάλυψη ειδών που επιτρέπει την εξαγωγή γενικότερων συμπερασμάτων.
Οι ερευνητές χρησιμοποίησαν τεχνικές μηχανικής μάθησης που διδάσκουν στον υπολογιστή πώς να ταξινομούν τις εικόνες παρουσιάζοντας τα σύνολα δεδομένων υπολογιστών των εικόνων που έχουν ήδη ταξινομηθεί από τον άνθρωπο. Για παράδειγμα, στο μηχάνημα θα εμφανίζονται πλήρεις και μερικές εικόνες που είναι γνωστές ως εικόνες ζέβρας από διάφορες γωνίες. Ο υπολογιστής τότε θα αρχίσει να αναγνωρίζει τα μοτίβα, τα άκρα και τα μέρη του ζώου και θα μάθει πώς να αναγνωρίζει την εικόνα ως ζέβρα. Οι ερευνητές μπορούν επίσης να βασιστούν σε μερικές από αυτές τις δεξιότητες για να βοηθήσουν τους υπολογιστές να αναγνωρίσουν άλλα ζώα, όπως ένα ελάφι ή σκίουρο, με ακόμη λιγότερες εικόνες.
Ο υπολογιστής μαθαίνει επίσης να αναγνωρίζει κενές εικόνες, οι οποίες είναι εικόνες χωρίς ζώα, όπου οι κάμερες συνήθως εκπέμπονται από βλάστηση που φυσάει στον άνεμο. Σε ορισμένες περιπτώσεις, αυτές οι κενές εικόνες αποτελούν περίπου το 80 τοις εκατό όλων των εικόνων παγίδευσης κάμερας. Η εξάλειψη όλων των κενών εικόνων μπορεί να επιταχύνει σημαντικά τη διαδικασία ταξινόμησης.
Τα ποσοστά ακρίβειας του υπολογιστή για τον εντοπισμό κενών εικόνων μεταξύ των έργων κυμαίνονται μεταξύ 91,2% και 98,0%, ενώ η ακρίβεια για την ταυτοποίηση συγκεκριμένων ειδών κυμαίνεται μεταξύ 88,7% και 92,7%. Ενώ η ακρίβεια ταξινόμησης του υπολογιστή είναι χαμηλή για σπάνια είδη, ο υπολογιστής μπορεί επίσης να πει στους ερευνητές πόσο σίγουροι είναι στις προβλέψεις του. Η κατάργηση των προβλέψεων χαμηλής εμπιστοσύνης αυξάνει την ακρίβεια του υπολογιστή.
“Οι τεχνικές μας μάθησης μηχανών επιτρέπουν στους οικολογικούς ερευνητές να επιταχύνουν τη διαδικασία ταξινόμησης των εικόνων και να ανοίξουν το δρόμο για ακόμη μεγαλύτερα προγράμματα επιστήμης των πολιτών στο μέλλον”, δήλωσε ο Willi. “Αντί κάθε εικόνα που πρέπει να ταξινομηθεί από πολλούς εθελοντές, ένας ή δύο εθελοντές θα μπορούσαν να επιβεβαιώσουν την ταξινόμηση του υπολογιστή”.
Ενώ αυτή η μελέτη εστιάστηκε στα προγράμματα παγίδευσης κάμερας οικολογίας, ο Willi δήλωσε ότι οι ίδιες τεχνικές μπορούν επίσης να χρησιμοποιηθούν σε άλλα προγράμματα επιστήμης πολιτών όπως η ταξινόμηση εικόνων από το διάστημα.
“Τα δεδομένα σε ένα ευρύ φάσμα επιστημονικών περιοχών αυξάνονται πολύ ταχύτερα από ό, τι ο αριθμός των εθελοντών έργων επιστήμης των πολιτών”, δήλωσε η Lucy Fortson, καθηγήτρια φυσικής και αστρονομίας του Πανεπιστημίου της Μινεσότα και συνιδρύτρια της Zooniverse, online πλατφόρμα που φιλοξένησε τα έργα στη μελέτη. “Ενώ θα υπάρχει πάντοτε η ανάγκη για ανθρώπινη προσπάθεια σε αυτά τα έργα, ο συνδυασμός αυτών των προσπαθειών με τη βοήθεια των τεχνικών Big Data μπορεί να βοηθήσει τους ερευνητές να επεξεργάζονται περισσότερα δεδομένα ακόμη πιο γρήγορα και επιτρέπει στους εθελοντές να επικεντρωθούν στις σκληρότερες και σπανιότερες ταξινομήσεις.
Με επικεφαλής την Fortson, η ομάδα Zooniverse στο Πανεπιστήμιο της Μινεσότα, συμπεριλαμβανομένου του Willi, εργάζεται για να ενσωματώσει τις τεχνικές μηχανικής μάθησης στην πλατφόρμα, έτσι ώστε εκατοντάδες ερευνητές από την αστρονομία έως τη ζωολογία χρησιμοποιώντας τη πλατφόρμα να μπορούν να επωφεληθούν από αυτές.
Εκτός από ερευνητές του Πανεπιστημίου της Μινεσότα, η διεθνής ομάδα αυτής της μελέτης περιελάμβανε ερευνητές από το Πανεπιστήμιο της Οξφόρδης, το Τμήμα Φυσικών Πόρων του Ουισκόνσιν, το Ινστιτούτο Κοινοτήτων και Άγριας Ζωής στην Αφρική, το Πλανητάριο Adler και τον οργανισμό Panthera.
Επιστημονικό Άρθρο:
Marco Willi, Ross T. Pitman, Anabelle W. Cardoso, Christina Locke, Alexandra Swanson, Amy Boyer, Marten Veldthuis, Lucy Fortson. Identifying animal species in camera trap images using deep learning and citizen science. Methods in Ecology and Evolution, 2018