Τεχνητή νοημοσύνη «εκπαιδεύει» ρομπότ παρακολουθώντας τι κάνουν οι άνθρωποι

Υποβλήθηκε από m.t στις Πέμ, 24/05/2018 - 09:50.

Ερευνητές της NVIDIA, με επικεφαλής τους Σταν Μπίρτσφιλντ και Τζόναθαν Τρέμπλεϊ, ανέπτυξαν ένα άνευ προηγουμένου σύστημα τεχνητής νοημοσύνης βασισμένο στο deep learning, το οποίο μπορεί να «εκπαιδεύσει» ένα ρομπότ να ολοκληρώνει εργασίες απλά και μόνο παρατηρώντας τις ενέργειες ενός ανθρώπου.

Η συγκεκριμένη μέθοδος είναι σχεδιασμένη έτσι ώστε να βελτιώνει την επικοινωνία μεταξύ ανθρώπων και ρομπότ, ενώ ταυτόχρονα θα ενισχύει την έρευνα που θα επιτρέπει στα ρομπότ να δουλεύουν απρόσκοπτα και ομαλά πλάι στους ανθρώπους.

«Για να μπορούν τα ρομπότ να πραγματοποιούν χρήσιμες εργασίες σε συνθήκες πραγματικού κόσμου, πρέπει να είναι εύκολο να επικοινωνείται η αποστολή στο ρομπότ- αυτό περιλαμβάνει τόσο το επιθυμητό αποτέλεσμα και οποιεσδήποτε οδηγίες όσον αφορά στο πώς θα επιτευχθεί καλύτερα αυτό το αποτέλεσμα» αναφέρουν οι επιστήμονες στο paper τους.

«Με επιδείξεις, ένας χρήστης μπορεί να επικοινωνήσει μια εργασία στο ρομπότ και να παρέχει στοιχεία σχετικά με το πώς να το φέρει καλύτερα σε πέρας».

Χρησιμοποιώντας NVIDIA TITAN X GPUs, οι ερευνητές «εκπαίδευσαν» μια αλληλουχία νευρωνικών δικτύων για να κάνουν εργασίες που σχετίζονται με την αντίληψη, την παραγωγή προγράμματος και την εκτέλεση προγράμματος. Ως αποτέλεσμα, το ρομπότ ήταν σε θέση να μαθαίνει μια δουλειά από μία απλή επίδειξη στον πραγματικό κόσμο.

Όταν το ρομπότ βλέπει μια εργασία, παράγει μια αναγνώσιμη από άνθρωπο περιγραφή των απαραίτητων βημάτων για να την κάνει και αυτό. Η περιγραφή αυτή επιτρέπει στον χρήστη να ταυτοποιεί γρήγορα και να διορθώνει οποιαδήποτε ζητήματα σχετικά με την ερμηνεία της ανθρώπινης επίδειξης από το ρομπότ πριν την εκτέλεσή της εργασίας.

Το «κλειδί» για αυτό είναι η αξιοποίηση των δυνατοτήτων των συνθετικών δεδομένων για την «εκπαίδευση» των νευρωνικών δικτύων. Οι παρούσες προσεγγίσεις στο θέμα της εκπαίδευσης των νευρωνικών δικτύων απαιτούν μεγάλους όγκους εκπαιδευτικών δεδομένων, κάτι που αποτελεί σημαντικό περιορισμό για αυτά τα συστήματα.

Με την παραγωγή συνθετικών δεδομένων, είναι δυνατή η παραγωγή μιας σχεδόν απεριόριστης ποσότητας εκπαιδευτικών δεδομένων, με πολύ μικρή προσπάθεια. Επίσης, πρόκειται για την πρώτη φορά που μια τέτοια, εικονοκεντρική domain randomization προσέγγιση χρησιμοποιείται σε ρομπότ:

Το domain randomization είναι μια τεχνική που παράγει συνθετικά δεδομένα με μεγάλο εύρος ποικιλίας, κάτι που στη συνέχεια «ξεγελά» το δίκτυο με αποτέλεσμα να βλέπει τα δεδομένα του πραγματικού κόσμου ως απλά μια άλλη παραλλαγή των εκπαιδευτικών του δεδομένων.

Οι ερευνητές επέλεξαν να επεξεργαστούν τα δεδομένα με εικονοκεντρικό τρόπο, προκειμένου να διασφαλιστεί ότι τα δίκτυα δεν εξαρτώνται από την κάμερα ή το περιβάλλον.

Για τους σκοπούς της επίδειξής τους, οι ερευνητές εκπαίδευσαν ανιχνευτές αντικειμένων με πολύχρωμα κυβάκια και ένα αυτοκινητάκι. Το σύστημα εκπαιδεύτηκε ως προς τη φυσική σχέση που είχαν τα κυβάκια μεταξύ τους -το αν ήταν στοιβαγμένα το ένα πάνω στο άλλο ή τοποθετημένα πλάι – πλάι.

Οι ίδιοι λένε πως θα συνεχίσουν να εξερευνούν τη χρήση συνθετικών εκπαιδευτικών δεδομένων για σκοπούς «εκπαίδευσης» ρομπότ έτσι ώστε να επεκταθούν οι δυνατότητες χρήσης της μεθόδου τους σε επιπρόσθετα σενάρια.

Επιστήμη

Πηγή:

http://molonoti.gr