Jeśli roboty będą kiedykolwiek zarabiać na utrzymanie, będą musiały się uczyć w pracy. Kierownicy fabryk mają lepsze rzeczy do zrobienia niż programowanie złożonych instrukcji, więc co by się stało, gdyby mogli po prostu pokazać roboty co robić, tak samo jak zrobiliby nowego pracownika ludzkiego? Naukowcy zajmujący się SI z Nvidii zademonstrowali teraz system, który pozwala robotom to robić, ucząc się, jak wykonać określone zadanie, oglądając kogoś, kto robi to tylko raz.
Jeśli wcześniejsze badania są czymś, czego można się spodziewać, roboty mogą pewnego dnia uczyć się poprzez instrukcje werbalne i dosłownie czytać nasze umysły, aby poprawić się, kiedy się pomyli. Potem moglibyśmy mieć roboty uczące siebie nawzajem tych umiejętności, a nawet dzielące się wiedzą poprzez chmurę.
“Aby roboty mogły wykonywać użyteczne zadania w rzeczywistych warunkach, muszą być one łatwe do przekazania robotowi; obejmuje to zarówno pożądany rezultat, jak i wszelkie wskazówki co do najlepszych sposobów osiągnięcia tego rezultatu”, wyjaśniają badacze Nvidia. “Dzięki demonstracjom użytkownik może przekazać robotowi zadanie i udzielić wskazówek, jak najlepiej je wykonać.
Na potrzeby nowych eksperymentów badacze przeszkolili serię sieci neuronowych, aby wspólnie pracować nad wykonaniem zadania zademonstrowanego im przez człowieka. Te sieci neuronowe działają na układach GPU Titan X firmy Nvidia i są podłączone do kamery, która obserwuje ludzkie działania, oraz do pazura robota, który je naśladuje.
Naukowcy przeszkolili system, aby rozpoznawał zestaw czterech kolorowych bloków i samochód zabawkowy. Ludzki instruktor zaaranżowałby je w określony sposób, poczym je rozpraszałby. Następnie zadaniem robota było ponowne zmontowanie sceny w taki sposób, w jaki została pokazana.
W tym celu każda z sieci neuronowych ma swoje zadanie. Po pierwsze, sieć detekcji obiektu sprawdza, na co patrzy kamera. Następnie sieć wnioskowania o powiązaniach określa, jak te elementy pasują do siebie – na przykład niebieski blok znajduje się na górze czerwonego bloku. Następnie sieć generowania programów określa, co należy zrobić, aby osiągnąć cel, a na koniec plan jest przekazywany do sieci wykonawczej, która prowadzi pazury, aby go ściągnąć.
Robot również automatycznie podnosi się na własnych błędach. Jeśli na którymkolwiek etapie procesu się zepsuje, uświadamia sobie, że nie osiągnął jeszcze celu i próbuje ponownie. Zanim jednak robot zrobi cokolwiek, przygotuje również opis swojego planu, który będzie czytelny dla ludzi, dzięki czemu jego przełożeni będą mogli sprawdzić, czy nie zinterpretował on zadania niewłaściwie i w razie potrzeby ponownie go przetestować.
Naukowcy twierdzą, że nowa technika uczenia się powinna naprawdę przyspieszyć proces nauczania robotów, ponieważ nie trzeba jej szkolić na ogromnej ilości oznaczonych danych.