Az UC Berkeley robotnavigációja új irányt mutathat az önvezető rendszerek számára
Egy új megközelítés, amely több órányi videót és megerősítő tanulási elemeket használ, csaknem 3 km-en át képes vezetni a robotjárművet a környék teljes térképe nélkül.
A robotoknak és az önvezető autóknak van egy nagy közös kihívása: megtanulni, hogy hogyan kell eligazodni a világban. Ezeket a feladatokat a mesterséges intelligencia általában úgy közelíti meg, mint a környezet feltérképezésének problémáját, hogy pontos áttekintést készítsen egy környék geometriájáról, mielőtt egy robot vagy egy autó áthaladna a terepen.
De lehet, hogy van egy egyszerűbb módszer is.
A Kaliforniai Egyetem tudósai által közzétett cikk szerint egy kerekes robot kilométereket képes megtenni egy külvárosi területen. A droid rajta marad az ösvényeken, és kikerüli a korábban nem látott akadályokat. Lényeges, hogy nem térképezi fel a környezetét, ahogyan azt néhány más megközelítés tette, például az autonóm vezetési AI programokban.
Ehelyett a korábbi utak harminc órányi videójából felvett stratégiákra és néhány domborzati térképre támaszkodik, hogy tökéletes vázlatot készítsen arról, hogyan viszonyulnak egymáshoz az út állomásai, teljes térkép nélkül.
A „ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints” című kutatást Dhruv Shah doktorjelölt és Sergey Levine UC Berkeley adjunktus végezte.
Levine a Google-lal együttműködve évek óta dolgozik azon, hogy a mesterséges intelligenciát a robotikában alkalmazza. A munka számos kulcsfontosságú felfedezését Levine ismertette tavaly a „ Hogyan tanítsd a robotod” című tanulmányában. Ez a tanulmány az úgynevezett „megerősítő tanulás” felfedezéseire összpontosított, amely a mély tanulási mesterséges intelligencia egy olyan formája, ahol a neurális hálózatokat képezik arra, hogy lépésenként eljussanak a célhoz.
Shah és Levine legújabb munkája, a ViKiNG egy korábbi „RECON” nevű rendszerre épül, amely a „Rapid Exploration Controllers for Outcome-driven Navigation” (rövidítése, amelyet Shah és Levine tavaly mutatott be.
A RECON-t úgy képezték ki, hogy a Clearpath Robotics által készített, kerekes robotot, a Jackal pilóta nélküli földi járművet 18 hónapon keresztül „véletlenszerű sétákon” utaztatták többféle környezetben, például parkolókon és mezőkön keresztül, és több órányi videót gyűjtöttek a felszerelt RGB-n, kamerákon, LiDAR-on és GPS-en keresztül.
A RECON megtanulta az úgynevezett „navigációs prioritásokat” egy konvolúciós hálózaton keresztül, amely tömörítette és kibontotta a képadatokat, mint az úgynevezett „információs szűk keresztmetszetet”, amely a jelek kezelésére 2000- ben Naftali Tishby és munkatársai által bevezetett megközelítés.
Ez a RECON megközelítés fejleszti a szoftver azon képességét, hogy jól reprezentálja a vizuális környezetet azáltal, hogy tömöríti a képeket, majd felidézi a legfontosabbakat. A tesztfázisban a RECON-nak mutatnak egy célt, mondjuk egy adott épület képét, és menet közben kell kitalálnia, hogyan navigáljon el az új helyre.
A RECON elkészíti az ehhez a célhoz vezető út lépéseinek grafikonját, egyfajta rögtönzött térképet. Ezekkel a technikákkal a Jackal robot akár 80 métert is képes volt elnavigálni egy cél felé olyan új környezetben, amivel korábban még nem találkozott, és képes volt erre olyan esetekben is, amikor a robotnavigáció minden más megközelítése nem tudta elérni a célt.
A ViKiNG-ben Shah és Levine egy meghatározott módon bővíti ki a RECON-t: tippekkel. A Jackal szoftverének alternatív műholdképet adnak az új területről vagy felülnézeti térképeket.
Ahogy Shah és Levine írja: „A RECON-nal ellentétben, amely tájékozatlan keresést végez, a ViKiNG földrajzi tippeket tartalmaz hozzávetőleges GPS-koordináták és felülnézeti térképek formájában.
„Ez lehetővé teszi a ViKiNG számára, hogy távoli célokat érjen el, akár 25-ször távolabbiakat, mint a RECON által jelentett legtávolabbi cél, és akár 15-ször gyorsabban is elérheti a célokat, mint a RECON egy újszerű környezet felfedezésekor.”
A ViKiNG program megnövelte a random utak során kamerákkal szerzett tanulási adatainak mennyiségét további 12 órányi felvétellel, amely olyan „távműködtetett” utazásokon készült, ahol egy ember irányította a Jackal-t az útvonalon, pl. járdákon, vagy túraösvényeken.
A neurális hálózat, amelyet az összes meglehetősen homályos betanítási adat összedolgozására használnak, a MobileNet konvolúciós neurális hálózat.
A ViKiNG-gel felszerelt Jackal ezúttal jóval túllép a RECON 80 méterén, és a kiindulóponttól közel 3 kilométert tesz meg.
A projekthez kapcsolódó blogoldalon Shah és Levine egy videóban bemutatják, hogyan tud a Jackal a ViKiNG-gel rájönni, hogy hogyan tud megkerülni korábban ismeretlen akadályokat, például egy parkoló járművet, amely elzárja útját.
A RECON kifejezetten a megerősítő tanulás elemeit alkalmazta, csakúgy, mint a VIKING. Az RL-hez fűződő kapcsolatra vonatkozó kérdésre Levine egy e-mailben azt mondta a ZDNet -nek: „A ViKiNG-et egyfajta megerősítő tanulási módszerként jellemezném, amelyen egy magasabb szintű tervező ül.”
A kulcs, magyarázta Levine, az alacsony szintű tanult vezérlési megközelítések kombinációja a pillanatról pillanatra történő navigációval, és a magasabb szintű tervezéssel, ami hasonló az RL-hez.
Levine úgy véli, hogy nagy jelentősége van az összetettebb navigációnak, például az autonóm járműveknek. Azt mondta, a ViKiNG egy kezdet a „járdán közlekedő szállító robot” felé.
„De az autonóm vezetésnek vagy más nagyobb téttel járó feladatoknak (vagy akár valódi járdán való szállításnak, amikor a járműnek meg kell küzdenie a sűrű forgalommal) további mechanizmusokkal kell rendelkeznie a biztonság és a korlátok kezelésére, amelyeket a jelenlegi megközelítés még nem kezel közvetlenül”, mondta Levine.
Levine felvetetett, hogy az olyan dolgokkal kapcsolatos további munka, mint a biztonság, magában foglalhatja az emberektől, mint „másodpilótáktól” kapott kifejezett utasításokat, amelyek célja a robotok irányítása a bajok elkerülésére. De magában foglalhatja a meglévő politikák utánzását is, amely bizonyos biztosítékokat jelentene.
Levine szerint azonban a nagy sebességgel mozgó járművek és a nem látható akadályok, pl. a nem szabályosan közlekedő gyalogosok, további kutatást igényelnek.
„Természetesen az ilyen rendszerek szigorú biztonsági garanciáinak biztosítása komoly nyitott probléma, és úgy gondolom, hogy sokkal több munkára van szükség ahhoz, hogy ez kellően biztonságos legyen a teljes körűen autonóm járművek számára” – mondta Levine a ZDNetnek.
Forrás: ZDNet