Mások viselkedésének előrejelzése az úton mesterséges intelligenciával
A városi utcákon közlekedő teljesen autonóm járműveknek az ember lehet az egyik legnagyobb akadálya. Ha egy robot biztonságosan át akar vezetni egy járművet Boston belvárosában, képesnek kell lennie megjósolni, hogy a közelben lévő sofőrök, gyalogosok és kerékpárosok mit fognak tenni.
A viselkedés-előrejelzés azonban nehéz probléma, és a jelenlegi mesterséges intelligencia-megoldások vagy túl leegyszerűsítettek (feltételezhetik, hogy a gyalogosok mindig egyenes vonalban sétálnak), túl konzervatívak (a gyalogosok elkerülése érdekében a robot egyszerűen megállítja az autót), vagy csak egy közlekedő következő lépéseit jelzi előre (az utakon általában sok közlekedő van egyszerre.)
Az MIT kutatói megtévesztően egyszerű megoldást dolgoztak ki erre a bonyolult kihívásra. Egy több szereplős viselkedés-előrejelzési problémát kisebb darabokra bontanak, és mindegyiket külön-külön kezelik, így a számítógép valós időben képes megoldani ezt az összetett feladatot.
Viselkedés-előrejelzési keretük először kitalálja két úthasználó között a kapcsolatokat – melyik autónak, kerékpárosnak vagy gyalogosnak van elsőbbsége, és melyik szereplő enged –, és ezeket a kapcsolatokat arra használja, hogy előre jelezze a több szereplő jövőbeli pályáit.
Ezek a becsült pályák pontosabbak voltak, mint a többi gépi tanulási modellé, összehasonlítva a valós forgalommal a Waymo autonóm vezetéssel foglalkozó cég által összeállított hatalmas adatkészletben. Az MIT technikája még a Waymo nemrég közzétett modelljét is felülmúlta. És mivel a kutatók a problémát egyszerűbb darabokra bontották, technikájuk kevesebb memóriát használt.
„Ez egy nagyon intuitív ötlet, még senki sem vizsgálta meg teljesen, és elég jól működik. Az egyszerűség mindenképpen előny.”
„Összehasonlítva modellünket a terület többi korszerű modelljével, beleértve a terület vezető vállalatának, a Waymo-nak a modelljét, modellünk csúcsteljesítményt ér el ezen a kihívásokkal teli viszonyítási alapon. Ebben rengeteg lehetőség rejlik a jövőre nézve” – mondja Xin „Cyrus” Huang társszerző, végzős hallgató a Repülési és Űrhajózási Tanszéken, valamint kutató asszisztens Brian Williams, a repülés- és asztronautika professzora laboratóriumában. a Számítástechnikai és Mesterséges Intelligencia Laboratórium (CSAIL) tagja.
A kutatók gépi tanulási módszere, az M2I, két bemenetet vesz igénybe: egymással interakcióba lépő autók, kerékpárosok és gyalogosok múltbeli pályáit egy forgalmi környezetben, például négyirányú kereszteződésben, és egy térképet az utcák elhelyezkedésével, sávkonfigurációkkal stb.
Ezt az információt felhasználva a reláció-előrejelző kikövetkezteti, hogy a két ügynök közül melyiknek van elsőbbsége, és az egyiket átengedőnek, a másikat pedig átadónak minősíti. Ezután egy marginális prediktorként ismert predikciós modell kitalálja az áthaladó szereplő pályáját, mivel ez a közlekedő függetlenül viselkedik.
Egy második predikciós modell, amelyet feltételes előrejelzőként ismernek, azután kitalálja, hogy az átadó ágens mit fog tenni az áthaladó szereplő tevékenységei alapján. A rendszer számos különböző pályát jelez előre az átengedőnek és az áthaladónak, mindegyiknek külön-külön kiszámítja a valószínűségét, majd kiválasztja azt a hat együttes eredményt, amelyek bekövetkezésének valószínűsége a legnagyobb.
Az M2I előrejelzést ad ki arról, hogy ezek az ügynökök a következő nyolc másodpercben hogyan mozognak majd a forgalomban. Az egyik példában a módszerük arra késztette a járművet, hogy lelassítson, így a gyalogos át tudott kelni az utcán, majd felgyorsult, amikor elhagyta a kereszteződést. Egy másik példában a jármű megvárta, amíg több autó elhaladt, mielőtt egy mellékutcából egy forgalmas, főútra kanyarodott volna.
Míg ez a kezdeti kutatás két ágens közötti interakciókra összpontosít, az M2I számos szereplő közötti kapcsolatokra következtethet, majd több marginális és feltételes előrejelző összekapcsolásával kitalálhatja a pályájukat.
A kutatók a modelleket a Waymo Open Motion Dataset segítségével képezték ki, amely több millió valós forgalmi jelenetet tartalmaz járművekkel, gyalogosokkal és kerékpárosokkal, amelyeket a vállalat autonóm járműveire szerelt lidar (fényérzékelés és távolságmérő) érzékelők és kamerák rögzítettek. Kifejezetten a több szereplőt érintő esetekre összpontosítottak.
A pontosság megállapítása érdekében összehasonlították az egyes módszerek hat előrejelzési mintáját, a konfidenciaszintjükkel súlyozva, a tényleges pályákkal, amelyeket az autók, kerékpárosok és gyalogosok követtek a jelenetben. Az ő módszerük volt a legpontosabb. Az átfedési aránynak nevezett mutatóban is felülmúlta az alapmodelleket; ha két pálya fedi egymást, az ütközést jelez. Az M2I volt a legalacsonyabb átfedési arány.
„Ahelyett, hogy egy bonyolultabb modellt építenénk fel ennek a problémának a megoldására, olyan megközelítést választottunk, amely inkább hasonlít az emberek gondolkodására, amikor másokkal való interakcióról gondolkodik. Az ember nem okoskodik a jövőbeli viselkedésmódok százféle kombinációján. Elég gyorsan hozunk döntéseket” – mondja Huang.
Az M2I másik előnye, hogy mivel kisebb darabokra bontja a problémát, a felhasználó könnyebben megérti a modell döntéshozatalát. Hosszú távon ez segíthet a felhasználóknak abban, hogy jobban bízzanak az autonóm járművekben, mondja Huang.
De a keretrendszer nem tudja figyelembe venni azokat az eseteket, amikor két közlekedő kölcsönösen befolyásolja egymást, például amikor két jármű mindegyike előrelendül egy négyirányú kereszteződésben, mert a sofőrök nem biztosak abban, hogy kinek kellene engednie.
A jövőbeni munkájuk során ezt a korlátozást kívánják orvosolni. Módszerüket az úthasználók közötti valósághű interakciók szimulálására is szeretnék használni, amivel ellenőrizni lehetne az önvezető autók tervezési algoritmusait, vagy hatalmas mennyiségű szintetikus vezetési adatot hozhatnának létre a modell teljesítményének javítása érdekében.
„A több, egymással kölcsönhatásban lévő közlekedő jövőbeli pályáinak előrejelzése nem teljesen feltárt, és rendkívül nagy kihívást jelent a teljes autonómia lehetővé tétele érdekében az összetett helyzetekben. Az M2I rendkívül ígéretes előrejelzési módszert biztosít a reláció-előrejelzővel a marginálisan vagy feltételesen megjósolt ágensek megkülönböztetésére, ami jelentősen leegyszerűsíti a problémát” – írta Masayoshi Tomizuka, a Kaliforniai Egyetem gépészmérnöki professzora és Wei Zhan, professzionális kutató asszisztens egy e-mailben. „Az előrejelzési modell képes megragadni az ágensek belső kapcsolatát és interakcióit a legkorszerűbb teljesítmény elérése érdekében.”
Forrás: Sci tech Daily
https://scitechdaily.com/predicting-others-behavior-on-the-road-with-artificial-intelligence/