Újfajta ideghálózatok, melyek képesek megtanulni az ok-okozati összefüggéseket

Egy bizonyos típusú mesterséges intelligencia megtanítható a navigációs feladat ok-okozati alapjaira. Az ideghálózatok megtanulhatnak mindenféle problémát megoldani, a macskák fényképeken való azonosításától az önvezető autó kormányzásáig. De hogy ezek az erőteljes, mintafelismerő algoritmusok valóban megértik-e az elvégzett feladatokat, továbbra is nyitott kérdés.

Például egy neurális hálózat, amelynek feladata, hogy az önvezető autót a sávjában tartsa, megtanulhatja ezt úgy, hogy figyeli az út szélén lévő bokrokat, ahelyett, hogy megtanulná felismerni a sávokat és az út horizontjára összpontosítani.

Az MIT kutatói most bebizonyították, hogy egy bizonyos típusú ideghálózat képes megtanulni a navigációs feladat valódi ok-okozati struktúráját, amelyre betanítják. Mivel ezek a hálózatok közvetlenül a vizuális adatokból képesek megérteni a feladatot, hatékonyabbaknak kell lenniük, mint más neurális hálózatoknak, ha bonyolult környezetben, például sűrű fákkal vagy gyorsan változó időjárási körülmények között navigálnak.

A jövőben ez javíthatja azoknak a gépi tanulási rendszereknek a megbízhatóságát, amelyek nagy téttel járó feladatokat látnak el, például autonóm járművet vezetnek forgalmas autópályán.

„Mivel ezek a gépi tanulási rendszerek képesek ok-okozati szempontból érvelni, tudhatjuk és rámutathatunk arra, hogy hogyan működnek és döntenek. Ez elengedhetetlen a biztonság szempontjából kritikus alkalmazásokhoz” – mondja Ramin Hasani, a Számítástechnikai és Mesterséges Intelligencia Laboratórium (CSAIL) posztdoktora.

A társszerzők között van a villamosmérnöki és informatikai végzős hallgató, Charles Vorbach; a CSAIL PhD hallgató Alexander Amini; a Tudományos és Technológiai Intézet Ausztria végzős hallgatója, Mathias Lechner; és a vezető szerző Daniela Rus, az Andrew és Erna Viterbi villamosmérnöki és számítástechnikai professzora, valamint a CSAIL igazgatója. A kutatást a decemberi 2021-es neurális információfeldolgozó rendszerekről szóló konferencián (NeurIPS) mutatják be.

A neurális hálózatok egy olyan módszert jelentenek a gépi tanulás elvégzésére, amelyben a számítógép sok példa elemzésével megtanulja, hogy próbálkozás-hibázás útján végezzen feladatot. A „ folyékony” ideghálózatok pedig megváltoztatják mögöttes egyenleteiket, hogy folyamatosan alkalmazkodjanak az új bemenetekhez.

Az új kutatás a korábbi munkákra támaszkodik, amelyekben Hasani és mások bemutatták, hogy a folyékony ideghálózati sejtek által az agy mintájára épített mélytanulási rendszer, az úgynevezett Neural Circuit Policy (NCP), hogyan képes önállóan irányítani egy önvezető járművet, mindössze 19 vezérlőneuronból álló hálózattal.

A kutatók megfigyelték, hogy a sávtartási feladatot ellátó NCP-k a vezetési döntés meghozatalakor az út horizontját és határait figyelték, ugyanúgy, ahogy az ember tenné (vagy kellene) autóvezetés közben. Más neurális hálózatok, amelyeket tanulmányoztak, nem mindig az útra összpontosítottak.

„Ez hasznos megfigyelés volt, de nem számszerűsítettük. Tehát meg akartuk találni azokat a matematikai elveket, hogy miért és hogyan képesek ezek a hálózatok rögzíteni az adatok valódi okozati összefüggéseit ” – mondja.

Azt találták, hogy amikor egy NCP-t egy feladat elvégzésére képeznek ki, a hálózat megtanulja, hogy lépjen kapcsolatba a környezettel és számoljon a beavatkozásokkal. Lényegében a hálózat felismeri, ha a kimenetét bizonyos beavatkozás megváltoztatja, és összekapcsolja az okot és az okozatot.

Tanulás közben a hálózat előre hat, hogy kimenetet generáljon, majd visszafelé, hogy kijavítsa a hibákat. A kutatók megfigyelték, hogy az NCP-k ok-okozati összefüggésekre fókuszálnak előre és hátra módban, ami lehetővé teszi a hálózat számára, hogy a feladat valódi oksági struktúrájára összpontosítson.

Hasaninak és kollégáinak nem kellett további korlátozásokat építeniük a rendszerbe, és nem kellett elvégezniük az NCP speciális beállításait, hogy megtanulják ezt az okozati összefüggést.

„Az okság különösen fontos a biztonság szempontjából kritikus alkalmazások, például a repülés jellemzésére” – mondja Rus. “Munkánk bemutatja az NCP-k okozati összefüggéseit a repülés közbeni döntéshozatalban, beleértve a sűrű akadályokkal rendelkező környezetben való repülést, például az erdőket és a formációban való repülést.”

Egy sor szimuláción keresztül tesztelték az NCP-ket, amelyekben az autonóm drónok navigációs feladatokat láttak el. Minden drón egyetlen kamera adatait használta a navigáláshoz.

A drónok azt a feladatot kapták, hogy menjenek el egy céltárgyhoz, üldözzenek egy mozgó célpontot, vagy kövessenek egy sor jelzőingert különböző környezetekben, beleértve a vörösfás erdőt és a környéket. Emellett különböző időjárási körülmények között utaztak, például tiszta ég mellett, heves esőben és ködben.

A kutatók azt találták, hogy az NCP-k ugyanolyan jól teljesítettek, mint a többi hálózat jó időben, egyszerűbb feladatokon, de mindannyian felülmúlták a nagyobb kihívást jelentő feladatokban, például egy mozgó objektum követése során felhőszakadás közben.

„Megfigyeltük, hogy az NCP-k az egyetlen olyan hálózatok, amelyek a navigációs feladat végrehajtása során, bárhol is tesztelik, és különböző fényviszonyok vagy környezeti feltételek mellett is figyelnek a követendő tárgyra különböző környezetekben. Ez az egyetlen rendszer, amely képes ezt megtenni, és ténylegesen megtanulja azt a viselkedést, amelyet a rendszernek szándékozunk megtanítani” – mondja.

Eredményeik azt mutatják, hogy az NCP-k használata az autonóm drónok számára is lehetővé teszi a sikeres navigációt változó körülmények között, például a hirtelen ködössé váló napos tájon.

„Miután a rendszer megtanulta, hogy valójában mit kell tennie, jól teljesíthet olyan új forgatókönyvekben és környezeti körülmények között, amelyeket soha nem tapasztalt. Ez nagy kihívást jelent a jelenlegi gépi tanulási rendszereknek, amelyek nem ok-okozatokat tanulnak. Úgy gondoljuk, hogy ezek az eredmények nagyon izgalmasak, hiszen megmutatják, hogy az idegi hálózat kiválasztásával milyen ok-okozati összefüggések merülhetnek fel ” – mondja.

A jövőben a kutatók fel akarják tárni az NCP-k használati lehetőségeit nagyobb rendszerek kiépítésében. Több ezer vagy millió hálózat összekapcsolása lehetővé tenné számukra, hogy még bonyolultabb feladatokat is elvégezzenek.

Forrás: MIT News

https://news.mit.edu/2021/cause-effect-neural-networks-1014

Lépjen kapcsolatba velünk

Budapest, Than Károly u. 3, 1119
(1) 371 5936