A radikálisan gyorsabb és olcsóbb 3D gépi látás egyetlen pixelt használ

Az önvezető autók kifinomult szenzoroktól függenek, amelyeket nagy számítási teljesítmény támogat. A kínai Tsinghua Egyetem által vezetett kutatás csökkenti a számítástechnikai követelményeket egy olyan nyomkövető rendszerrel, amely mindössze egyetlen képpontot igényel a feladat elvégzéséhez.

Amikor először az autonóm autókra és az intelligens biztonsági rendszerekre gondoltak, a támogatásukhoz szükséges számítógépes látásrendszerek egyszerűnek tűntek. De kiderült, hogy rendkívül nehezen megoldhatók. Lehet, hogy az emberi szem optikailag egyszerűbb (bár nem olyan egyszerű), de a mögötte álló feldolgozás elképesztően bonyolult. Ha hozzávesszük, hogy az emberek hogyan használják fel ezt az információt, és hogyan reagálnak rájuk szimpla reflexekkel, ennek a képességnek az utánzása szinte lehetetlen feladatnak bizonyul.

A Tsinghua csapata egy olyan 3D-s módszert fejlesztett ki, amely a gyorsan mozgó objektumok példátlan sebességű nyomon követésére szolgál, miközben csökkenti a számítási követelményeket. Az okos megoldás az, hogy ezt nem teljes képpel teszi, hanem egyetlen pixelre támaszkodva.

„A mi megközelítésünk nem igényli az objektum képének rekonstrukcióját a helyzet kiszámításához, ami jelentősen csökkenti az adattárolási és számítási költségeket” – mondta Zihan Geng kutatócsoport vezetője. „Konkrétan egy 3D koordináta megszerzéséhez mindössze hat bájt tárterületre és 2,4 [mikroszekundum] számítási időre van szükség. A számítási költségek csökkentésével és a hatékonyság javításával csökkenthetők a nagysebességű nyomkövetéshez szükséges berendezések költségei, így a technológia elérhetőbbé válik és új alkalmazások válnak lehetségessé.”

A csapat szerint egyetlen detektorral technikájuk 200-szor gyorsabban képes követni egy objektumot, mint a hagyományos videó alapú módszerek, előzetes információ nélkül és minimális számítási teljesítménnyel. Ezt úgy teszi, hogy geometriai fénymintákat vetít az objektumra, és megméri egyetlen képpont intenzitását. Néhány bonyolult matematikai művelet segítségével kiszámítható az objektum helyzete és pályája.

Kezdetben a csapat szimulációkra támaszkodott, de hamarosan áttért egy lézer és egy digitális mikrotükör eszköz (DMD) használatára, hogy megvilágítsanak egy fémgömböt, amely egy ívelt spirálhuzalon mozog lefelé. Az egy pixelben lévő információ lehetővé tette a rendszer számára a szükséges számítások elvégzését.

A technikát eddig egyetlen objektum követésére használják, a következő lépésben több objektumra kell áttérni.

„Ez a technológia javíthatja az olyan technológiák észlelési képességeit, mint az önvezető autók, javíthatja a biztonsági felügyeleti rendszereket, és hatékonyabb felügyeletet és minőség-ellenőrzést kínálhat az ipari ellenőrzésekhez” – mondta Geng. „Emellett ez a nagysebességű lokalizációs technika felhasználható tudományos kutatásokban, például rovarok repülési pályájának vizsgálatában.”

Forrás: newatlas.com

Lépjen kapcsolatba velünk

Budapest, Than Károly u. 3, 1119
(1) 371 5936