A gépi látás az önvezető autók alapja, és kritikus a teljesen autonóm jövő szempontjából.
Kulcs elvitelek
- Az önvezető autók a gépi látástechnológiára támaszkodnak, hogy lássák és megértsék környezetüket, lehetővé téve számukra a tárgyak észlelését, a jelzések azonosítását és az úton történő navigálást.
- Az önvezető autók gépi látása egy kamerarendszerből, az élszámítógépből és az AI algoritmusokból áll, amelyek együttesen gyűjtik össze a vizuális információkat, dolgozzák fel azokat valós időben, azonosítják a mintákat és tárgyakat.
- A gépi látás kulcsfontosságú az önvezető autók teljes autonómiájának eléréséhez, mivel lehetővé teszi az objektumok osztályozását, a sáv- és jelzésérzékelést, a jelzések azonosítását és a forgalom felismerését. Az autonóm járművek jövője a mesterséges intelligencia, az élvonalbeli számítástechnika és a kameratechnológia fejlődésében rejlik.
Az önvezető autók mindig is felkeltették a figyelmet. Bár lehet, hogy még nincsenek teljesen autonóm autóink, vannak fejlettebb autóink vezetőtámogató rendszerek (ADAS), amelyek képesek automatikus kormányzásra, sávváltásra, parkolásra és forgalomfigyelő tempomat.
Az önvezető autók számos érzékelőt használnak az ADAS-hoz, és a gépi látás a tárgyak és az általános környezet észlelésének, azonosításának és távolságának kiszámításának elsődleges módja. Gépi látás nélkül nagyon valószínűtlenek az önvezető autók tempomattal és robotpilótával.
Mi az a gépi látás?
A gépi látás olyan technológia, amely lehetővé teszi a gépek számára, hogy lássák és felismerjék a környezetükben lévő tárgyakat. Ez a számítógépes látás egy részhalmaza, amely a látásorientált objektumészlelés ipari alkalmazásaira összpontosít autonóm gépekben, például robotokban és járművekben.
A gépi látás ma olyan mesterséges intelligencia mélytanulási algoritmusokat használ, mint a konvolúciós neurális hálózatok (CNN-ek) robusztus és jól általánosított modellek létrehozása, amelyek pontosan azonosítják az objektumokat különböző területeken körülmények. Lehetővé teszi a gépi látás megvalósítását a gyártásban, a mezőgazdaságban, a robotikában és az autóiparban nagyobb megbízhatóságot igénylő feladatokban.
Hogyan működik a gépi látás az önvezető autókban?
Az önvezető autók gépi látása jellemzően három részre osztható: kamerarendszerre, feldolgozásra (élszámítás) és AI-ra. Ez a technológiai halom lehetővé teszi az autonóm jármű számára, hogy vezetés közben lásson, gondolkodjon és azonosítsa a jeleket és az akadályokat. Vizsgáljuk meg részletesen az egyes részeket, hogy megértsük, hogyan kapcsolódnak össze ezek a technológiák az önvezető autó gépi látásmódjában.
Kamera rendszer
A gépi látás kamerarendszerekre támaszkodik, hogy vizuális információkat gyűjtsön a környezetről. Az önvezető autók több kamerát alkalmaznak az autó körül, hogy a lehető legtöbb vizuális információt gyűjtsék össze.
A gépi látó kamerákban két fő érzékelőt használnak: komplementer fém-oxid félvezetőket (CMOS) és töltéscsatolt eszközök (CCD). Az önvezető autóknál a CMOS-t gyakran előnyben részesítik gyors kiolvasási sebessége és nagy teljesítménye miatt elektronika és párhuzamos feldolgozási képességek, így ez a gyorsabb érzékelő, bár hajlamos a zajra vagy műtárgyak. Az olyan megoldások, mint a különböző világítási módok, a digitális éjszakai látás és a szűrők, segíthetik a CMOS-érzékelőt a kevésbé ideális megvilágítási körülmények között.
Az önvezető autóknál a kamerákat egymástól bizonyos távolságra helyezik el, hogy sztereoszkópikus látást biztosítsanak. A sztereoszkópikus látás két vagy több vizuális bemenet kombinálásának képessége, ami mélység vagy háromdimenziós érzetet kelt a tárgyakban és a környezetben. Ez viszont lehetővé teszi az autók számára, hogy háromszögelést végezzenek, és kiszámítsák az objektum és az autó közötti hozzávetőleges távolságot.
Mivel az embernek két szeme van, a sztereoszkópikus látás is előnyös számunkra. Te magad is tesztelheted; csukja be az egyik szemét, és válasszon ki egy kis tárgyat az asztaláról. Helyezze a kezét a tárgy oldalára, és ügyeljen arra, hogy a tárgy hegye legalább két hüvelyk távolságra legyen. Próbáljon meg néhány másodpercre szünetet tartani, és nézze meg, mennyire magabiztos a közelítésében. Most próbálja kinyitni mindkét szemét, és meglátja, hogy a mélységérzéke sokkal jobb.
Edge számítógép
Míg az önvezető autó kamerarendszere adatokat gyűjt, egy fedélzeti számítógép (élprocesszor) Valamennyi bemenetet valós időben dolgoz fel, hogy frissítse a rendszert a környezet állapotáról azonnal. Bár a tipikus gépi látási feladatok pénzt takaríthatnak meg a számítási felhő használatával, egyszerűen túl sok az önvezető autók felhőhöz való csatlakozásának kockázata, még akkor is, ha a folyamat kiszervezéséről van szó a gépi látás követelményeiben.
A peremszámítógép használata a bemeneti adatok feldolgozására kiküszöböli a késleltetési problémákat, és biztosítja az adatok valós idejű fogadását, feldolgozását és kommunikációját. Az önvezető autókhoz készült Edge számítógépek speciális, mesterséges intelligencia grafikus processzorokat integráló számítógépeket használnak, mint például az NVIDIA Tensor Core és CUDA Core.
AI algoritmusok
Az algoritmusok mindig is a gépi látás kulcsfontosságú részét képezték. Az algoritmus az, ami lehetővé teszi a számítógép számára, hogy azonosítsa a kamerarendszer által biztosított összes mintát, formát és színt. A mesterséges intelligencia használata a hagyományosabb gépi látási algoritmusokkal szemben nagyban javítja az önvezető autók azon képességét, hogy megbízhatóan azonosítsák a tárgyakat, az utcatáblákat, az útburkolati jeleket és a közlekedési lámpákat. Számos mesterséges intelligencia-algoritmust használnak az önvezető autók betanítására. A legnépszerűbbek a következők:
- YOLO (Csak egyszer nézel): Valós idejű objektumészlelő algoritmus, amely azonosítja és követi az autó látóterében lévő objektumokat.
- SIFT (Scale-Icar'sant Feature Transform): Jellemzők kiemelésére használják, így segít az autónak felismerni a jellegzetes tereptárgyakat és tárgyakat a környezetében.
- Orientált színátmenetek hisztogramja (HOG): Objektumfelismerésre használják, és a helyi minták és színátmenetek kinyerésére összpontosít a képekből.
- TextonBoost: Algoritmus, amely segít az objektumok felismerésében a környezet textúráinak elemzésével.
- AdaBoost: Az adatosztályozáshoz használt AdaBoost több gyenge osztályozót kombinál, hogy határozott döntéseket hozzon a jármű útjába kerülő tárgyakkal és akadályokkal kapcsolatban.
A gépi látás jelentősége az önvezető autókban
A gépi látás az elsődleges módja annak, hogy egy önvezető autó érzékelje és megértse környezetét. Gépi látás nélkül nagyon valószínű, hogy az önvezető autók visszaszorulnak az 1-es szintre jármű autonómia skála és soha nem érheti el a teljes autonómiát.
A gépi látással az önvezető autók ma már képesek objektumok osztályozására, sáv- és jelzésérzékelésére, tábla-azonosításra és forgalomfelismerésre.
Bár sok önvezető jármű ma már különféle érzékelőket használ, mint például a LIDAR, a RADAR és a SONAR, ezek mindegyike nagymértékben támaszkodik a gépi látás, hogy lássa a környezetet, azonosítsa a tárgyakat, és megértse a táblák és közlekedési lámpák jelentését út. Mindezek az extra szenzorok csak azért vannak, hogy javítsák a gépi látást, és előmozdítsák az emberek, állatok és ingatlanok biztonságát.
Ennek ellenére a gépi látás önállóan működhet, más érzékelők segítsége nélkül, hogy biztosítsa az autopilóta képességeit. Valójában a Tesla legújabb önvezető autói leállították a RADAR-t, és most már kizárólag a gépi látásra támaszkodnak az Autopilot rendszerben.
Bár ez semmit nem jelent más szenzortechnológiák hasznosságának lejáratása szempontjából, de jól mutatja a gépi látás fontosságát és erejét az önvezető autókban.
A gépi látás jövője az autonóm járművekben
A gépi látás az önvezető autók alapja. A gépi látás révén az autók pontosan úgy látják és érzékelik a környezetet, mint az emberek. Bár a kihívások továbbra is fennállnak, a gépi látás előnyeit a biztonság és a navigáció szempontjából nem lehet alábecsülni. Ami az autonóm járművek jövőjét illeti, a mesterséges intelligencia, az élvonalbeli számítástechnika és/vagy a kamera további fejlesztései A technológia minden bizonnyal készségesebbé teszi az önvezető autókat, ami valószínűleg magasabb szintre emeli őket automatizálás.