A YOLO-NAS a YOLO sorozat tárgyérzékelő modelljeinek csúcsa. De miért tartják a legjobbnak?
A YOLOv8 után még mindig létezik egy új, korszerűbb objektumészlelési modell, a YOLO-NAS. Ez egy objektumészlelő algoritmus, amelyet a Deci AI fejlesztett ki, hogy leküzdje a korábbi YOLO (You Only Look Once) modellek korlátait.
A modell az AutoNAC-ból, egy neurális architektúra keresőmotorból épül fel. Felülmúlja a SOTA modellek sebességét és teljesítményét, ami nagy ugrást jelent az objektumészlelésben a pontosság-latencia és a kvantálás támogatásának javításával.
Ez a cikk a YOLO-NAS erősségeit és jellemzőit tárgyalja, és feltárja, miért ez a legjobb objektumészlelési modell a YOLO sorozatban.
A YOLO-NAS működésének megértése
A Deci AutoNAC (Automated Neural Architecture Construction) rendszere generálja a YOLO-NAS architektúráját. Az AutoNAC egy zökkenőmentes folyamat, amely teljesítménynövelést biztosít a meglévő mély neurális hálózatoknak.
Az AutoNAC pipeline egy felhasználó által betanított mély neurális hálózatot használ bemenetként, adatkészletként és hozzáférésként egy következtetési rendszerhez. A felhasználó által betanított mély neurális hálózat ezután újratervezésen esik át a folyamat segítségével. Ekkor a pontosság veszélyeztetése nélkül optimalizált architektúra érhető el alacsonyabb késleltetéssel.
A YOLO-NAS RepVGG-t használ. A RepVGG elérhetővé teszi az edzés utáni optimalizáláshoz újraparaméterezéssel vagy edzés utáni kvantálással. Ez egy VGG-n alapuló neurális hálózati architektúra. Rendszerezési technikákat használ, amelyek célja a mély tanulási modellek általánosítási képességének javítása.
Az architektúra kialakítása hatékonyabb a sebesség és a memória tekintetében. A RepVGG többágú architektúrát használ a gyorsabb következtetés érdekében. Ezután újraparaméterezéssel egyetlen ággá alakítják.
Ez a funkció nagyon hasznossá teszi a YOLO-NAS-t az éles telepítéshez. Ennek az az oka, hogy a modell teljes pontossággal betanítható és optimalizálható a következtetési sebesség és a memóriahasználat szempontjából.
A YOLO-NAS főbb jellemzői
A YOLO-NAS legfontosabb jellemzői a következők:
- Kvantizálás-tudatos tréning: A modell QSP és QCI (quantization-aware moduls) segítségével csökkenti a pontosság veszteségét az edzés utáni kvantálás során a 8 bites kvantálás újraparaméterezésének kombinálásával.
- Automatikus építészeti tervezés: Az AutoNAC, a Deci szabadalmaztatott NAS technológiája olyan optimális modellarchitektúrát keres, amely integrálja az alapvető YOLO modellarchitektúrákat, hogy optimalizált modellt hozzon létre.
- Hibrid kvantálási technika: A standard kvantálási módszer az egész modellre kihat. Ezzel szemben a hibrid kvantálási technika a modell egy részét kvantálja, hogy egyensúlyba hozza a modell késleltetését és pontosságát.
- Használjon egyedi megközelítéseket a modell képzésre való felkészítéséhez automatikusan címkézett adatok használatával. A modell ezután tanul az előrejelzéseiből, és nagy mennyiségű adathoz fér hozzá.
Összehasonlító elemzés: YOLO-NAS vs. más YOLO modellek
Az alábbiakban összehasonlítjuk a YOLO sorozat különböző modelljeit.
A YOLO-NAS jobb, mint a már meglévő objektumészlelési modellek, de megvannak a maga hátrányai. Íme egy lista a YOLO-NAS előnyeiről és hátrányairól:
Profik
- Nyílt forráskódú.
- 10-20%-kal gyorsabb, mint a már meglévő YOLO modellek.
- Pontosabb a már meglévő YOLO modellekhez képest.
- Jobb architektúrát használ, az AutoNAC-ot. Ez új rekordot állít fel az objektumészlelésben, a legjobb pontosságot és késleltetési kompromisszumot biztosítva.
- Zökkenőmentes támogatás az olyan következtetési motorokhoz, mint az NVIDIA. Ez a funkció gyártásra kész modellé teszi.
- Jobb memóriahatékonysággal és megnövelt következtetési sebességgel rendelkezik.
Hátrányok
- Még nem stabil, mivel a technológia még új, és nem használták vadul a gyártásban.
A YOLO-NAS megvalósítása
Használni fogod Google Colab a kódok írása és futtatása ebben a megvalósításban. A Google Colab alternatívája az lenne hozzon létre egy virtuális környezetet és használjon IDE-t a helyi gépen.
A modell nagyon erőforrás-igényes. Győződjön meg arról, hogy legalább 8 GB RAM-mal rendelkezik, mielőtt futtatná a gépén. Minél nagyobb a videó mérete, annál több memóriát használ.
Függőségek telepítése
Telepítse a YOLO-NAS függőséget, szuperszínátmenetek az alábbi parancs segítségével:
pip install super-gradiens==3.1.2
A sikeres telepítés után most már betaníthatja a YOLO-NAS modellt.
Modellképzés
A modell betanításához futtassa az alábbi kódblokkot:
tól től super_gradiens.training import modellek
yolo_nas_l = models.get("yolo_nas_l", előedzett_súlyok="kókuszdió")
Ebben a kódban importálja a képzési modellt a telepített SuperGradients könyvtárból. Ezután a COCO-adatkészlet előre betanított modellsúlyait használja.
Modellkövetkeztetés
A modellkövetkeztetésnek vannak lehetséges alkalmazásai képfelismerési, osztályozási és szegmentálási feladatokhoz.
Ebben az esetben a objektumészlelési feladat videókhoz és képekhez. A képen lévő objektum észleléséhez futtassa az alábbi kódblokkot:
url = "img_path"
yolo_nas_l.predict (url, conf=0.25).előadás()
Ügyeljen arra, hogy a kép pontos elérési útját használja. Ebben az esetben töltse fel a képet a Google Colab környezetbe, majd másolja ki a kép elérési útját.
Várható kimenet:
A videóban lévő objektumok észleléséhez futtassa az alábbi kódblokkot:
import fáklya
input_video_path = "útvonal a videóhoz"
output_video_path = "detected.mp4"
eszköz = "cuda"ha torch.cuda.is_available() más"CPU"
yolo_nas_l.to (device).predict (input_video_path).save (output_video_path)
A képadatokhoz hasonlóan töltse fel azt a videót, amelynek objektumait észlelni szeretné, a Google Colab-környezetbe, és másolja az elérési utat a videóváltozóhoz. Az előrejelzett videó a név használatával elérhető lesz a Google Colab környezetből észlelt.mp4. A munkamenet befejezése előtt töltse le a videót a helyi gépére.
Várható kimenet:
A YOLO-NAS támogatja a modell finomhangolását és az egyéni adatokon történő oktatást is. A dokumentáció elérhető a Decié finomhangoló indító notebook.
A YOLO-NAS valós alkalmazásai
A YOLO-NAS forráskódja az Apache License 2.0 alatt érhető el, amely nem kereskedelmi használatra érhető el. Kereskedelmi használatra a modellt a semmiből át kell képezni, hogy egyedi súlyokat kaphasson.
Ez egy sokoldalú modell, amely több területen is alkalmazható, mint pl.
Autonóm járművek és robotok
A YOLO-NAS javíthatja az autonóm járművek észlelési képességeit, lehetővé téve számukra, hogy valós időben gyorsabban és pontosabban észleljék és nyomon követhessék a tárgyakat. Ez a képesség segít a közúti biztonság és a gördülékeny vezetési élmény biztosításában.
Felügyeleti és biztonsági rendszerek
A modell gyors, pontos és valós idejű objektumészlelést tud nyújtani a felügyelet és a biztonság érdekében rendszerek, amely segít azonosítani a potenciális fenyegetéseket vagy gyanús tevékenységeket, ami jobb biztonságot eredményez rendszerek
Kiskereskedelem és készletkezelés
A modell gyors és pontos objektumészlelési képességeket biztosít, amelyek hatékony és valós idejű automatizált készletkezelést, készletkövetést és polcoptimalizálást tesznek lehetővé. Ez a modell segít csökkenteni a működési költségeket és növelni a nyereséget.
Egészségügyi és orvosi képalkotás
Az egészségügyben a YOLO-NAS képes segíteni a betegség anomáliáinak vagy speciális érdeklődési területeinek hatékony felderítésében és elemzésében. A modell segítheti az orvosokat a betegségek pontos diagnosztizálásában és a betegek monitorozásában, ezáltal javítva az egészségügyi szektort.
YOLO-NAS elvihető
A YOLO-NAS egy új objektumészlelési modell, amely úttörő szerepet játszik az objektumészlelés új módjában. Jobb, mint a SOTA modellek. Objektumészlelési teljesítménye nagy ugrás a számítógépes látásprojektek számára.