A YOLO-NAS a YOLO sorozat tárgyérzékelő modelljeinek csúcsa. De miért tartják a legjobbnak?

A YOLOv8 után még mindig létezik egy új, korszerűbb objektumészlelési modell, a YOLO-NAS. Ez egy objektumészlelő algoritmus, amelyet a Deci AI fejlesztett ki, hogy leküzdje a korábbi YOLO (You Only Look Once) modellek korlátait.

A modell az AutoNAC-ból, egy neurális architektúra keresőmotorból épül fel. Felülmúlja a SOTA modellek sebességét és teljesítményét, ami nagy ugrást jelent az objektumészlelésben a pontosság-latencia és a kvantálás támogatásának javításával.

Ez a cikk a YOLO-NAS erősségeit és jellemzőit tárgyalja, és feltárja, miért ez a legjobb objektumészlelési modell a YOLO sorozatban.

A YOLO-NAS működésének megértése

A Deci AutoNAC (Automated Neural Architecture Construction) rendszere generálja a YOLO-NAS architektúráját. Az AutoNAC egy zökkenőmentes folyamat, amely teljesítménynövelést biztosít a meglévő mély neurális hálózatoknak.

Az AutoNAC pipeline egy felhasználó által betanított mély neurális hálózatot használ bemenetként, adatkészletként és hozzáférésként egy következtetési rendszerhez. A felhasználó által betanított mély neurális hálózat ezután újratervezésen esik át a folyamat segítségével. Ekkor a pontosság veszélyeztetése nélkül optimalizált architektúra érhető el alacsonyabb késleltetéssel.

instagram viewer

A YOLO-NAS RepVGG-t használ. A RepVGG elérhetővé teszi az edzés utáni optimalizáláshoz újraparaméterezéssel vagy edzés utáni kvantálással. Ez egy VGG-n alapuló neurális hálózati architektúra. Rendszerezési technikákat használ, amelyek célja a mély tanulási modellek általánosítási képességének javítása.

Az architektúra kialakítása hatékonyabb a sebesség és a memória tekintetében. A RepVGG többágú architektúrát használ a gyorsabb következtetés érdekében. Ezután újraparaméterezéssel egyetlen ággá alakítják.

Ez a funkció nagyon hasznossá teszi a YOLO-NAS-t az éles telepítéshez. Ennek az az oka, hogy a modell teljes pontossággal betanítható és optimalizálható a következtetési sebesség és a memóriahasználat szempontjából.

A YOLO-NAS főbb jellemzői

A YOLO-NAS legfontosabb jellemzői a következők:

  • Kvantizálás-tudatos tréning: A modell QSP és QCI (quantization-aware moduls) segítségével csökkenti a pontosság veszteségét az edzés utáni kvantálás során a 8 bites kvantálás újraparaméterezésének kombinálásával.
  • Automatikus építészeti tervezés: Az AutoNAC, a Deci szabadalmaztatott NAS technológiája olyan optimális modellarchitektúrát keres, amely integrálja az alapvető YOLO modellarchitektúrákat, hogy optimalizált modellt hozzon létre.
  • Hibrid kvantálási technika: A standard kvantálási módszer az egész modellre kihat. Ezzel szemben a hibrid kvantálási technika a modell egy részét kvantálja, hogy egyensúlyba hozza a modell késleltetését és pontosságát.
  • Használjon egyedi megközelítéseket a modell képzésre való felkészítéséhez automatikusan címkézett adatok használatával. A modell ezután tanul az előrejelzéseiből, és nagy mennyiségű adathoz fér hozzá.

Összehasonlító elemzés: YOLO-NAS vs. más YOLO modellek

Az alábbiakban összehasonlítjuk a YOLO sorozat különböző modelljeit.

A YOLO-NAS jobb, mint a már meglévő objektumészlelési modellek, de megvannak a maga hátrányai. Íme egy lista a YOLO-NAS előnyeiről és hátrányairól:

Profik

  • Nyílt forráskódú.
  • 10-20%-kal gyorsabb, mint a már meglévő YOLO modellek.
  • Pontosabb a már meglévő YOLO modellekhez képest.
  • Jobb architektúrát használ, az AutoNAC-ot. Ez új rekordot állít fel az objektumészlelésben, a legjobb pontosságot és késleltetési kompromisszumot biztosítva.
  • Zökkenőmentes támogatás az olyan következtetési motorokhoz, mint az NVIDIA. Ez a funkció gyártásra kész modellé teszi.
  • Jobb memóriahatékonysággal és megnövelt következtetési sebességgel rendelkezik.

Hátrányok

  • Még nem stabil, mivel a technológia még új, és nem használták vadul a gyártásban.

A YOLO-NAS megvalósítása

Használni fogod Google Colab a kódok írása és futtatása ebben a megvalósításban. A Google Colab alternatívája az lenne hozzon létre egy virtuális környezetet és használjon IDE-t a helyi gépen.

A modell nagyon erőforrás-igényes. Győződjön meg arról, hogy legalább 8 GB RAM-mal rendelkezik, mielőtt futtatná a gépén. Minél nagyobb a videó mérete, annál több memóriát használ.

Függőségek telepítése

Telepítse a YOLO-NAS függőséget, szuperszínátmenetek az alábbi parancs segítségével:

pip install super-gradiens==3.1.2

A sikeres telepítés után most már betaníthatja a YOLO-NAS modellt.

Modellképzés

A modell betanításához futtassa az alábbi kódblokkot:

tól től super_gradiens.training import modellek
yolo_nas_l = models.get("yolo_nas_l", előedzett_súlyok="kókuszdió")

Ebben a kódban importálja a képzési modellt a telepített SuperGradients könyvtárból. Ezután a COCO-adatkészlet előre betanított modellsúlyait használja.

Modellkövetkeztetés

A modellkövetkeztetésnek vannak lehetséges alkalmazásai képfelismerési, osztályozási és szegmentálási feladatokhoz.

Ebben az esetben a objektumészlelési feladat videókhoz és képekhez. A képen lévő objektum észleléséhez futtassa az alábbi kódblokkot:

url = "img_path"
yolo_nas_l.predict (url, conf=0.25).előadás()

Ügyeljen arra, hogy a kép pontos elérési útját használja. Ebben az esetben töltse fel a képet a Google Colab környezetbe, majd másolja ki a kép elérési útját.

Várható kimenet:

A videóban lévő objektumok észleléséhez futtassa az alábbi kódblokkot:

import fáklya

input_video_path = "útvonal a videóhoz"
output_video_path = "detected.mp4"
eszköz = "cuda"ha torch.cuda.is_available() más"CPU"
yolo_nas_l.to (device).predict (input_video_path).save (output_video_path)

A képadatokhoz hasonlóan töltse fel azt a videót, amelynek objektumait észlelni szeretné, a Google Colab-környezetbe, és másolja az elérési utat a videóváltozóhoz. Az előrejelzett videó a név használatával elérhető lesz a Google Colab környezetből észlelt.mp4. A munkamenet befejezése előtt töltse le a videót a helyi gépére.

Várható kimenet:

A YOLO-NAS támogatja a modell finomhangolását és az egyéni adatokon történő oktatást is. A dokumentáció elérhető a Decié finomhangoló indító notebook.

A YOLO-NAS valós alkalmazásai

A YOLO-NAS forráskódja az Apache License 2.0 alatt érhető el, amely nem kereskedelmi használatra érhető el. Kereskedelmi használatra a modellt a semmiből át kell képezni, hogy egyedi súlyokat kaphasson.

Ez egy sokoldalú modell, amely több területen is alkalmazható, mint pl.

Autonóm járművek és robotok

A YOLO-NAS javíthatja az autonóm járművek észlelési képességeit, lehetővé téve számukra, hogy valós időben gyorsabban és pontosabban észleljék és nyomon követhessék a tárgyakat. Ez a képesség segít a közúti biztonság és a gördülékeny vezetési élmény biztosításában.

Felügyeleti és biztonsági rendszerek

A modell gyors, pontos és valós idejű objektumészlelést tud nyújtani a felügyelet és a biztonság érdekében rendszerek, amely segít azonosítani a potenciális fenyegetéseket vagy gyanús tevékenységeket, ami jobb biztonságot eredményez rendszerek

Kiskereskedelem és készletkezelés

A modell gyors és pontos objektumészlelési képességeket biztosít, amelyek hatékony és valós idejű automatizált készletkezelést, készletkövetést és polcoptimalizálást tesznek lehetővé. Ez a modell segít csökkenteni a működési költségeket és növelni a nyereséget.

Egészségügyi és orvosi képalkotás

Az egészségügyben a YOLO-NAS képes segíteni a betegség anomáliáinak vagy speciális érdeklődési területeinek hatékony felderítésében és elemzésében. A modell segítheti az orvosokat a betegségek pontos diagnosztizálásában és a betegek monitorozásában, ezáltal javítva az egészségügyi szektort.

YOLO-NAS elvihető

A YOLO-NAS egy új objektumészlelési modell, amely úttörő szerepet játszik az objektumészlelés új módjában. Jobb, mint a SOTA modellek. Objektumészlelési teljesítménye nagy ugrás a számítógépes látásprojektek számára.