A ChatGPT, a Bing AI és a Google Bard a leginkább felismerhető nevek a fogyasztói mesterséges intelligencia világában. Mindhárom termékben van egy közös vonás – mindegyik generatív AI-termék.

De mi is pontosan a generatív MI, és mi váltotta ki a közelmúltban az újjáéledő AI-tér iránti érdeklődést?

Mi a Generatív AI?

A generatív mesterséges intelligencia, a „generatív mesterséges intelligencia” rövidítése, egy olyan típusú mesterséges intelligencia, amely igény szerint egyedi vagy eredeti tartalmat, például szöveget, hangot, videókat vagy képeket képes generálni. Ellentétben néhány hagyományos AI-rendszerrel, amelyet olyan feladatokra terveztek, mint az adatok osztályozása vagy elemzése, a generatív AI A modellek inkább újszerű vagy kreatív eredményeket produkálnak az utasítások alapján adott.

Bár a generatív AI új technológiának tűnhet, valójában évtizedek óta létezik. Több iteráció és forma létezett már legalább az 1960-as években. A mesterséges intelligencia hatalmas terület, a generatív AI pedig csak egy alszakasz.

instagram viewer

Az egyik leglenyűgözőbb szempont az a generatív AI eszköz, mint a ChatGPT vagy a Google Bard AI ezeknek az eszközöknek az a képessége, hogy a kérésének megfelelő tartalmat hozzanak létre. Megkéred a ChatGPT-t, hogy írjon egy verset William Shakespeare stílusában, és kapsz valami feltűnően hasonlót Shakespeare munkájához. Megkéri, hogy állítson be egy beszédet Donald Trump stílusában, és kap valamit, ami lenyűgözően utánozza a volt amerikai elnök hangnemét. Szóval, hogyan lehetséges ez? Hogyan képes a generatív mesterséges intelligencia egy ilyen lenyűgöző bravúrra?

Hogyan működik a generatív AI

A generatív AI-modell működési mechanizmusa különféle mélytanulási technikák és algoritmusok összetett kölcsönhatását foglalja magában. A generatív modell működésének pontos részletei a céljaitól és a mögöttes architektúrától függenek. Például a hangrészletek generálására szolgáló generatív modell működési mechanizmusa eltér a videók vagy szövegek generálására szolgáló modelltől.

Lényegében azonban a legtöbb, ha nem az összes generatív modell hasonlóan működik az alapszinten. Tanulnak nagy mennyiségű adatból, rögzítik az adatok mintáit és stílusait, majd ezekkel a rögzített mintákkal olyan mintákat reprodukálnak, amelyek hasonlóak ahhoz, amit a képzési adataikban tanultak.

A generatív AI-eszközökre zeneszerzőként is gondolhatunk. Képzeld el, ez a zeneszerző számtalan dalt meghallgatott, és számos zenei műfaj harmóniáját, dallamát, ritmusát és szerkezetét tanulmányozta. Más szóval, ez a zeneszerző széleskörű ismeretekkel rendelkezik a zenei műfajokról. Ezzel a tudással a zeneszerző eredeti vagy egyedi zenét tud alkotni a tanultak ihlette.

Tehát ha sokat tanultak a popzenéről, megkérheti őket, hogy komponáljanak egy popdalt, és ezzel nem lesz gondjuk. A megkomponált zene így kifejezné a zeneszerző megértését arról, hogy milyennek kell lennie a popzenének a tanultak alapján. Hasonlóképpen, a generatív mesterséges intelligencia terméke annak a kifejezése, hogy az AI-modell megérti a képzési adatokból tanult alapfogalmakat.

Tehát ha egy generatív mesterséges intelligencia-modellt szeretne létrehozni, amely autók képeit állítja elő, akkor a modellnek hatalmas autóképek adatkészletét kell táplálnia. Lenyűgöző modell létrehozásához annyi autómárkáról és modellről kell képet készítenie, amennyi csak eszébe jut. Kellő képzettséggel az algoritmus megtanulja, hogyan néznek ki az egyes autómárkák vagy -modellek, és igény szerint szinte bármilyen autóról tudunk képeket készíteni.

Népszerű generatív AI modellek

Jelenleg több száz generatív AI-modell van fejlesztés alatt, vagy már bevezetés alatt áll a fogyasztói mesterségesintelligencia-piacon. A népszerűek közül néhány, amelyeket tudnia kell:

1. Generatív előképzett transzformátor (GPT)

Az OpenAI által kifejlesztett GPT a generatív mesterséges intelligencia tér legismertebb nevei közé tartozik. Népszerűsége a párbeszédes AI-modell hatékonyságán és a ChatGPT chatbot vírusos sikerén múlik, amely a GPT-t használja alaptechnológiájaként. Ez egy nagy nyelvi modell, amelyet arra terveztek, hogy kérésre emberszerű szöveget generáljon. Minden generatív AI modellre jellemző, a GPT modell összes iterációja hatalmas mennyiségű változatos szöveges adatra képezték ki őket.

2. Pathways Language Model (PaLM)

A PaLM, a Google kísérleti nagy nyelvi modellje egy erőteljes generatív mesterséges intelligencia modell, amely nagy tartományt képes végrehajtani. olyan feladatokat, mint a kreatív írás, kódgenerálás, nyelvi fordítás és számos más szövegalapú természetes nyelv feladatokat. A GPT-hez hasonlóan a PaLM-et is nagy mennyiségű szöveges adattömbre képezték ki, amelyek a weben található források széles skálájából származnak. Ez az AI-modell, amely a Google Bard AI-ját vezérli.

3. Zenenyelvi modell (MusicLM)

A MusicLM egy másik generatív mesterséges intelligencia modell a Google-tól. Úgy tervezték, hogy "high-fidelity" zenét generáljon egyszerű szöveges promptokból. A több ezer órányi zenére oktatott különféle műfajokban, a generatív modell egyedi zenét tud létrehozni a szükséges zene egyszerű leírásainak bemenetként történő felhasználásával. Ha kíváncsi arra, hogy milyen jó, itt van áttekintésünk a MusicLM modellről.

4. DALL-E

A DALL-E az OpenAI AI képgeneráló modellje úgy tervezték, hogy szöveges promptokból többféle stílusú egyedi képet hozzon létre. Ez a GPT-modell multimodális megvalósítása, amely számos szöveg-képpáron van kiképezve, különféle forrásokból az interneten.

A generatív mesterséges intelligencia modelleken túl olyan generatív AI-termékeket is találhat, mint a Midjourney, a DALL-E képgenerátor, Stabil diffúziós képgenerátor, Hugging Chat és számos más lenyűgöző mesterséges intelligencia termék, amelyet generatív mesterséges intelligencia hajt modellek.

Miért nőtt robbanásszerűen a Generatív AI népszerűsége?

2022. november 30-án az OpenAI vezérigazgatója, Sam Altman egy tweetben jelentette be a ChatGPT elindítását. Annak ellenére, hogy az OpenAI vezérigazgatója volt, Altman viszonylag ismeretlen volt a szélesebb internetes közösségben, és tweetje csekély, vagy semmi feltűnést keltett.

Öt nappal később a ChatGPT összeszedte első egymillió felhasználóját; ezt olyan ütemben tette, amilyet egyetlen alkalmazás sem hallott. Végül több millióan gyűltek össze a ChatGPT-t minden idők leggyorsabban növekvő alkalmazásává téve. Bár a ChatGPT nem az első generatív mesterségesintelligencia-termék, az AI-termékek színterére érkezése jobban behozta a köztudatba a generatív mesterséges intelligenciát, mint bármely más technológiai terméket előtte.

Míg a ChatGPT a lándzsa csúcsa volt a generatív mesterséges intelligencia körüli felhajtásban, nem egyedül sikerült. 2022-ra úgy fog emlékezni, mint amikor a generatív AI-eszközök általánossá váltak. A beszélgetős mesterséges intelligencia chatbotoktól a kód- és művészeti generátorokig 2022 második felében jelent meg először a piacra számos olyan mesterséges intelligencia-eszköz, amely tömegesen vonzó és gyakorlatias mindennapi felhasználásra is alkalmas. Ezekkel az eszközökkel a mögöttes technológia – a generatív mesterséges intelligencia – népszerűvé vált.

Az olyan generatív mesterséges intelligencia eszközök, mint a Bing AI, a Google Bard, a DALL-E, a ChatGPT és a Midjourney zökkenőmentesen beszőtték magukat mindennapi életünk szövetébe, és folyamatosan bemutatják számunkra figyelemre méltó tulajdonságaikat alkotásait. Legyen szó a ChatGPT által készített lebilincselő írásokról vagy a megdöbbentően élethű képekről A Midjourney által megidézett generatív mesterséges intelligencia mindig jelenlévő társsá vált, amely nap mint nap elkísér minket szabadnap. Ez a generatív mesterséges intelligencia közelmúltbeli népszerűségének eredete.

Fogadja el a Generatív AI-t

A generatív AI-eszközök népszerűsége nem divat. Ellentétben néhány közelmúltbeli technológiai trenddel, amelyek népszerűvé váltak és idővel elhaltak, a generatív mesterségesintelligencia olyan technológia, amely tényleges gyakorlati előnyökkel jár. Mivel ez az újjáéledő technológiai rés beszippantja digitális életünk szinte minden területét, jobb, ha megkeressük a technológia legjobb kihasználásának módjait, ahelyett, hogy értetlenül állnánk.