Mik azok a nagy nyelvi modellek (LLM) és hogyan működnek?

A nagy nyelvi modellek (LLM-ek) a mögöttes technológia, amely a generatív mesterséges intelligencia chatbotok rohamos növekedését hajtotta végre. Az olyan eszközök, mint a ChatGPT, a Google Bard és a Bing Chat, mind az LLM-ekre támaszkodnak, hogy emberszerű válaszokat generáljanak az Ön felszólítására és kérdéseire.

De mik is azok az LLM-ek, és hogyan működnek? Itt arra vállalkoztunk, hogy megfejtsük az LLM-eket.

Mi az a nagynyelvi modell?

A legegyszerűbb megfogalmazásban az LLM egy hatalmas, szöveges adatok adatbázisa, amelyre hivatkozva emberszerű válaszokat generálhatunk a felszólításokra. A szöveg számos forrásból származik, és több milliárd szóból állhat.

A használt szöveges adatok gyakori forrásai között szerepel:

Irodalom: Az LLM-ek gyakran hatalmas mennyiségű kortárs és klasszikus irodalmat tartalmaznak. Ez magában foglalhat könyveket, költészeteket és színdarabokat.
Online tartalom: Az LLM leggyakrabban online tartalmak nagy tárházát tartalmazza, beleértve a blogokat, webes tartalmakat, fórumkérdéseket és válaszokat, valamint egyéb online szövegeket.

instagram viewer

Hírek és aktuális események: Néhány, de nem minden LLM hozzáférhet az aktuális hírekhez. Bizonyos LLM-ek, például a GPT-3.5, ebben az értelemben korlátozottak.
Közösségi média: A közösségi média a természetes nyelv hatalmas erőforrását képviseli. Az LLM-ek olyan fontos platformokról használnak szöveget, mint a Facebook, Twitter és Instagram.

Természetesen egy hatalmas szövegadatbázis birtoklása egy dolog, de az LLM-eket ki kell képezni, hogy megértsék az emberszerű válaszokat. Hogy ez hogyan működik, arról a következőkben foglalkozunk.

Hogyan működnek az LLM-ek?

Hogyan használják az LLM-ek ezeket a tárolókat válaszaik létrehozásához? Az első lépés az adatok elemzése egy mély tanulásnak nevezett folyamat segítségével.

A mély tanulást az emberi nyelv mintáinak és árnyalatainak azonosítására használják. Ez magában foglalja a nyelvtan és a szintaxis megértését. De ami fontos, a kontextust is tartalmazza. A kontextus megértése az LLM-ek döntő része.

Nézzünk egy példát arra, hogyan használhatják az LLM-ek a kontextust.

A következő képen látható felszólítás egy denevér éjszakai látásáról szól. Ebből a ChatGPT megértette, hogy egy állatról beszélünk, és nem például egy baseballütőről. Természetesen más chatbotoknak tetszik Bing Chat vagy Google Bard erre teljesen másképp válaszolhat.

Ez azonban nem tévedhetetlen, és amint ez a példa is mutatja, néha további információkat kell megadnia a kívánt válasz eléréséhez.

Ebben az esetben szándékosan dobtunk egy kis görbe labdát, hogy bemutassuk, milyen könnyen vész el a kontextus. De az emberek félreérthetik a kérdések kontextusát is, és csak egy extra felszólításra van szükség a válasz kijavításához.

E válaszok generálásához az LLM-ek a természetes nyelv generálásának (NLG) nevezett technikát használják. Ez magában foglalja a bemenet megvizsgálását és az adattárból tanult minták felhasználását a kontextus szempontjából helyes és releváns válasz generálásához.

De az LLM-ek ennél mélyebbre mennek. A válaszokat a bemenet érzelmi tónusának megfelelően személyre szabhatják. A kontextuális megértéssel kombinálva ez a két szempont a fő hajtóerő, amely lehetővé teszi az LLM-ek számára, hogy emberszerű válaszokat hozzanak létre.

Összefoglalva, az LLM-ek egy hatalmas szöveges adatbázist használnak a mély tanulás és az NLG technikák kombinációjával, hogy emberszerű válaszokat hozzanak létre a felszólításokra. De vannak korlátai annak, amit ezzel el lehet érni.

Mik az LLM-ek korlátai?

Az LLM-ek lenyűgöző technológiai vívmányt képviselnek. De a technológia még korántsem tökéletes, és még mindig rengeteg korlát van, hogy mit tudnak elérni. Ezek közül néhányat az alábbiakban sorolunk fel:

Kontextuális megértés: Említettük ezt, mint amit az LLM-ek beépítenek a válaszaikba. Azonban nem mindig értik jól, és gyakran képtelenek megérteni a szövegkörnyezetet, ami nem megfelelő vagy egyszerűen rossz válaszokhoz vezet.
Elfogultság: A betanítási adatokban jelenlévő torzítások gyakran jelen lehetnek a válaszokban. Ez magában foglalja a nemi, faji, földrajzi és kulturális elfogultságokat.
Józan ész: A józan észt nehéz számszerűsíteni, de az emberek ezt már kiskoruktól megtanulják, pusztán az őket körülvevő világ megfigyelésével. Az LLM-ek nem rendelkeznek ezzel a veleszületett tapasztalattal, amelyre vissza kellene esni. Csak azt értik meg, amit a képzési adataikon keresztül biztosítottak számukra, és ez nem ad valódi felfogást a világról, amelyben léteznek.
Egy LLM csak annyira jó, amennyire a képzési adatai vannak: A pontosság soha nem garantálható. A régi számítógépes közmondás, a "Garbage In, Garbage Out" tökéletesen összefoglalja ezt a korlátozást. Az LLM-ek csak annyira jók, amennyire képzési adataik minősége és mennyisége lehetővé teszi számukra.

Van olyan érv is, hogy az etikai megfontolások az LLM-ek korlátozásának tekinthetők, de ez a téma kívül esik e cikk hatókörén.

3 Példák a népszerű LLM-ekre

A mesterséges intelligencia folyamatos fejlődését ma már nagyrészt az LLM-ek támasztják alá. Tehát bár nem teljesen új technológiáról van szó, minden bizonnyal elérték a kritikus lendületet, és mára számos modell létezik.

Íme néhány a legszélesebb körben használt LLM-ek közül.

1. GPT

A Generative Pre-train Transformer (GPT) talán a legszélesebb körben ismert LLM. A GPT-3.5 támogatja a cikkben szereplő példákban használt ChatGPT platformot, míg a legújabb verzió, a GPT-4 elérhető ChatGPT Plus előfizetésen keresztül. A Microsoft is a legújabb verziót használja a Bing Chat platformon.

2. LaMDA

Ez a Google Bard, a Google mesterséges intelligencia chatbotja által használt kezdeti LLM. A Bard eredeti verzióját az LLM "könnyű" verziójaként írták le. Az LLM erősebb PaLM-iterációja ezt felváltotta.

3. BERT

A BERT a Transformers Bi-directional Encoder Representation rövidítése. A modell kétirányú jellemzői megkülönböztetik BERT más LLM-ektől, például a GPT-től.

Rengeteg több LLM-t fejlesztettek ki, és a főbb LLM-ek mellékágai gyakoriak. Fejlődésük során ezek összetettsége, pontossága és relevanciája tovább növekszik. De mit hoz a jövő az LLM-ek számára?

Az LLM-ek jövője

Ezek kétségtelenül alakítják majd a technológiával való interakciónkat a jövőben. Az olyan modellek gyors elterjedése, mint a ChatGPT és a Bing Chat, bizonyítja ezt a tényt. Rövid távon Nem valószínű, hogy a mesterséges intelligencia helyettesíti Önt a munkahelyén. De még mindig bizonytalan, hogy ezek mekkora szerepet fognak játszani az életünkben a jövőben.

Az etikai érvek még beleszólhatnak abba, hogyan integráljuk ezeket az eszközöket a társadalomba. Azonban félretéve ezt, néhány várható LLM-fejlesztés:

Fokozott hatékonyság:A több százmillió paramétert felvonultató LLM-ekkel hihetetlenül erőforrás-éhesek. A hardver és az algoritmusok fejlesztésével valószínűleg energiahatékonyabbak lesznek. Ez a reakcióidőt is felgyorsítja.
Továbbfejlesztett kontextuális tudatosság:Az LLM-ek önképzők; minél több használatot és visszajelzést kapnak, annál jobbak lesznek. Fontos, hogy ez minden további komolyabb tervezés nélkül történik. A technológia fejlődésével a nyelvi képességek és a kontextuális tudatosság javulni fog.
Speciális feladatokra képzett:Az LLM-ek nyilvános arcát képező, mindenre kiterjedő eszközök hajlamosak a hibákra. De ahogy fejlesztik és a felhasználók speciális igényekre képezik őket, az LLM-ek nagy szerepet játszhatnak olyan területeken, mint az orvostudomány, a jog, a pénzügy és az oktatás.
Nagyobb integráció: Az LLM-ek személyi digitális asszisztensekké válhatnak. Gondolj a Sirire szteroidokon, és megérted az ötletet. Az LLM-ek virtuális asszisztensekké válhatnak, akik az étkezési javaslatoktól a levelezések kezeléséig mindenben segítenek.

Ez csak néhány olyan terület, ahol az LLM-ek valószínűleg életünk nagyobb részévé válnak.

LLM-ek átalakítása és oktatása

Az LLM-ek a lehetőségek izgalmas világát nyitják meg. A chatbotok, például a ChatGPT, a Bing Chat és a Google Bard gyors térnyerése a bizonyítéka annak, hogy az erőforrásokat a területre fordították.

Az erőforrások ilyen sokasága csak azt eredményezheti, hogy ezek az eszközök erősebbek, sokoldalúbbak és pontosabbak lesznek. Az ilyen eszközök alkalmazási lehetőségei hatalmasak, és jelenleg egy hihetetlen új erőforrás felszínét kapargatjuk.

About Technology - denizatm.com

Mik azok a nagy nyelvi modellek (LLM) és hogyan működnek?

Mi az a nagynyelvi modell?

Hogyan működnek az LLM-ek?

Mik az LLM-ek korlátai?

3 Példák a népszerű LLM-ekre

1. GPT

2. LaMDA

3. BERT

Az LLM-ek jövője

LLM-ek átalakítása és oktatása

Kategóriák

Recent Post

Hozzáférés több mint 1000 tanfolyamhoz 15 életcikken + bónusz ajánlatokkal

A legjobb Amazon Prime Day 2019-akciók

A ma elérhető legjobb ajánlatok az Amazon-on [CA]