Van néhány lényeges különbség a régebbi GPT-3.5 modell és a fényes új GPT-4 modell között.
A GPT-4 képességeivel kapcsolatos találgatások és állítások után 2023. március 14-én elindult a GPT nyelvi modellek családjának várva várt negyedik iterációja.
A GPT-4 nem kapott néhány olyan sokat emlegetett funkciót, amelyekről a pletykák szerint rendelkezik. A legújabb modell azonban jelentősen javítja a GPT-3.5-öt és elődeit. De miben különbözik a GPT-4 a GPT-3.5-től? Megmutatjuk a GPT-4 és a GPT-3.5 közötti főbb különbségeket.
1. GPT-4 vs. GPT-3.5: Kreativitás
A GPT-4 modell egyik legszembetűnőbb előnye a GPT-3.5-tel szemben, hogy kreatívabb választ ad a felszólításokra. Ne érts félre; A GPT-3.5 nagyon kreatív. Hosszú a lista kreatív dolgokat tehet a modellt használó ChatGPT-vel. Kreativitás terén azonban már sok nagy nyelvi modellt felülmúl.
A GPT-4 azonban még tovább emeli a lécet. Bár a GPT-4 kreatív előnye nem biztos, hogy nyilvánvaló az alapvető problémák megoldása során, a különbség az A két modell közötti kreativitás nyilvánvalóvá válik, ahogy a feladat nehezebbé válik, és magasabb szintre van szükség kreativitás.
Például, ha mindkét modellt megkéri, hogy végezzen el egy kreatív feladatot, például írjon egy verset angol és francia nyelven a vers minden sorában, A ChatGPT a legújabb GPT-4 modellel működik jobb eredményeket fog hozni. Míg a GPT-4 válasza mindkét nyelvet használná minden sorban, a GPT-3.5 váltakozna mindkét nyelv között, és minden sor az egyik nyelvet használja, a következő pedig a másikat.
2. GPT-4 vs. GPT-3.5: Kép vagy vizuális bemenetek
Míg a GPT-3.5 csak szöveges üzeneteket tud fogadni, a GPT-4 multimodális, és képes szöveges és vizuális bevitelt is elfogadni. Az egyértelműség kedvéért, amikor vizuális bemeneteket mondunk, a képnek nem kell egy gépelt prompt képének lennie, hanem bárminek a képe. Tehát egy kézzel írott matematikai feladat képétől a Reddit mémekig a GPT-4 szinte bármilyen képet képes megérteni és leírni.
A GPT-3-tól eltérően a GPT-4 nyelvi és vizuális modell is.
A GPT-4 bejelentésének élő közvetítése során egy OpenAI mérnök egy Discord szerver képernyőképével látta el a modellt. A GPT-4 minden részletet le tudott írni rajta, beleértve az akkori online felhasználók nevét is. Egy viccoldal kézzel rajzolt makettjének képét is betáplálták a modellbe, az utasításokkal együtt alakítsa át webhelyté, és meglepő módon a GPT-4 működő kódot biztosított egy webhelyhez, amely megfelelt a kép.
3. GPT-4 vs. GPT-3.5: Biztonságosabb válaszok
Bár a GPT-4 nem tökéletes, a biztonságosabb válaszok biztosítására alkalmazott intézkedések üdvözlendő frissítés a GPT-3.5 modellhez képest. A GPT-3.5-tel az OpenAI mértéktartóbb megközelítést alkalmazott a biztonság terén. Más szóval, néhány biztonsági intézkedés inkább csak utólagos volt. Az OpenAI figyelemmel kísérte a felhasználók tevékenységét és az általuk feltett kérdéseket, azonosította a hibákat, és útközben megpróbálta kijavítani azokat.
A GPT-4 esetében a legtöbb biztonsági intézkedés már modellszinten be van építve a rendszerbe. Ahhoz, hogy megértsük a különbséget, ez olyan, mintha robusztus anyagokból építenénk egy házat kezdettől fogva, és bármit használnánk, ami csak megy, majd megpróbálnánk befoltozni a dolgokat, amint a hibák felmerülnek. Alapján Az OpenAI GPT-4 technikai jelentése [PDF], a GPT-4 csak az esetek 0,73%-ában produkál toxikus választ, szemben a GPT-3.5 toxikus válaszainak 6,48%-ával.
4. GPT-4 vs. GPT-3.5: A válasz tényszerűsége
A GPT-3.5 egyik hibája, hogy magabiztosan állít elő értelmetlen és valótlan információkat. A mesterséges intelligencia nyelvhasználatában ezt "AI hallucinációnak" nevezik, és bizalmatlanságot válthat ki az AI által generált információkkal szemben.
A GPT-4-ben a hallucináció továbbra is probléma. A GPT-4 műszaki jelentés szerint azonban az új modellnél 19-29%-kal kisebb a hallucináció valószínűsége a GPT-3.5 modellhez képest. De ez nem csak a technikai jelentésről szól. A GPT-4 modell válaszai a ChatGPT-n észrevehetően tényszerűbbek.
5. GPT-4 vs. GPT-3.5: Kontextus ablak
Egy kevésbé emlegetett különbség a GPT-4 és a GPT-3.5 között a kontextusablak és a kontextus mérete. A kontextusablak azt mutatja meg, hogy egy modell mennyi adatot tud megőrizni a "memóriájában" egy csevegés során, és mennyi ideig. A GPT-4 lényegesen jobb kontextusmérettel és ablakkal rendelkezik, mint elődje.
Gyakorlatilag ez azt jelenti, hogy a GPT-4 jobban emlékszik a beszélgetés kontextusára, valamint a beszélgetés során adott utasításokra.
A GPT-3.5 problémája az, hogy a modell hajlamos eltérni a témától, vagy nem követi az utasításokat a beszélgetés során. Például megmondhatja a modellnek, hogy a neveden szólítsa meg Önt, és egy ideig ezt teszi, de azután nem követi az utasításokat. Bár ez a probléma továbbra is fennáll a GPT-4 modellnél, a jobb kontextusablak miatt kevésbé.
Egy másik probléma a promptban egyszerre használható szöveg mennyiségének korlátozása. A hosszú szöveg GPT-3 használatával történő összegzése általában azt jelenti, hogy a szöveget több részre bontják, és apránként összegzik azokat. A GPT-4 modellben a kontextus hosszának javulása azt jelenti, hogy egy menetben beillesztheti a teljes PDF-eket, és a modell összefoglalását végezheti anélkül, hogy darabokra bontja.
GPT-4: Egy lépés a GPT-3.5-höz képest
Kétségtelen, hogy a GPT-4 jelentős előrelépést jelent elődmodelljeihez képest. Bár még mindig sújtja a GPT-3.5 bizonyos korlátai, jelentős fejlesztések történtek számos területen és a Az új képességek hozzáadásával a modell izgalmas új lépést jelent az igazán intelligens mesterséges intelligencia nyelvre való törekvésben modellek.