Megérkezett a GPT-4, és ezeket az új funkciókat érdemes kipróbálni.
Az OpenAI végre elindította várva várt GPT-frissítését, a GPT-4-et. A Large Language Model (LLM) néhány erőteljes új funkciót és képességet tartalmaz, amelyek már világszerte sokkolták a felhasználókat.
Amellett, hogy lényegesen jobb, mint a GPT-3.5, a meglévő LLM, amely az OpenAI vírusos chatbotját, a ChatGPT-t, a GPT-4 képes megérti az összetettebb bemeneteket, sokkal nagyobb karakterbeviteli korláttal rendelkezik, multimodális képességekkel rendelkezik, és állítólag biztonságosabb használat.
1. A GPT-4 bonyolultabb bemeneteket is képes megérteni
A GPT-4 egyik legnagyobb újdonsága, hogy képes megérteni az összetettebb és árnyaltabb promptokat. Alapján OpenAI, a GPT-4 "emberi szintű teljesítményt mutat különböző szakmai és tudományos benchmarkokon."
Ezt a GPT-4 több emberi szintű vizsgán és szabványosított teszten, például a SAT, a BAR és a GRE teszteken keresztül bizonyította, speciális képzés nélkül. A GTP-4 nemcsak megértette és viszonylag magas pontszámmal megoldotta ezeket a teszteket, de minden alkalommal felülmúlta elődjét, a GPT-3.5-öt is.
Az árnyaltabb beviteli promptok megértését az is segíti, hogy a GPT-4-ben jóval nagyobb a szókorlát. Az új modell akár 25 000 szavas beviteli promptokat is képes kezelni (kontextusban a GPT-3.5 8000 szóra korlátozódott). Ez közvetlenül befolyásolja azokat a részleteket, amelyeket a felhasználók belepréselhetnek a promptokba, így sokkal több információt ad a modellnek a munkához, és hosszabb kimeneteket eredményez.
A GPT-4 több mint 26 nyelvet is támogat, beleértve az olyan alacsony erőforrás-igényű nyelveket, mint a lett, a walesi és a szuahéli. Az MMLU benchmark háromlövéses pontosságával összehasonlítva a GPT-4 24 nyelven megverte a GPT-3.5-öt, valamint más vezető LLM-eket, például a PaLM-et és a Chinchillát az angol nyelvű teljesítmény tekintetében.
2. Multimodális képességek
Az előző verzió ChatGPT csak szöveges felszólításra korlátozódott. Ezzel szemben a GPT-4 egyik legújabb funkciója a multimodális képessége. A modell képes szöveges és képi felszólításokat is elfogadni.
Ez azt jelenti, hogy a mesterséges intelligencia képes elfogadni egy képet bemenetként, és úgy értelmezni és megérteni, mint egy szöveges promptot. Ez a képesség minden méretű és típusú képre és szövegre kiterjed, beleértve a kettőt kombináló dokumentumokat, kézzel rajzolt vázlatokat, sőt képernyőképeket is.
A GPT-4 képolvasási képességei azonban túlmutatnak az egyszerű értelmezésen. Az OpenAI bemutatta ezt a fejlesztői adatfolyamában (fent), ahol a GPT-4-et egy viccoldal kézzel rajzolt mintájával látták el. A modell azt a feladatot kapta, hogy írjon HTML- és JavaScript-kódot, hogy a makett webhelyté változtassa, miközben a vicceket valódira cserélje.
A GPT-4 a kódot a makettben megadott elrendezés használatával írta meg. A tesztelés során a kód működő webhelyet hozott létre, amint azt sejtheti, valódi viccekkel. Azt jelenti-e A mesterséges intelligencia fejlődése a programozás végét jelenti? Nem egészen, de ez még mindig egy olyan funkció, amely hasznos lesz a programozók segítésében.
Bármennyire is ígéretesnek tűnik ez a funkció, még mindig kutatási előnézetben van, és nem érhető el nyilvánosan. Ezenkívül a modellnek sok időbe telik a vizuális bemenetek feldolgozása, és maga az OpenAI is azt állítja, hogy munkába és időbe telhet a gyorsabbá válás.
3. Nagyobb kormányozhatóság
Az OpenAI azt is állítja, hogy a GPT-4 nagyfokú kormányozhatósággal rendelkezik. Ez azt is megnehezítette, hogy a mesterséges intelligencia megtörje a karaktert, ami azt jelenti, hogy kevésbé valószínű, hogy meghibásodik, ha egy alkalmazásban egy bizonyos karaktert eljátszanak.
A fejlesztők előírhatják mesterséges intelligencia stílusát és feladatát a „rendszer” üzenetben szereplő irány leírásával. Ezek az üzenetek lehetővé teszik az API-felhasználók számára, hogy bizonyos határokon belül nagymértékben testreszabják a felhasználói élményt. Mivel ezekkel az üzenetekkel a legegyszerűbb módja a modell "jailbreak"-nek, a biztonságuk javításán is dolgoznak. A GPT-4 demója ezen a ponton úgy sikerült, hogy a felhasználó megpróbálja megakadályozni, hogy a GPT-4 Socratic oktató legyen, és válaszoljon a kérdésére. A modell azonban nem volt hajlandó megtörni a karaktert.
4. Biztonság
Az OpenAI hat hónapot töltött a GPT-4 gyártásával biztonságosabb és összehangoltabb. A vállalat azt állítja, hogy 82%-kal kisebb valószínűséggel válaszol a nem megfelelő vagy más módon nem engedélyezett tartalomra vonatkozó kérésekre, és 29%-kal nagyobb valószínűséggel az OpenAI irányelveinek megfelelően válaszolnak az érzékeny kérésekre, és 40%-kal nagyobb valószínűséggel adnak tényszerű válaszokat, mint GPT-3.5.
Nem tökéletes, és még mindig számíthat rá, hogy időnként "hallucinál", és tévedhet az előrejelzéseiben. Természetesen a GPT-4 jobb érzékeléssel és előrejelzési képességgel rendelkezik, de mégsem szabad vakon megbízni az AI-ban.
5. Teljesítményfejlesztések
A modell humán vizsgálatokon nyújtott teljesítményének értékelésén kívül az OpenAI a gépi tanulási modellekhez tervezett hagyományos benchmarkok alapján is értékelte a robotot.
Azt állítja, hogy a GPT-4 "jelentősen felülmúlja" a meglévő LLM-eket és "a legkorszerűbb modelleket". Ezek a referenciaértékek magukban foglalják a a fent említett MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval és Drop, amelyek mindegyike az egyéni képességeket teszteli.
Hasonló eredményeket kaphat, ha összehasonlítja a teljesítményt az akadémiai látási benchmarkokon. A futtatott tesztek közé tartozik a VQAv2, TextVQA, ChartQA, AI2 diagram (AI2D), DocVQA, Infographic VQA, TVQA és LSMDC, amelyek mindegyike a GPT-4 csúcsa. Az OpenAI azonban kijelentette, hogy a GPT-4 ezekben a tesztekben elért eredményei "nem tükrözik teljes mértékben képességeinek mértékét", mivel a kutatók folyamatosan új és nagyobb kihívást jelentő dolgokat találnak, amelyeket a modell képes megbirkózni.
Small Step a GPT-4-hez, Giant Leap az AI-hoz
A pontosabb, biztonságosabb használat és a fejlettebb képességek révén a GPT-4 a ChatGPT+ havi előfizetési csomagon keresztül került nyilvánosságra, amely havi 20-ba kerül. Ezenkívül az OpenAI különböző szervezetekkel társult annak érdekében, hogy elkezdje a fogyasztóknak szánt termékek kiépítését a GPT-4 segítségével. Többek között a Microsoft Bing, a Duolingo, a Stripe, a Be My Eyes és a Khan Academy már bevezette termékeibe a GPT-4-et.
Lehet, hogy a GPT-4 fokozatos frissítés a GPT-3.5-höz képest, de összességében óriási győzelem az AI számára. Ahogy a modell egyre elérhetőbbé válik, mind az átlagfelhasználók, mind a fejlesztők számára az API-n keresztül, úgy tűnik, hogy jó példát fog tenni az LLM megvalósítására a különböző területeken.