A PaLM 2 hatalmas frissítéseket hoz a Google LLM-be, de ez azt jelenti, hogy most már az OpenAI GPT-4-ével is tökéletesen működik?

A Google 2023. május 10-én, a 2023-as Google I/O rendezvényen bemutatta Pathways Language Model (PaLM 2) következő generációját. Új nagy nyelvi modellje (LLM) sokat fejlődött elődjéhez (PaLM) képest, és talán végre készen áll arra, hogy megküzdjön legnagyobb riválisával, az OpenAI GPT-4-ével.

De mennyit fejlődött a Google? A PaLM 2 az a különbség, amelyet a Google remél, és ami még fontosabb, ennyi hasonló képességgel miben különbözik a PaLM 2 az OpenAI GPT-4-étől?

PaLM 2 vs. GPT-4: Teljesítmény áttekintése

A PaLM 2 tele van új és továbbfejlesztett képességekkel elődjéhez képest. A PaLM 2 egyik egyedülálló előnye a GPT-4-hez képest az a tény, hogy kisebb méretben is elérhető bizonyos alkalmazásokhoz, amelyek nem rendelkeznek annyi beépített feldolgozási teljesítménnyel.

Ezeknek a különböző méreteknek megvannak a saját kisebb modelljei: Gecko, Otter, Bison és Unicorn, ahol a Gecko a legkisebb, ezt követi az Otter, a Bison és végül az Unicorn, a legnagyobb modell.

instagram viewer

A Google azt is állítja, hogy javult az érvelési képesség a GPT-4-hez képest a WinoGrande és a DROP esetében, míg az előbbi az ARC-C esetében szűkebb különbséget hoz. A PaLM és a SOTA terén azonban jelentős előrelépés tapasztalható.

A Google 91-es oldala szerint a PaLM 2 matematikából is jobb PaLM 2 kutatási cikk [PDF]. A Google és az OpenAI teszteredményeinek felépítése azonban megnehezíti a két modell közvetlen összehasonlítását. A Google néhány összehasonlítást is kihagyott, valószínűleg azért, mert a PaLM 2 közel sem teljesített olyan jól, mint a GPT-4.

Az MMLU-ban a GPT-4 86,4, míg a PaLM 2 81,2 pontot ért el. Ugyanez vonatkozik a HellaSwag-ra is, ahol a GPT-4 gólt szerzett 95,3, de a PaLM 2 csak 86,8-at tudott összeszedni, és az ARC-E, ahol a GPT-4 és a PaLM 2 96,3 és 89,7, illetőleg.

A PaLM 2 család legnagyobb modellje a PaLM 2-L. Bár nem ismerjük a pontos méretét, azt tudjuk, hogy lényegesen kisebb, mint a legnagyobb PaLM modell, de több képzési számítástechnikát használ. A Google szerint, a PaLM 540 milliárd paraméterrel rendelkezik, tehát a "jelentősen kisebb" a PaLM 2-t 10-300 milliárd paraméter közé helyezi. Ne feledje, hogy ezek a számok csak feltételezések a Google PaLM 2 dokumentumában elmondottak alapján.

Ha ez a szám közel van a 100 milliárdhoz vagy az alatti, akkor a PaLM 2 valószínűleg kisebb a paramétereket tekintve, mint GPT-3.5. Figyelembe véve, hogy egy potenciálisan 100 milliárd alatti modell lábujjhegyre képes a GPT-4-gyel, és bizonyos feladatoknál még meg is győzheti. hatásos. A GPT-3.5 kezdetben mindent kifújt a vízből, beleértve a PaLM-et is, de a PaLM 2 teljesen helyreállt.

A GPT-4 és a PaLM 2 képzési adatai közötti különbségek

Bár a Google nem hozta nyilvánosságra a PaLM 2 képzési adatkészletének méretét, a vállalat kutatási tanulmányában beszámol arról, hogy az új LLM képzési adatkészlete lényegesen nagyobb. Az OpenAI ugyanezt a megközelítést alkalmazta a GPT-4 bemutatásakor, és nem állította a tanítási adatkészlet méretét.

A Google azonban a matematika, a logika, az érvelés és a természettudományok mélyebb megértésére akart összpontosítani, ami azt jelenti, hogy a PaLM 2 képzési adatainak nagy része a fent említett témákra összpontosít. A Google közleményében azt állítja, hogy a PaLM 2 előképzési korpusza több forrásból áll, beleértve a webes dokumentumokat, könyvek, kódok, matematika és társalgási adatok, így minden területen javulást jelent, legalábbis ehhez képest Tenyér.

A PaLM 2 társalgási készségeinek szintén egy másik szinten kell lenniük, tekintve, hogy a modellt képzett több mint 100 nyelven, hogy jobb kontextuális megértést és jobb fordítást biztosítson képességeit.

Ami a GPT-4 betanítási adatait megerősítette, az OpenAI elmondta, hogy nyilvánosan elérhető adatok és az általa licencelt adatok felhasználásával betanította a modellt. A GPT-4 kutatási oldala kijelenti: "Az adatok egy webes adathalmaz, beleértve a matematikai problémák helyes és helytelen megoldásait, gyenge és erős érvelést, önellentmondásos és következetes kijelentéseket, valamint sokféle ideológiát és ötletek."

Amikor a GPT-4-et feltesznek egy kérdést, az sokféle választ adhat, amelyek közül nem mindegyik releváns a lekérdezés szempontjából. A felhasználó szándékaival való összhang érdekében az OpenAI finomhangolta a modell viselkedését az emberi visszajelzésekkel történő megerősítő tanulás segítségével.

Bár lehet, hogy nem ismerjük a pontos edzési adatokat egyik modellen sem, de tudjuk, hogy a képzési szándék nagyon eltérő volt. Várnunk kell, és meglátjuk, hogy ez a képzési szándékbeli különbség hogyan tesz különbséget a két modell között egy valós környezetben.

PaLM 2 és GPT-4 chatbotok és szolgáltatások

Az első portál, amely mindkét LLM-hez hozzáfér, a megfelelő chatbotokat, a PaLM 2 Bardját és a GPT-4 ChatGPT-jét használja. Ennek ellenére a GPT-4 a ChatGPT Plus fizetőfala mögött van, és az ingyenes felhasználók csak a GPT-3.5-höz férhetnek hozzá. A Bard viszont mindenki számára ingyenes, és 180 országban elérhető.

Ez nem jelenti azt, hogy a GPT-4-et sem érheti el ingyen. A Microsoft Bing AI Chat GPT-4-et használ, és teljesen ingyenes, mindenki számára nyitott, és közvetlenül a Bing Search, a Google legnagyobb riválisa mellett érhető el.

A Google I/O 2023 tele volt bejelentésekkel arról, hogy a PaLM 2 és a generatív AI integráció hogyan javítja majd a Google Workspace-t megtapasztalhatja a Google Dokumentumok, Táblázatok, Diák, Gmail és szinte minden olyan szolgáltatást, amelyet a keresőóriás kínál. Ezenkívül a Google megerősítette, hogy a PaLM 2-t már több mint 25 Google-termékbe integrálták, beleértve az Androidot és a YouTube-ot is.

Ehhez képest a Microsoft már hozott mesterséges intelligencia funkciókat a Microsoft Office programcsomagjába és számos szolgáltatásába. Jelenleg mindkét LLM-et megtapasztalhatja a saját változatában, két rivális vállalat hasonló ajánlataiban, amelyek fej-fej mellett haladnak az AI-csatában.

Mivel azonban a GPT-4 korán megjelent, és ügyelt arra, hogy elkerülje a Google által az eredeti Barddal elkövetett hibákat, de facto LLM harmadik féltől származó fejlesztőknek, startupoknak és szinte bárki másnak, aki egy alkalmas AI-modellt szeretne beépíteni a szolgáltatásába. messze. Nekünk van a GPT-4 alkalmazások listáját, ha meg szeretné tekinteni őket.

Ez nem jelenti azt, hogy a fejlesztők nem fognak átállni a PaLM 2-re, vagy legalábbis nem próbálják ki, de a Google-nak továbbra is utol kell érnie az OpenAI-t ezen a téren. És az a tény, hogy a PaLM 2 nyílt forráskódú, ahelyett, hogy egy fizetős API mögé lenne zárva, azt jelenti, hogy szélesebb körben elterjedhet, mint a GPT-4.

A PaLM 2 képes felvenni a GPT-4-et?

A PaLM 2 még mindig nagyon új, így a válasz arra, hogy képes-e felvenni a GPT-4-et, továbbra is megválaszolandó. Mindazonáltal, figyelembe véve mindazt, amit a Google ígér, és azt az agresszív módszert, amellyel terjeszteni akarja, úgy tűnik, hogy a PaLM 2 meg tudja adni a GPT-4-et a pénzéért.

A GPT-4 azonban még mindig eléggé képes modell, és mint korábban említettük, jó néhány összehasonlításban veri a PaLM 2-t. Ennek ellenére a PaLM 2 több kisebb modellje megcáfolhatatlan előnyt ad neki. Maga a Gecko annyira könnyű, hogy mobileszközökön is működik, még offline állapotban is. Ez azt jelenti, hogy a PaLM 2 a termékek és eszközök egy teljesen más osztályát támogatja, amelyek nehezen tudják használni a GPT-4-et.

Az AI-verseny felforrósodik

A PaLM2 megjelenésével felforrósodott a verseny az AI-dominanciáért, mivel ez lehet az első méltó ellenfél a GPT-4 ellen. A „Gemini” névre keresztelt újabb multimodális mesterséges intelligencia modell is edzés alatt áll, így a Google itt nem mutatja a lassulás jeleit.