A ChatGPT 2022 novemberi elindítását követően a fenomenális mesterséges intelligencia chatbot az egyik legmegbízhatóbb íróeszközzé vált az interneten. Használata egyszerű; írja le, mit kell írnia, és a ChatGPT másodpercek alatt kinyomtatja a képernyőn.
Azonban egy olyan korszakban, amikor a mesterséges intelligencia által generált szöveget ember által írtnak adják át, és tisztességtelen előnyszerzés céljából használják fel, nagyon fontos az AI-tartalom azonosítása. De a ChatGPT nem tudja pontosan felismerni az AI-tartalmat, még saját munkáját sem – de miért?
Van különbség az AI szöveg és az emberi írás között?
Annak előfeltétele, hogy a ChatGPT észrevegye saját írását vagy bármilyen mesterséges intelligencia által generált szöveget, hogy különbséget kell tenni az és az ember által írt szöveg között. Tehát van-e jelentős különbség az ember által írt szöveg és az AI által generált tartalom között? Ha létezik olyan eszköz, mint a ChatGPT, akkor biztosan képesnek kell lennie arra, hogy felismerje.
Írtunk egy novellát anélkül, hogy bármilyen mesterséges intelligenciát használtunk volna, majd megkérdeztük a ChatGPT-t, hogy a történet mesterséges intelligencia által írt tartalom-e. A ChatGPT magabiztosan AI által generált szövegként jelölte meg.
Ezután megkértük a ChatGPT-t, hogy hozzon létre egy történetet, és ugyanabban a csevegési szálban másoltuk be a generált szöveget, és megkérdeztük a ChatGPT-től, hogy a szöveget mesterséges intelligencia hozta-e létre. A ChatGPT válasza? Egy magabiztos „nem”.
A ChatGPT mindkét esetben nem tudta azonosítani az ember által írt vagy mesterséges intelligencia által generált szöveget. Tehát miért nem tudja a ChatGPT felismerni a saját szövegét? Ez azt jelenti, hogy nincs különbség a mesterséges intelligencia és az emberi szöveg között?
Hát van. Írhatnánk egy egész könyvet a kettő közötti különbségről, de ez nem sokat számít. Tehát, ha van különbség, miért nem képes a ChatGPT vagy bármely más mesterséges intelligencia eszköz azonosítani ezeket a különbségeket, és pontosan kiemelni az AI által generált szöveget az ember által írt szövegből? A válasz abban rejlik hogyan működik a ChatGPT és hogyan generál szöveget.
Hogyan generál szöveget a ChatGPT?
Amikor a ChatGPT-t szöveg létrehozására kéri, az megpróbálja utánozni az emberi írási folyamatot. Először is, a ChatGPT mögött meghúzódó modellt – a generatív előképzett transzformátort (GPT) – emberi szövegek nagy része alapján képezték ki. Az e-mailektől, egészségügyi cikkektől, műszaki cikkektől, középiskolai dolgozatoktól és szinte bármilyen, az interneten megtalálható szövegtől kezdve mindent betáplált a modell a képzés során. Tehát a ChatGPT megérti, hogyan kell az egyes ilyen típusú szövegeket megírni.
Ha megkéri a ChatGPT-t, hogy írjon egy e-mailt a főnökének, akkor tudja, hogyan kell kinéznie egy ilyen jellegű e-mailnek, mivel hasonló e-mailekre tanítják – valószínűleg több ezerre. Hasonlóképpen, ha felkéri, hogy írjon egy középiskolai dolgozatot, azt is tudja, hogyan kell hangzani egy középiskolai dolgozatnak. A ChatGPT megpróbálja megírni azt, amit csak szeretne, emberi módon.
De van egy fogás. Ellentétben azzal, ahogyan az emberek írnak, a ChatGPT nem igazán érti, amit ír, úgy, ahogy azt egy ember tenné. Ehelyett a chatbot megpróbálja megjósolni, hogy mi lenne a legvalószínűbb következő szó egy mondatban, amíg be nem fejezi az írást.
Hogyan ír a ChatGPT előrejelzés alapján
Tegyük fel, hogy megkéred a ChatGPT-t, hogy írjon egy történetet egy Volkra nevű kitalált városról. Óriási esély van arra, hogy a chatbot az "Egyszer volt" szavakkal kezdje a történetet. Ez azért van, mert a chatbot nem gondol rá önmagát, de megpróbálja megjósolni, mit írna az ember az alapján, amit tanult abból a több ezer történetből, amivel etették. kiképzés.
Tehát, ha azt hiszik, hogy egy ember valószínűleg az "egyszer volt" szavakkal kezdi a történetet, a ChatGPT megpróbálja megjósolni a következő logikai szót, ami legyen "a", majd az "idő". Tehát akkor az "Egyszer régen..." lenne, amelyet a következő logikai szó követne, és a következő, amíg a történet be nem fejeződik. A ChatGPT alapvetően úgy ír, hogy előre megjósolja, hogy természetesen (vagy legalábbis a legnagyobb valószínűséggel) melyik szó következik majd a mondatban, és beilleszti azt.
Tehát, amikor egy mesterséges intelligencia eszköz megpróbálja észlelni, hogy egy szöveg mesterséges intelligencia által generált-e, az egyik szempont, amelyet mérlegelni próbál, a szöveg kiszámíthatósága, mivel az AI-eszközök előrejelzéssel írnak. A kiszámíthatóságnak ezt a mértékét a mesterséges intelligencia szóhasználatában zavarodottságnak nevezik. Most, amikor szöveggel jelenítik meg, többek között egy mesterséges intelligencia eszköz, például a ChatGPT, megpróbálja elemezni a szöveget, hogy mérje, mennyire kiszámítható a szövegben lévő szavak vagy mondatok sorrendje. A nagyobb kiszámíthatóság vagy az alacsony zavartság általában azt jelenti, hogy a szöveg valószínűleg mesterséges intelligencia által generált. A kisebb kiszámíthatóság vagy nagyobb zavartság általában azt jelenti, hogy a szöveget valószínűleg emberek írták.
Ezek a kritériumok, valamint más tényezők, például a szöveg kreativitásának szintje, sajnos nem elegendőek ahhoz, hogy biztosan meg lehessen állapítani, hogy a szöveget mesterséges intelligencia-eszköz írta-e vagy sem. Ennek az az oka, hogy az emberek nagyobb szórással tudnak írni, mint a cikk elején bemutatásra használt példaszövegben.
Az AI chatbotokat, például a ChatGPT-t úgy tervezték, hogy a lehető legnagyobb mértékben utánozzák a természetes emberi nyelvet. Tehát bár az AI-szövegnek lehetnek észrevehető mintái, ezek a minták még egy olyan hatékony eszköz számára sem nyilvánvalóak, mint a ChatGPT. Ez az oka annak, hogy a ChatGPT nem tudja észrevenni saját írását, valamint miért nem működnek az AI-szövegdetektor eszközei.
A ChatGPT felismeri-e saját írásait a jövőben?
Jelenleg az olyan eszközök, mint a ChatGPT, nem tudják felismerni, hogy egy szöveget önmagában írták-e vagy bármilyen más mesterséges intelligencia-eszközzel, mivel nincs egyértelmű, észrevehető minta az AI által generált tartalomban. Azonban jó esély van rá, hogy ez hamarosan megváltozik. A ChatGPT-hez hasonló cégek arra irányuló erőfeszítései révén, hogy digitális vízjeleket vezessenek be a ChatGPT által generált tartalomba, a chatbot által generált szövegnek jobban észrevehető mintája lesz.