Több mint 70 évvel ezelőtt, amikor a mesterséges intelligencia fogalmát megfogalmazták, Alan Turing publikált egy tanulmányt, amelyben leírta, hogyan azonosítható. Később Turing-tesztként ismerték, és évtizedek óta használják az ember és a mesterséges intelligencia megkülönböztetésére.

A fejlett mesterséges intelligencia chatbotok, például a ChatGPT és a Google Bard bevezetésével azonban egyre nehezebb megállapítani, hogy mesterséges intelligenciával beszélünk-e. Felveti a kérdést; a Turing-teszt elavult? És ha igen, mik az alternatívák?

A Turing-teszt elavult?

A kép forrása: Jesus Sanz/Shutterstock

Annak megállapításához, hogy a Turing-teszt elavult-e, először meg kell határoznia megérteni, hogyan működik. Ahhoz, hogy egy mesterséges intelligencia átmenjen a Turing-teszten, meg kell győznie az emberi kihallgatót arról, hogy ő ember. De van egy bökkenő: az AI-t egy emberrel együtt értékelik, és szöveggel kell válaszolnia.

Gondolj erre így; ha Ön a kihallgató, és kérdéseket tesz fel két résztvevőnek online szöveggel, de az egyikük egy mesterséges intelligencia modell – öt perc múlva megkülönböztetné őket egymástól? Ne feledje, hogy a Turing-teszt célja nem az AI-modell azonosítása a helyes válaszok alapján, hanem annak értékelése, hogy az AI képes-e emberként gondolkodni vagy viselkedni.

instagram viewer

A probléma a Turing-teszt megközelítésével, amely csak az emberhez hasonló válaszokat azonosítja, az, hogy nem vesz figyelembe más tényezőket. Például az AI-modell intelligenciája vagy a kérdező tudása. Emellett a Turing-teszt csak szövegre korlátozódik, és egyre nehezebb azonosítani egy olyan AI-t, amely emberi hangot vagy hangot generál. mélyhamisított videók, amelyek emberi viselkedést imitálnak.

A jelenlegi mesterséges intelligencia modellek, például a ChatGPT-4 és a Google Bard azonban még nem fejlődtek olyan szintre, hogy folyamatosan átmenjenek a Turing-teszten. Valójában, ha ismeri az AI-t, megteheti spot AI által generált szöveg.

Az 5 legjobb Turing-teszt alternatíva

Lehetséges, hogy jövőbeli mesterséges intelligencia modellek, mint például a ChatGPT-5 át tudta menni a Turing-teszten. Ha ez megtörténik, különböző tesztekre lesz szükségünk a Turing-teszttel kombinálva, hogy meghatározzuk, mesterséges intelligenciával vagy emberrel beszélünk. Íme a legjobb Turing-teszt alternatívák:

1. A Marcus teszt

Gary Marcus, a neves kognitív tudós és mesterséges intelligenciakutató alternatívát javasolt a Turing-teszt helyett, amelyet a New Yorker egy MI kognitív képességének azonosítására. A teszt egyszerű – egy AI-modellt az alapján ítél meg, hogy képes-e YouTube-videókat és tévéműsorokat nézni és megérteni felirat vagy szöveg nélkül. Ahhoz, hogy a mesterséges intelligencia átmenjen a Marcus-teszten, meg kell értenie a szarkazmust, a humort, az iróniát és a történetszálat a videók megtekintésekor, és emberként kell elmagyaráznia.

Pillanatnyilag, A GPT-4 képes leírni a képeket, de egyelőre nincs olyan mesterséges intelligencia-modell, amely képes lenne emberként értelmezni a videókat. Önvezető járművek közel jönnek, de nem teljesen önállóak, és érzékelőket igényelnek, mivel nem tudnak mindent megérteni a környező környezetben.

2. A vizuális Turing-teszt

-án megjelent kutatási cikk szerint PNAS, a vizuális Turing-teszt segítségével azonosítani lehet, hogy emberrel vagy mesterséges intelligenciával beszélünk-e képkérdések segítségével. Úgy működik, mint a Turing-teszt, de ahelyett, hogy szövegekkel válaszolnának a kérdésekre, a résztvevőknek képeket jelenítenek meg, és egyszerű kérdésekre kell válaszolniuk, miközben emberként gondolkodnak. Azonban a A vizuális Turing-teszt eltér a CAPTCHA-tól mivel minden válasz helyes – de ahhoz, hogy átmenjen a teszten, az MI-nek emberhez hasonlóan kell feldolgoznia a képeket.

Ezen túlmenően, ha egy mesterséges intelligenciának és egy embernek több képet mutatnak egymás mellett, és megkérik őket, hogy azonosítsák a valósághű képeket, akkor az ember képes lesz átmenni a teszten. Ennek az az oka, hogy az AI-modellek nehezen tudják megkülönböztetni azokat a képeket, amelyek nem úgy néznek ki, mintha a való világban készültek volna. Valójában ez az oka annak, hogy megteheti azonosítani az AI által generált képeket értelmetlen anomáliákat használva.

3. A Lovelace 2.0 teszt

Azt az elméletet, miszerint a számítógép nem tud eredeti ötleteket létrehozni azon túl, amire programozták, először Ada Lovelace fogalmazta meg a Turing-teszt előtt. Alan Turing azonban kifogásolta ezt az elméletet, azzal érvelve, hogy a mesterséges intelligencia még mindig képes meglepni az embereket. Csak 2001-ben dolgozták ki a Lovelace-teszt irányelveit, hogy megkülönböztessék a mesterséges intelligenciát az embertől – és a thekurzweillibrary a szabályokat később, 2014-ben felülvizsgálták.

Ahhoz, hogy egy mesterséges intelligencia átmenjen a Lovelace-teszten, be kell mutatnia, hogy képes olyan eredeti ötleteket generálni, amelyek felülmúlják a képzést. A jelenlegi mesterséges intelligencia modellek, mint például a GPT-4, nem képesek a meglévő tudásunkon túlmutató új találmányok kidolgozására. Azonban, mesterséges általános intelligencia elérheti ezt a képességet, és átmegy a Lovelace-teszten.

4. Fordított Turing-teszt

Mit szólnál a Turing-teszthez, de fordítva? Ahelyett, hogy megpróbálná kideríteni, hogy emberrel beszél-e, a cél a fordított Turing-teszt az, hogy becsapja az MI-t, hogy elhiggye, hogy Ön mesterséges intelligencia. Ugyanakkor szüksége van egy másik mesterséges intelligencia modellre is, hogy ugyanazokat a kérdéseket szöveggel válaszolja meg.

Például, ha a ChatGPT-4 a lekérdező, felveheti résztvevőként a Google Bardot és egy másik embert. Ha az AI-modell a válaszok alapján helyesen tudja azonosítani az emberi résztvevőt, akkor megfelelt a teszten.

A fordított Turing-teszt hátránya, hogy megbízhatatlan, különösen, ha ezt néha figyelembe vesszük Az AI nem tudja megkülönböztetni az AI által generált és ember által írt tartalom.

5. AI osztályozási keretrendszer

által kidolgozott AI osztályozási keretrendszer szerint Chris Saad, a Turing-teszt csak egy értékelési módszer, amellyel megtudhatja, ha mesterséges intelligenciával beszél. Még tömörebben, a mesterséges intelligencia besorolási keretrendszere a többszörös intelligencia elméletén alapul, amely megköveteli, hogy az emberi intelligencia legalább nyolc különböző kritériumnak megfeleljen. ide tartozik: zenei ritmus, logikai-matematikai intelligencia, vizuális azonosítás, érzelmi intelligencia, önreflexiós intelligencia, egzisztenciális gondolkodási képesség és test mozgalom.

Mivel az AI-t nyolc különböző paraméter alapján értékelik, nem valószínű, hogy az ember számára megfelelne, még akkor sem, ha bizonyos benchmarkokban az átlagosnál jobban teljesít. Például, A ChatGPT képes megoldani a matematikai feladatokat, képeket ír le, és természetes nyelven beszélget, mint egy ember, de ez megbukna az AI osztályozási keretrendszerben meghatározott más kategóriákban.

A Turing-teszt nem döntő

A Turing-tesztet inkább gondolatkísérletnek szánták, semmint meggyőző tesztnek az ember és a mesterséges intelligencia közötti különbségtételre. Amikor eredetileg javasolták, ez volt a gépi intelligencia mérésének sarkalatos mércéje.

A beszéd-, vizuális és hallási interaktív képességekkel rendelkező mesterséges intelligencia modellek közelmúltbeli fejlesztésével azonban a Turing-teszt elmarad, mivel a szöveges beszélgetésre korlátozódik. A leghatékonyabb megoldás az lenne, ha olyan Turing-teszt-alternatívákat vezetnénk be, amelyek még jobban megkülönböztetik az AI-modelleket az emberektől.