A mesterséges intelligencia sok területen jártas, de az alapvető józan ész és más veleszületett emberi érzékek nagyobb kihívást jelentenek.

Kulcs elvitelek

  • A józan ész az a képesség, hogy túlelemzés nélkül megértsük és reagáljunk a mindennapi helyzetekre. Az élettapasztalatok és megfigyelések, valamint a társadalmi és kulturális normák révén sajátítják el.
  • A számítógépek küzdenek a józan ésszel, mert hiányoznak belőlük a valós tapasztalatok és az új kontextusokhoz való alkalmazkodás képessége. Küzdenek a kimondatlan szabályokkal és feltételezésekkel is, amelyeket az emberek intuitív módon megértenek.
  • A kutatók különböző megközelítéseket vizsgálnak, például kiterjedt tudásbázisok kiépítését, a józan ész crowdsourcingja és a mesterséges intelligencia oktatása szimulált világokon keresztül, hogy megtanítsák a számítógépeket a tudásszerzésre józan ész. Előrelépés történt, de van még tennivaló.

Józan ész. Mindannyian azt hisszük, hogy megvan. De mi is ez pontosan? A számítógépek vagy mesterséges intelligens rendszerek valóban megszerezhetik valaha?

Mi a józan ész, és hogyan sajátítják el az emberek?

A józan ész a dolgok észlelésének, megértésének és megítélésének alapvető képessége, amely a legtöbb embertől elvárható. Tények, információk és hüvelykujjszabályok gyűjteménye, amelyeket élettapasztalataink és megfigyeléseink során gyűjtünk össze. A józan ész lehetővé teszi számunkra, hogy hatékonyan dolgozzuk fel és reagáljunk a mindennapi helyzetekre anélkül, hogy túlságosan mélyrehatóan elemeznénk azokat.

Az emberek korán gyermekkorukban kezdik elsajátítani a józan észt. Kisbabákként elkezdjük megtanulni az ok-okozati összefüggéseket – például a sírás tápláláshoz vagy változáshoz vezet. Az ismételt tapasztalatok révén gyakorlati ismeretekre teszünk szert a világról. Például egy forró tűzhely megérintése égési sérülést okozhat. Így megtanuljuk, hogy ne érintsük meg a forró felületeket.

Gyermekként továbbra is tágítjuk józan észünket a próbálkozások és a tévedések, valamint a családtagok megfigyelése és a velük való interakció révén. Tisztában vagyunk például azzal, hogy a ruhákat rendszeresen ki kell mosni, nem szabad teli szájjal beszélni, a tejespohár felverése pedig rendetlenséghez vezet. A szülők, testvérek, tanárok és más felnőttek kijavítanak minket, ha megsértjük a társadalmi normákat és elvárásokat. Idővel ezek a leckék beépültek az alapvető józan észbe.

A józan észt a személyes tapasztalatok mellett szélesebb társadalmi és kulturális normák is formálják. Ami az egyik kultúrában józan észnek számít (mint például a cipő levétele, amikor belép az otthonba), egy másik kultúrában nem biztos, hogy az.

Józan észünk alkalmazkodik, ahogy érünk, és egyre több embernek és környezetnek vagyunk kitéve. Tehát egy kisvárosban felnövő gyermek alapvető józan észt nyer az adott környezetben való életről. Egy nagyvárosba költöző felnőttnek hozzá kell igazítania józan eszét az új környezethez.

A józan ész folyamatosan fejlődik, ahogy életünk során új tapasztalatokkal gazdagodunk.

Miért jelent kihívást a józan ész a számítógépek számára?

Van néhány oka annak, hogy a józan észt nehéz programozni.

Egyrészt az emberek fokozatosan tanulják meg a józan észt az évek során, amikor megtapasztalják a világot. Kipróbálunk dolgokat, megnézzük, mi működik és mi nem, és emlékezünk a leckékre. A számítógépek nem rendelkeznek efféle valós tapasztalatokkal, amelyekből meríthetnének. Csak azt tudják, amit az emberek kifejezetten mondanak nekik.

Feltettem például a ChatGPT-nek (GPT 3.5) ezt a kérdést:

Janet runs a laundry business. She washes clothes for customers and hangs them outside on clotheslines to dry in the sun. One day, Janet washed five shirts and hung them on the clotheslines in the morning. It took the shirts five hours to dry. How long will it take to dry 30 shirts? 

Ebből a válaszból kiderült:

Más kérdés, hogy a józan ész a kontextustól függ. Ha egy számítógépben csak meghatározott szabályok vannak programozva, akkor nem tudja azokat az emberek intuitív módon az új kontextusokhoz igazítani.

Tegyük fel például, hogy megtanított egy számítógépet, mit tegyen, ha kint esik az eső. Egyértelműnek tűnik, igaz? De mi van akkor, ha eső helyett öntözőgép kapcsol be? Vagy mi van, ha egy élelmiszerboltban van, és a csövek elkezdenek szivárogni a víz a mennyezetről? Azonnal tudnánk, hogyan kezeljük ezeket a változatokat, de a számítógép vakon követné a „ha kint esik az eső, menj be” szabályt, aminek most nincs értelme.

Vannak kimondatlan szabályok és feltételezések is, amelyeket az emberek úgy fogadnak el, hogy észre sem veszik. Például milyen közel állhatsz valaki mellé, mielőtt kínosnak éreznéd? Az emberek intuitív módon tudják a választ, de nem biztos, hogy könnyen tudják megmagyarázni a pontos szabályokat. Ezeket az implicit társadalmi normákat különösen nehézkes lehet a számítógépek számára, hogy pusztán adatokból vegyék fel őket.

Tehát egyelőre a józan ész továbbra is az AI egyik legnagyobb gyengesége az emberi intelligenciához képest. Ez természetes az embereknél, de nem annyira a gépeknél.

Hogyan tanulhatják meg a számítógépek a józan észt

Az 1970-es és 1980-as évek korai optimizmusa után a kutatók rájöttek, milyen nehéz lenne a józan ész tanítása a számítógépekre. Az új megközelítések azonban ígéretesnek mutatkoznak az AI-rendszerek olyan képzésében, amelyek alapvető józan észt gyakorolnak a mindennapi fizikai és társadalmi világra vonatkozóan.

Az egyik megközelítés a kiterjedt tudásbázisok kézzel történő felépítése, részletezve a világ működésére vonatkozó tényeket és szabályokat. A Cyc projekt, amelyet 1984-ben indított Doug Lenat, egy ilyen ambiciózus erőfeszítést képvisel.

Logikusok százai több millió logikai axiómát kódoltak a Cyc-be évtizedek alatt. Bár időigényes, az eredmény egy jelentős valós tudással rendelkező rendszer. Cyc nyilvánvalóan meg tudja indokolni, hogy a paradicsom technikailag gyümölcs, de nem illik gyümölcssalátába, köszönhetően a kulináris ízprofilok ismeretének.

Crowdsourcing Common Sense a ConceptNet segítségével

Modernebb tudásbázisok, mint pl ConceptNet használja a crowdsourcing megközelítést a józan ész állításainak generálásához. Az ötlet az, hogy ahelyett, hogy a szakértők vagy a mesterséges intelligencia megpróbálna kitalálni a világ összes alapvető tényét és kapcsolatát, felnyitják azt, hogy bárki hozzá tudjon járulni a józan ész részletéhez.

Ez a crowdsourcing megközelítés lehetővé teszi ezeknek a tudásbázisoknak, hogy az interneten keresztül sokféle ember kollektív intelligenciájához nyúljanak. A ConceptNet azáltal, hogy ezreket és ezreket gyűjtött össze a tömegből ezekből a kis józan ész rögökből, meglepően nagy tárházat épített fel az alapvető, mindennapi tudásból. És mivel mindig új közreműködők egészítik ki, a tudás folyamatosan bővül.

A józan ész tanítása tapasztalaton keresztül

Egy másik ígéretes megközelítés a részletes szimulált világok felépítése, ahol az AI-ügynökök kísérletezhetnek, és tapasztalatokon keresztül tanulhatnak a fizikáról és az intuíciókról.

A kutatók olyan 3D virtuális környezeteket hoznak létre, amelyek tele vannak mindennapi tárgyakkal, amelyek utánozzák a valós világot, mint például az Allen Institute által épített digitális otthon, az "AI2 THOR". Ezeken a tereken belül az AI-robotok mindenféle interakciót kipróbálhatnak, hogy intuitív módon megértsék az emberek által természetesnek tartott fogalmakat.

Például egy AI bot kaphat egy virtuális testet, és megpróbálhat blokkokat felszedni, egymásra rakni, ledönteni stb. A bot valósághűen zuhanó és ütköző blokkokat látva megtanulja az alapvető fogalmakat a szilárdságról, a gravitációról és a fizikai dinamikáról. Nincs szükség szabályokra – csak tapasztalat.

A bot olyan műveleteket is kipróbálhat, mint például egy üvegtárgy leejtése, és láthatja, hogy az összetörik, amikor földet ér. Vagy kísérletezhet a víz tulajdonságaival úgy, hogy folyadékokat önt, és megfigyeli, hogyan folynak és gyűlnek össze. Ezek a gyakorlati leckék a mesterséges intelligencia tudását érzékszervi tapasztalatokra alapozzák, nem csak adatmintákra.

Adatvezérelt technikák, mint például az előképzés erőteljes nagy nyelvi modellek meglepően hatékonynak bizonyultak a józan ész mintáinak felvételében is. AI modellek, mint GPT-3.5 és GPT-4 lenyűgözően emberszerű szöveget tud generálni hatalmas mennyiségű internetes adat "olvasása" után.

Bár néha bölcs javaslatokat tesznek (más néven AI hallucináció), a statisztikai tanulási megközelítés lehetővé teszi számukra, hogy utánozzák a józan ész bizonyos fajtáit. Továbbra is nézeteltérés van azonban abban, hogy ez józan ész, vagy az adatok torzításainak ügyes kihasználása.

Hogyan teszteljük a számítógépeket a józan ész szempontjából

Kép forrása: freepik/freepik

Ahogy a mesterséges intelligencia rendszerek összetettebb valós feladatokat látnak el, kulcsfontosságúvá válik annak értékelése, hogy megvan-e a józan ész.

Fizikai józan ész

Az egyik tesztelendő terület a fizikai józan ész – a tárgyakkal, erőkkel és a világ alapvető tulajdonságaival kapcsolatos intuíció.

Például mutasd meg a számítógépes látórendszer egy fényképet egy könyvvel a levegőben, és kérje meg, hogy írja le a jelenetet. Van valami szokatlan a lebegő könyvben? Vagy adjon szokatlan forgatókönyveket az AI-rendszernek, például „az ember követ vágott egy vekni kenyérrel”, és ellenőrizze, hogy nem valószínűtlennek tartja-e ezeket.

Az Allen Institute AI2 THOR környezete blokktornyokat, kiömlött bögréket és egyéb jeleneteket szimulál, hogy tesztelje ezeket a fizikai intuíciókat.

Szociális józan ész

Az embereknek van szociális józan esze is – az emberek motivációinak, kapcsolatainak és normáinak implicit megértése. Ennek az MI-ben történő értékeléséhez állítson fel helyzeteket kétértelmű névmással vagy motivációval, és nézze meg, hogy a rendszer ésszerűen értelmezi-e őket.

Például megkérdeztem a ChatGPT-t, hogy az "ez" a bőröndre vagy a trófeára vonatkozik-e az alábbi promptban:

The trophy could not fit into the suitcase because it was too small. 

Megbukott a teszten; eközben az ember nyilván tudja, hogy a bőröndre gondolok.

Ezt a fajta tesztet Winograd Schema Challenge-nek hívják, amely kifejezetten a társadalmi józan észt célozza meg.

Biztonság és etika

Nagyon fontos annak tesztelése, hogy a mesterséges intelligencia rendszerek megtanultak-e nem biztonságos vagy etikátlan mintákat. Elemezze, hogy a mesterséges intelligencia nemi, faji vagy egyéb jellemzők alapján káros torzításokat mutat-e, amikor ítéletet hoz.

Ellenőrizze, hogy tesz-e ésszerű etikai különbségeket. Egy medve megölése egy gyermek megmentése érdekében indokoltnak tekinthető, míg egy atombomba felrobbantása ugyanilyen célból nem. Jelölje meg az egyértelműen etikátlan cselekedetekre vonatkozó ajánlásokat.

Valós teljesítmény

Értékelje a józan észt azáltal, hogy megfigyeli, hogyan működnek az AI-rendszerek valós körülmények között. Például csináld Az önvezető autók helyesen azonosítják a tárgyakat és a gyalogosokat, és reagálnak rájuk? Képes-e egy robot áthaladni változatos otthoni környezetben anélkül, hogy összetörne értékes tárgyakat vagy károsítaná a háziállatokat?

A valós tesztek olyan hiányosságokat tárnak fel a józan észben, amelyek korlátozott laboratóriumi körülmények között nem feltétlenül jelennek meg.

Előrelépés történt, de a munka a Common Sense AI-n maradt

Egyes szakértők azt állítják, hogy a mesterséges intelligencia soha nem éri el az emberi józan észt anélkül, hogy a miénkhez hasonló agyi struktúrákat és testeket ne fejlesztenének. A másik oldalon, a digitális elmét nem korlátozzák az emberi elfogultságok és a mentális rövidítések, így elméletileg felülmúlhatnak minket! Bár valószínűleg még nem kell aggódnunk a szuperintelligens mesterséges intelligencia miatt.

A közeljövőben a legjobb megoldás az AI, amely egyesíti a tanult józan észt néhány jó, régimódi programozással. Így remélhetőleg elkerülhetők az olyan ostoba hibák, mint a teknős puskával való összetévesztése.

Még nem tartunk ott, de a józan ész már nem a mesterséges intelligencia sötét anyaga – haladás történik! Mégis, egy ideig egészséges adag emberi józan észre lesz szükség e technológiák alkalmazásához.