A mesterséges intelligencia művészeti generátorai rosszul reagálnak a kezek pontatlan ábrázolására. Vessük össze a Midjourney v5-öt a Dall-E 2-vel, hogy meglássuk, melyik teljesít jobban.
Az AI művészeti generátorok továbbra is lenyűgöznek, és szinte bármit létrehozhatunk, amit csak el tudunk képzelni. Úgy tűnik azonban, hogy a technológia téglafalba ütközött, amikor reális megjelenésű kezek létrehozásáról van szó.
Itt megnézzük a két vezető generatív művészeti alkalmazást, és fej-fej mellett – vagy kézről-kézre – összevetjük őket, hogy meglássuk, melyik tud jobb kezet generálni, a Midjourney v5 vagy a Dall-E 2. Ezek közül az alkalmazások közül bármelyik is elsajátította a kezet? Találjuk ki!
Az AI problémája a kezekkel
Amióta a mesterséges intelligencia által generált művészet széles körben elterjedt az interneten, számos kritika érte a az AI által rajzolt kezek minősége. A legutóbbi frissítések ellenére, amint azt az egymás melletti összehasonlítások is mutatják, az eredmények nem voltak kielégítőek.
Mindkét versenyző minden iterációval javította képességeit és kimenetei minőségét. A legújabb frissítés, A Midjourney 5. verziója, lenyűgöző fejlődést mutatott. A mesterséges intelligencia által rajzolt kezekkel kapcsolatos probléma azonban továbbra is megoldatlan, és nem hagyható figyelmen kívül.
1. összehasonlítás: A "Kéz" és a "Kéz" utasítások használata
Összehasonlításaink pontosan ugyanazokat az utasításokat tartalmazzák mind a Dall-E 2, mind a Midjourney v5 esetében. Az utasításokat úgy alakítjuk ki, hogy kézspecifikusak legyenek, ahelyett, hogy egyszerűen létrehoznánk az embereket, hogy lássák, hogyan néznek ki a kezek. Minden alkalmazásnak csak egy esélyt adunk (dobás) minden felszólításhoz.
Kéz
Kezdjük a dolgokat a legalapvetőbb és legrelevánsabb felszólítással: „kézzel”.
Midjourney v5:
Dall-E 2:
Nem indultunk jól!
A Midjourney azt a szokatlan utat választotta, hogy egy kezet meglehetősen kreatív helyzetekhez társított. Ahelyett, hogy csak egy kézre összpontosítanánk, egy varázslót, kesztyűt, egy csontvázat és egy apró figurát látunk. A kesztyű képről is hiányzik egy ujj.
A Dall-E 2 az ellenkező megközelítést alkalmazza, és csak egyetlen leosztást kínál nekünk sima háttér előtt. De furcsa módon vannak furcsa testhelyzetek, különösen a hüvelykujjnál, amelyek nem tűnnek természetesnek vagy kényelmesnek. Mindegyik kéz le van vágva a képek egyik oldalán.
Ki nyeri ezt a kört? Az általános pontosság érdekében a Dall-E 2-nek adjuk.
Kezek
Most tegyük a prompt többes számot „hands”-nak, és nézzük meg, mit találnak ki az AI-k.
Midjourney v5:
Dall-E 2:
Midjourney "kézzel" próbálkozása ezúttal jobban sikerül. De mind a négy kép fekete-fehér, és van néhány hiányzó ujjunk. Közelebbről megvizsgálva azt is láthatja, hogy egyes számjegyek furcsa alakúak vagy egymásba formálódnak.
A Dall-E 2 továbbra is sima hátterű kezekkel rendelkezik. Nincsenek hiányzó számjegyek, de a harmadik képen a kezek ki vannak vágva, a többi verzió pedig kompozícióban ügyetlennek tűnik, és teljesen hiányzik a kreativitásból.
Nevezzük ezt az összehasonlítást döntetlennek. A Dall-E 2 nyerne a pontosság miatt, ha ez lenne az egyetlen tényező, de a Midjourney-nek sikerül néhányat létrehoznia. gyönyörű képek fekete-fehér megjelenítésében, még akkor is, ha mind a négy változat nem túl jó reális.
Mindig lehet használja a Photoshopot a Midjouney művészet javításához, beleértve a kezeket is.
2. összehasonlítás: Kézmozdulatok
Hasonlítsunk össze néhány olyan kézmozdulatot, amelyeket szinte mindenki ismer.
Drukkolás
Először próbáljuk meg az „ujjakat összekulcsolva”.
Midjourney v5:
Dall-E 2:
Nyugodtan kijelenthetjük, hogy a Midjourney teljesen elrontotta ezt a felszólítást. Hiányoznak az ujjaink, és egyik változat sem néz ki természetesnek.
Még egyszer le a kalappal a Dall-E 2 előtt, amiért pontosította az ujjszámot, de ez az egyetlen jó hír. Mindegyik verzió úgy néz ki, mintha az ujjak a saját jógapózukat ütnék meg a Twister játékban.
Ebben az összehasonlításban nincs nyertes.
Remek
Következő "hüvelykujjjal" megyünk.
Midjourney v5:
Dall-E 2:
A Midjourney helyesen számolja az ujjak számát, miközben kreatív módon kezel minden felszólítást. Észrevette a szemléltető stílus bevezetését?
A Dall-E 2 pontokat is kap a pontosságért, miközben nem próbálja megingatni a hajót minden egyes eredményhez hozzáadott kreatív dologgal.
Itt nincs egyértelmű győztes.
3. összehasonlítás: Kezek tárgyakkal
Most fokozzuk a bonyolultságot azzal, hogy megkérjük a kezeket az objektumokkal való interakcióra.
Kezében kristálygömb
Kezdjük egy véletlenszerű tárggyal, a "kristálygömb kézben tartásával" felszólítással.
Midjourney v5:
Dall-E 2:
Ahogy haladunk a komplexitáson, a Midjourney kezd ragyogni. Néhány természetellenes megjelenéstől eltekintve a kezek és a kristálygömbök gyönyörűek. A Midjourney még arra is időt vesz igénybe, hogy tükröződéseket hozzon létre az üvegben, amelyek minden bizonnyal növelik az általános kreativitást.
De most először látjuk, hogy a Dall-E 2-nek legalább az egyik kezéből hiányzik egy számjegy, a negyedik pedig egyszerűen furcsán néz ki. A kristálygömbök szintén nem néznek ki olyan lenyűgözőek, mint a Midjourney-é.
A Midjourney megszerzi első győzelmét.
Kezében Víz
Próbáljunk ki valami még összetettebbet a "kézben tartva vizet" felszólítással.
Midjourney v5:
Dall-E 2:
A Midjourney csak egy képet tud feldobni a megfelelő számjegyekkel. Bár gyönyörűen van megjelenítve, ismét látni kezdjük a repedéseket a hihetőségi osztályon.
A Dall-E 2 a természetes kezek elérésével is küzd, de sokkal jobb munkát végez. A háttér színét is feljebb kapcsolja némi változatosság kedvéért.
Ezt a kört a Dall-E 2-nek adjuk.
4. összehasonlítás: Working Hands
Ehhez az összehasonlításhoz olyan promptokat hozunk létre, amelyek részt vesznek a tevékenységekben.
Kézi öntés agyag
Lássuk, hogyan boldogulnak a mesterséges intelligencia-modellek a „kézformázó agyaggal”.
Midjourney v5:
Dall-E 2:
A Midjourney két képen kihagyott egy ujjat, de minden más remekül néz ki.
A Dall-E 2 képei zavarosnak és zsúfoltnak tűnnek, és a változatok felében egy másik személy kezeit is alkalmazzák.
A széle a Midjourney-ra megy.
Kezek préselés tészta
Próbáljunk ki egy hasonló tevékenységet, a "tésztanyomó kézzel".
Midjourney v5:
Dall-E 2:
A Midjourney képei összességében remekül néznek ki. De ismét a feléből hiányoznak a számjegyek. De a képek nem hibáztathatók művészi stílusuk miatt.
A Dall-E 2 verzióiból a megjelenítések felében hiányoznak az ujjak, sőt a készlet utolsó leosztásához is hozzáadnak egyet.
Nevezzük ezt döntetlennek.
Ha szeretné saját maga is kipróbálni ezeket az összehasonlításokat, megmutatjuk hogyan használja a Midjourney-t mesterséges intelligencia művészet létrehozásához.
Mit árulnak el az eredmények?
Jó móka összehasonlításokat végezni, és megállapítani az összesített győztest. És ha választanunk kellene, a Midjourney v5 javára neveznénk. Bár a Dall-E 2 gyakrabban hozott létre kezet a megfelelő számú ujjal, a Midjourney volt az, amely művészibb és vonzóbb képeket készített.
De mindkét alkalmazásnak megvan a helye a piacon azon művészek számára, akik munkájukhoz újrahasznosítják a Dall-E 2 és a Midjourney képeket. Mindkettő képes olyan kezek létrehozására, amelyek kivágásként vagy kompozitokként használhatók művészi, szerkesztői és kereskedelmi használatra. Ez csak személyes preferencia kérdése.
Az AI végül meghódítja a kezet
Az olyan generatív művészeti alkalmazások, mint a Dall-E 2 és a Midjourney, hosszú utat tettek meg a valósághű és fantasztikus művészet létrehozásának képességében. Még mindig küzdenek a generáló kezekkel, de tekintettel a generatív technológia felgyorsulására, csak a közeljövőben számíthatunk javulásra.