A mesterséges intelligencia művészeti generátorai rosszul reagálnak a kezek pontatlan ábrázolására. Vessük össze a Midjourney v5-öt a Dall-E 2-vel, hogy meglássuk, melyik teljesít jobban.

Az AI művészeti generátorok továbbra is lenyűgöznek, és szinte bármit létrehozhatunk, amit csak el tudunk képzelni. Úgy tűnik azonban, hogy a technológia téglafalba ütközött, amikor reális megjelenésű kezek létrehozásáról van szó.

Itt megnézzük a két vezető generatív művészeti alkalmazást, és fej-fej mellett – vagy kézről-kézre – összevetjük őket, hogy meglássuk, melyik tud jobb kezet generálni, a Midjourney v5 vagy a Dall-E 2. Ezek közül az alkalmazások közül bármelyik is elsajátította a kezet? Találjuk ki!

Az AI problémája a kezekkel

Amióta a mesterséges intelligencia által generált művészet széles körben elterjedt az interneten, számos kritika érte a az AI által rajzolt kezek minősége. A legutóbbi frissítések ellenére, amint azt az egymás melletti összehasonlítások is mutatják, az eredmények nem voltak kielégítőek.

instagram viewer

Mindkét versenyző minden iterációval javította képességeit és kimenetei minőségét. A legújabb frissítés, A Midjourney 5. verziója, lenyűgöző fejlődést mutatott. A mesterséges intelligencia által rajzolt kezekkel kapcsolatos probléma azonban továbbra is megoldatlan, és nem hagyható figyelmen kívül.

1. összehasonlítás: A "Kéz" és a "Kéz" utasítások használata

Összehasonlításaink pontosan ugyanazokat az utasításokat tartalmazzák mind a Dall-E 2, mind a Midjourney v5 esetében. Az utasításokat úgy alakítjuk ki, hogy kézspecifikusak legyenek, ahelyett, hogy egyszerűen létrehoznánk az embereket, hogy lássák, hogyan néznek ki a kezek. Minden alkalmazásnak csak egy esélyt adunk (dobás) minden felszólításhoz.

Kéz

Kezdjük a dolgokat a legalapvetőbb és legrelevánsabb felszólítással: „kézzel”.

Midjourney v5:

Dall-E 2:

Nem indultunk jól!

A Midjourney azt a szokatlan utat választotta, hogy egy kezet meglehetősen kreatív helyzetekhez társított. Ahelyett, hogy csak egy kézre összpontosítanánk, egy varázslót, kesztyűt, egy csontvázat és egy apró figurát látunk. A kesztyű képről is hiányzik egy ujj.

A Dall-E 2 az ellenkező megközelítést alkalmazza, és csak egyetlen leosztást kínál nekünk sima háttér előtt. De furcsa módon vannak furcsa testhelyzetek, különösen a hüvelykujjnál, amelyek nem tűnnek természetesnek vagy kényelmesnek. Mindegyik kéz le van vágva a képek egyik oldalán.

Ki nyeri ezt a kört? Az általános pontosság érdekében a Dall-E 2-nek adjuk.

Kezek

Most tegyük a prompt többes számot „hands”-nak, és nézzük meg, mit találnak ki az AI-k.

Midjourney v5:

Dall-E 2:

Midjourney "kézzel" próbálkozása ezúttal jobban sikerül. De mind a négy kép fekete-fehér, és van néhány hiányzó ujjunk. Közelebbről megvizsgálva azt is láthatja, hogy egyes számjegyek furcsa alakúak vagy egymásba formálódnak.

A Dall-E 2 továbbra is sima hátterű kezekkel rendelkezik. Nincsenek hiányzó számjegyek, de a harmadik képen a kezek ki vannak vágva, a többi verzió pedig kompozícióban ügyetlennek tűnik, és teljesen hiányzik a kreativitásból.

Nevezzük ezt az összehasonlítást döntetlennek. A Dall-E 2 nyerne a pontosság miatt, ha ez lenne az egyetlen tényező, de a Midjourney-nek sikerül néhányat létrehoznia. gyönyörű képek fekete-fehér megjelenítésében, még akkor is, ha mind a négy változat nem túl jó reális.

Mindig lehet használja a Photoshopot a Midjouney művészet javításához, beleértve a kezeket is.

2. összehasonlítás: Kézmozdulatok

Hasonlítsunk össze néhány olyan kézmozdulatot, amelyeket szinte mindenki ismer.

Drukkolás

Először próbáljuk meg az „ujjakat összekulcsolva”.

Midjourney v5:

Dall-E 2:

Nyugodtan kijelenthetjük, hogy a Midjourney teljesen elrontotta ezt a felszólítást. Hiányoznak az ujjaink, és egyik változat sem néz ki természetesnek.

Még egyszer le a kalappal a Dall-E 2 előtt, amiért pontosította az ujjszámot, de ez az egyetlen jó hír. Mindegyik verzió úgy néz ki, mintha az ujjak a saját jógapózukat ütnék meg a Twister játékban.

Ebben az összehasonlításban nincs nyertes.

Remek

Következő "hüvelykujjjal" megyünk.

Midjourney v5:

Dall-E 2:

A Midjourney helyesen számolja az ujjak számát, miközben kreatív módon kezel minden felszólítást. Észrevette a szemléltető stílus bevezetését?

A Dall-E 2 pontokat is kap a pontosságért, miközben nem próbálja megingatni a hajót minden egyes eredményhez hozzáadott kreatív dologgal.

Itt nincs egyértelmű győztes.

3. összehasonlítás: Kezek tárgyakkal

Most fokozzuk a bonyolultságot azzal, hogy megkérjük a kezeket az objektumokkal való interakcióra.

Kezében kristálygömb

Kezdjük egy véletlenszerű tárggyal, a "kristálygömb kézben tartásával" felszólítással.

Midjourney v5:

Dall-E 2:

Ahogy haladunk a komplexitáson, a Midjourney kezd ragyogni. Néhány természetellenes megjelenéstől eltekintve a kezek és a kristálygömbök gyönyörűek. A Midjourney még arra is időt vesz igénybe, hogy tükröződéseket hozzon létre az üvegben, amelyek minden bizonnyal növelik az általános kreativitást.

De most először látjuk, hogy a Dall-E 2-nek legalább az egyik kezéből hiányzik egy számjegy, a negyedik pedig egyszerűen furcsán néz ki. A kristálygömbök szintén nem néznek ki olyan lenyűgözőek, mint a Midjourney-é.

A Midjourney megszerzi első győzelmét.

Kezében Víz

Próbáljunk ki valami még összetettebbet a "kézben tartva vizet" felszólítással.

Midjourney v5:

Dall-E 2:

A Midjourney csak egy képet tud feldobni a megfelelő számjegyekkel. Bár gyönyörűen van megjelenítve, ismét látni kezdjük a repedéseket a hihetőségi osztályon.

A Dall-E 2 a természetes kezek elérésével is küzd, de sokkal jobb munkát végez. A háttér színét is feljebb kapcsolja némi változatosság kedvéért.

Ezt a kört a Dall-E 2-nek adjuk.

4. összehasonlítás: Working Hands

Ehhez az összehasonlításhoz olyan promptokat hozunk létre, amelyek részt vesznek a tevékenységekben.

Kézi öntés agyag

Lássuk, hogyan boldogulnak a mesterséges intelligencia-modellek a „kézformázó agyaggal”.

Midjourney v5:

Dall-E 2:

A Midjourney két képen kihagyott egy ujjat, de minden más remekül néz ki.

A Dall-E 2 képei zavarosnak és zsúfoltnak tűnnek, és a változatok felében egy másik személy kezeit is alkalmazzák.

A széle a Midjourney-ra megy.

Kezek préselés tészta

Próbáljunk ki egy hasonló tevékenységet, a "tésztanyomó kézzel".

Midjourney v5:

Dall-E 2:

A Midjourney képei összességében remekül néznek ki. De ismét a feléből hiányoznak a számjegyek. De a képek nem hibáztathatók művészi stílusuk miatt.

A Dall-E 2 verzióiból a megjelenítések felében hiányoznak az ujjak, sőt a készlet utolsó leosztásához is hozzáadnak egyet.

Nevezzük ezt döntetlennek.

Ha szeretné saját maga is kipróbálni ezeket az összehasonlításokat, megmutatjuk hogyan használja a Midjourney-t mesterséges intelligencia művészet létrehozásához.

Mit árulnak el az eredmények?

Jó móka összehasonlításokat végezni, és megállapítani az összesített győztest. És ha választanunk kellene, a Midjourney v5 javára neveznénk. Bár a Dall-E 2 gyakrabban hozott létre kezet a megfelelő számú ujjal, a Midjourney volt az, amely művészibb és vonzóbb képeket készített.

De mindkét alkalmazásnak megvan a helye a piacon azon művészek számára, akik munkájukhoz újrahasznosítják a Dall-E 2 és a Midjourney képeket. Mindkettő képes olyan kezek létrehozására, amelyek kivágásként vagy kompozitokként használhatók művészi, szerkesztői és kereskedelmi használatra. Ez csak személyes preferencia kérdése.

Az AI végül meghódítja a kezet

Az olyan generatív művészeti alkalmazások, mint a Dall-E 2 és a Midjourney, hosszú utat tettek meg a valósághű és fantasztikus művészet létrehozásának képességében. Még mindig küzdenek a generáló kezekkel, de tekintettel a generatív technológia felgyorsulására, csak a közeljövőben számíthatunk javulásra.