Az Önhöz hasonló olvasók támogatják a MUO-t. Amikor a webhelyünkön található linkek használatával vásárol, társult jutalékot kaphatunk. Olvass tovább.

Sokan hallottuk már a DALL-E nevet, de lehet, hogy nem biztos abban, hogy mi az. Röviden, ez egy generatív mesterséges intelligencia modell, amely korábban soha nem létező képeket tud létrehozni, mindössze annyit kell tennie, hogy elmondja neki, mit szeretne létrehozni.

Amikor a következő verzió, a DALL-E 2 megjelent, igazán híressé vált. Az általa előállított képek olyan jó minőségűek és olyan jól generáltak voltak, hogy alig lehetett tudni, hogy egy gép elkészítette.

Íme, mit kell tudni a DALL-E-ről és annak működéséről.

Mi az a DALL-E?

DALL-E az Open AI által kifejlesztett generatív mesterséges intelligencia modell, amely szöveges promptból képes képeket és grafikákat generálni. Más szóval, írhat egy mondatot, amely pontosan leírja, hogy mit szeretne látni, és a DALL-E pillanatok alatt elkészítheti ezt a képet.

A DALL-E először 2021 januárjában jelent meg, és azóta jelentősen frissítették a második, DALL-E 2-es verzióját. Egyike volt azon néhány különböző AI művészeti generátornak, amely rendkívül népszerűvé vált, mert a semmiből gyönyörű képeket és művészetet tudott létrehozni.

Mivel a kép létrehozásához csak néhány leíró szót kell írnia, sok nem művészt vonzott, akik hihetetlenül szórakoztatónak és könnyen használhatónak találják az eszközt.

A DALL-E által készített képek annyira meggyőzőek, hogy könnyen összetéveszthetők az emberi alkotásokkal. Amellett, hogy képes tárgyakat és tájakat ábrázolni a körülöttünk lévő világból, képes ezeket a képeket egy adott stílusban megjeleníteni, például digitális művészetben, akvarellben vagy impresszionizmusban.

A DALL-E nevét Salvador Dalí művészről, a WALL-E nevű robotról pedig egy Pixar animációs filmről kapta. A DALL-E neve minden bizonnyal ötletet ad arról, hogy a cég hogyan akarta ötvözni a művészetet és az AI-technológiát.

Mindent megtudhat hogyan használhatjuk a Dall-E 2-t mesterséges intelligencia képek létrehozásához részletes útmutatónkban, beleértve a hozzáférést és a kép egyes részei szerkesztését.

Hogyan működik a DALL-E?

A DALL-E mögött meglehetősen sok különböző technológia áll. De anélkül, hogy belemerülnénk a bonyolult matematikába, kezdjük azzal, hogy a DALL-E-t hogyan képezték ki milliónyi képre az internetről.

Az edzéshez használt képek olyan adathalmazokból származnak, amelyek hatalmas számú, szöveges felirattal ellátott képet tartalmaznak. Elképzelhető, hogy elegendő adat birtokában az AI-modell megtanulhatja, hogyan ismerje fel, mi az objektum, és hogyan nézhet ki egy képen.

A DALL-E betanításához használt adatkészletet nem hozták nyilvánosságra, de továbbra is megteheti derítse ki, hogy képei megtanítottak-e egy AI-modellt és kilép.

A DALL-E-t is a GPT-3, vagyis a generatív előképzett transzformátor nyelvi modell segítségével építették. Nagyrészt akkor vált népszerűvé, amikor az Open AI kiadta a ChatGPT-t, egy mesterséges intelligencia chatbotot, amellyel könnyedén beszélhet természetes emberi nyelven. Ez a technológia áthidalja a szöveg és a kép közötti szakadékot, és segít a beírt szavak képpontokból álló képpé alakításában a képernyőn.

A DALL-E másik alapvető része a diffúziós modell használata. Ez a modell zajos képet készít – gondoljon egy erősen pixilezett képre, amely nem felismerhető –, és visszafelé működik, hogy tiszta képet hozzon létre, amely megfelel a megadott szöveges leírásnak.

Mit lehet csinálni a DALL-E-vel?

Az emberek mindenféle dologra használják a DALL-E-t. Kipróbálhatja magát mesterséges intelligencia művészként, felhasználhatja egy híres műalkotás újrakeverésére, vagy készíthet egy eredeti műalkotást, és bővítheti azt a DALL-E szerkesztési funkcióival.

A kifestés a DALL-E olyan funkciója, amely lehetővé teszi még nagyobb alkotások létrehozását azáltal, hogy újonnan generált képpaneleket csatolhat egy meglévő műalkotáshoz. Tanul hogyan kell használni a kifestést a Dall-E 2-ben hogy lássa, meddig bővítheti ki az AI által generált képeit.

Hozzon létre mesterséges intelligencia által generált képeket a DALL-E segítségével

A DALL-E egy könnyen elérhető mesterséges intelligencia eszköz, amellyel művészetet készíthet vagy képeket hozhat létre, amelyek közül egyik sem létezett korábban. Kihasználja a gépi tanulás hihetetlen fejlődését, beleértve a GPT-3-at és a diffúziós modelleket. A DALL-E tudása az emberi világról, beleértve a művészettörténetet is, több millió képből származik, amelyeket valószínűleg az internetről gyűjtöttek össze.

A generatív mesterséges intelligencia számos új technológiájának kombinációja azt jelenti, hogy élvezheti, hogy fantáziáját életre keltheti, pusztán szavakkal, hogy képet festsen.