A GauGAN2 egy eszköz mesterséges intelligencia által generált fotorealisztikus tájképek készítésére. Az NVIDIA által kifejlesztett és webes demóként elérhető GauGAN2 lehetővé teszi, hogy tetszés szerint módosítsa a képet, a vázlatok és a szövegbevitel keverékével irányítja az AI-rendszert.
Egy kis idő elteltével finomíthatja a képet részletek hozzáadásával vagy eltávolításával, amíg az éppen megfelelő nem lesz. Az általa előállított képek gyakran valósághűnek tűnnek, de egy rossz vonás után a képek fantáziaművészeti alkotásoknak tűnhetnek, nem pedig valóságos tájképeknek.
Íme, mit kell tudni az NVIDIA GauGAN2-ről.
Mi az NVIDIA GauGAN2?
GauGAN2 egy mesterséges intelligencia művészeti generátor egyedi szerkesztőablakkal. A GPU-kat gyártó NVIDIA kutatócsoportja fejlesztette ki, és bárki számára elérhető webes bemutatón keresztül.
Bizonyos értelemben hasonló
Dall-E 2 használatával, egy mesterséges intelligencia szöveg-képgenerátor, amelybe beírhat olyan kifejezéseket, mint a „napnyugta a sivatag felett”, és az AI-rendszer a leírás alapján létrehoz egy képet. Ez azonban nem minden, amit a GauGAN2-vel megtehetsz; több módon is folytathatja a kép szerkesztését.Az egyik lehetőség a szegmentációs térkép használata a képen lévő objektumok körvonalának megtekintéséhez. Ezen információk felhasználásával megváltoztathatja az olyan dolgok alakját, mint például egy hegylánc, ha átrajzolja a határait, vagy teljesen törli az elemeket.
A ceruza eszközzel például kört is rajzolhat, amely napként jeleníthető meg. Ugyanez vonatkozik néhány csúcs rajzolására a háttérben, amelyek hegyvonulattá válhatnak, különösen, ha a jelenetet leíró szövegbevitellel kombinálja.
Miután kipróbálta az NVIDIA GauGAN2-jét, érdemes megtanulnia hogyan kell használni az NVIDIA Canvas alkalmazását, amely ugyanarra a technológiára épül. Ez egy ingyenes alkalmazás művészeknek és kreatívoknak, azonban csak az NVIDIA RTX GPU-jainak egyikével működik.
Hogyan működik a GauGAN2?
A kulisszák mögött a GauGAN2 generatív ellenséges hálózatok (GAN) felhasználásával épült. Valójában a neve a francia posztimpresszionista művész, Paul Gauguin és a GANs játéka.
Azért képes meggyőzően valódi tájképnek látszó képeket generálni, mert a képzési időszaka alatt 10 millió jó minőségű tájképet tápláltak vele. A modell betanításához szükséges számítási teljesítmény az NVIDIA Selene szuperszámítógéptől származott, amely a világ egyik legerősebb szuperszámítógépe.
A GAN-ok számos alkalmazásban találnak felhasználást, köztük számos alkalmazásban AI szöveg-művészet generátorok. A legfontosabb különbség a GauGAN2-vel szemben az, hogy a mesterséges intelligencia által generált kép egy dedikált szerkesztőben módosítható olyan eszközök segítségével, mint a toll, a kitöltés és az ecset.
A felület minimális, de nem éppen felhasználóbarát, és retró megjelenése a Microsoft paint korai időszakára emlékeztethet, szemben az élvonalbeli szoftverekkel. Ha a kezelőszervek elsőre nem tűnnek egyértelműnek, futtathat egy gyors oktatóprogramot, vagy megnézhet egy videós áttekintést; csak kattintson az oldal jobb felső sarkában lévő gombokra.
Milyen művészetet produkálhat a GauGAN2?
A GauGAN2 célja, hogy fotórealisztikus képeket készítsen tájakról, például hegyekről, tavakról és strandokról.
A vázlatkészítés során választhat a címkekönyvtárból, amely segít a vázlatbemenet további címkézésében, így az AI-generátor megfelelő képet tud előállítani. Ide tartoznak például a köd, domb, kő, hó és víz, hogy csak néhányat említsünk.
Nem nehéz azonban elromlani a dolgoknak, és ugyanolyan valószínű, hogy abszurd és szürreális képeket készítesz. Egyszerűen fogd meg a ceruzaeszközt, és rajzolj néhány furcsa formát, és a GauGAN kiköp valamit, ami inkább hasonlít egy kísérleti műalkotáshoz, mint bármi másra.
Ha értelmetlen kifejezéseket ír be a szövegmezőbe, az is furcsa kimeneteket eredményezhet. Néha nem is kell olyan messzire menni; Egyszerűen csak egy hegyi tájat kérünk, ami úgy néz ki, mint a hó és a szőr furcsa kombinációja.
Egyes művészek mindkét esetben hasznosnak találhatják az ehhez hasonló eszközt. Használható a storyboard-készítés folyamatának felgyorsítására, vagy egy játék vagy videó koncepcióművészetének gyors létrehozására.
Bár ez a demó nagyon messze van attól, hogy használatra kész, csiszolt termék legyen, érdekes lehetőségeket rejt magában.
GauGAN2: Hibrid AI művészeti generátor
A GauGAN2 csatlakozik a szöveget képpé alakító mesterséges intelligencia-képgenerátorok gyűjteményéhez. Más alkalmazásokkal ellentétben azonban a képet szakaszosan szerkesztheti, vázlatokat és szöveget használva bemenetként, és tetszés szerint finomhangolhatja az AI-képet.
Ha helyesen használják, a GauGAN2 meglehetősen meggyőző, fotorealisztikus természetképeket tud készíteni, ami hasznos lehet azoknak a művészeknek, akiknek forgatókönyvet kell feltölteniük vagy gyorsan konceptművészetet kell készíteniük. A dolgok azonban túl könnyen bizarrra fordulnak, és néhány kósza tollvonás érdekes eredményekhez vezethet.