Maradjon a szöveg-zene őrület előtt, kísérletezzen a Meta mesterséges intelligencia eszközével.

A Meta kiadta a MusicGen kódot, egy másik AI zenegenerátort, amely a szöveges leírásokat zenei dallamokká alakíthatja. A demó megtalálható az interneten, és csak egy böngésző kell a kipróbáláshoz. Az eredmények nem rosszak, de ennél is inkább azt mutatják, hogy az AI zenei modellek milyen messzire fejlődtek.

Íme, mit kell tudni a MusicGenről és a zene generálásáról.

Mi az a MusicGen?

2023 júniusában a Meta kiadta az AI zenegenerációs modelljét MusicGen néven. Nem ez az első cég, amelyik megbirkózik a nyers zene egyszerű szöveges leírásból történő szintetizálásának összetett problémájával; eddig lehet zenét készíteni az OpenAI Jukebox segítségével vagy dalrészleteket generál a MusicLM segítségével.

De ez az első cég, amely nyílt forráskódúvá tette a kódot, lehetővé téve a szoftver helyi futtatását az Ön számítógépén számítógépet, ha GPU-ja legalább 16 GB memóriával rendelkezik – bár sikerült működésre bírnunk mindössze 11 GB.

Ne aggódjon, ha nem rendelkezik a hardverrel, mert a MusicGen webalkalmazást ingyenesen kipróbálhatja böngészővel. Az online demóból arra számíthat, hogy valamivel több mint egy percig tart egy körülbelül 12 másodperces hangrészlet létrehozása.

Hogyan hangzik a MusicGen?

Meta szerint a MusicGen kiváló minőségű zenei mintákat tud készíteni, bár felfedeztük, hogy az érintett kutatók meghatározták kiváló minőségű, akár 32 kHz. Ez valahol a beszédszintézis követelményei (16 kHz) és a digitális zenei szabvány között helyezkedik el (44,1 kHz).

A valóságban a hang nem felel meg a rádióban vagy streaming platformokon megszokott minimális minőségi szabványoknak. Más AI zenegenerátorokhoz képest azonban, és figyelembe véve, hogy a technológia hol tart az írás idején, a hangminőség meglehetősen jó, alacsony zajszint mellett a fájlban.

Mennyire igazodik a zene a felszólításhoz? Ezt gyorsan megértheti, ha meghallgatja az alábbi példákat. Általánosságban elmondható, hogy képes ragaszkodni a populáris zenei műfajokhoz, miközben megőrzi az elődeihez képest koherensebb zenei struktúrát.

Hogyan generáljunk zenét a MusicGen segítségével

A MusicGen használata egyszerű, és nem igényel regisztrációt. A felület is egyszerű, így a szórakozásból könnyen kipróbálható.

Így generálhat zenét a MusicGen segítségével:

  1. Nyissa meg a MusicGen webalkalmazás.
  2. című szövegdobozban Írd le a zenédet, írja be a promptot. Kipróbálhat valami olyan egyszerűt, mint az „ír népdallam”, vagy részletesebbé teheti a hangszer, a tempó, a műfaj vagy az érzelmek megadásával.
  3. megnyomni a generál gombot a folyamat elindításához. Egy-két perc múlva egy audiolejátszó jelenik meg a jobb oldalon a Generált zene modulban.
  4. Vigye az egérmutatót a modul fölé a lejátszó vezérlőinek megjelenítéséhez és a fájl meghallgatásához, vagy nyomja meg a letöltés ikont a jobb felső sarokban a fájl számítógépre mentéséhez. Vegye figyelembe, hogy csak .mp4 fájlként tölthető le.
  5. Ha szeretné kipróbálni az eredmények kondicionálását egy létező dallam segítségével, feltölthet egy felvételt a szövegdoboz melletti modulba. Alternatív megoldásként választhat Mikrofon dallam rögzítéséhez a mikrofon segítségével.

A dallam kondicionálása a szöveges leírást és az Ön által megadott dallamot egyaránt használja referenciaként. Ez egy hasznos eszköz a MusicGen által elért eredmények alakításához.

Milyen korlátozások vonatkoznak a MusicGen Audio használatára?

A MusicGen kódja szabadon terjeszthető az MIT licence alatt, kevés korlátozással. Ami a modell segítségével generált hangot illeti, nem világos, hogy vannak-e jogi iránymutatások. Ehelyett érdemes odafigyelni Meta figyelmeztetése a MusicGen használatára:

„A modellt nem szabad olyan zeneművek szándékos létrehozására vagy terjesztésére használni, amelyek ellenséges vagy elidegenítő környezetet teremtenek az emberek számára. Ide tartozik olyan zene generálása, amelyet az emberek előreláthatóan zavarónak, szorongatónak vagy sértőnek találnak; vagy olyan tartalom, amely történelmi vagy jelenlegi sztereotípiákat terjeszt."

Meta továbbá kifejti, hogy a MusicGen olyan kutatóknak készült, akik az AI zenegenerációt szeretnék felfedezni, nem pedig azoknak „további felhasználások”, amelyek feltételezésünk szerint olyan tevékenységeket jelentenek, mint a mesterséges intelligencia zene streamingen történő feltöltése és terjesztése platformok.

A Az etikai előnyei és hátrányai tükrözik az AI művészet generációját. Az adatok MI-modellek betanításához való hozzájárulásának megszerzése, valamint a művészek kompenzációjának/jóváírásának problémája indokolja a Meta biztonságát.

Röviden, a modell szórakozásból való felfedezése valószínűleg nem okoz kárt, de lehet, hogy kényesebb probléma lehet, ha a hangot kereskedelmi zenékhez használják. Sokan gondolkodnak azon, hogy mit a popzene jövője az AI-val úgy néz ki, mint a.

Egy újabb zenegeneráló modellel a Meta kiadta a MusicGen-t, egy nyílt forráskódú AI-modellt, amely képes nyers zenét generálni egyszerű szöveges leírásból. Ha kíváncsi a technológia kipróbálására, egy webböngészővel megpörgetheti a bemutatót.