Gondolkodott már azon, hogy Shazam hogyan „hallja” az általad lejátszott zenét, és hogyan azonosítja azt ilyen pontossággal? Nos, nem vagy egyedül.
A zenefelismerő szolgáltatást működtető technológia sokak számára rejtély, különösen azért, mert a szolgáltatás évekkel azelőtt indult, hogy az okostelefonok és a gépi tanulás dolog lett.
Ebben a cikkben megnézzük, hogyan működik a Shazam, és hogyan tudja pontosan felismerni a zenét.
Mi az a Shazam?
Shazam egy népszerű zenefelismerő alkalmazás, amellyel információkat találhat egy új dalról, amelyet szeret, de nem ismeri az előadó címét vagy nevét.
Tegyük fel, hogy kávézóban vagy egy sarki boltban járunk, és hallunk egy új dalt, amelyet szeretnétek a zenei könyvtárban. A Shazam segít könnyedén megtalálni a dalt. Csak annyit kell tennie, hogy rögzít néhány másodpercet a dalból az alkalmazásban.
A Shazam alkalmazás kifinomult hangfelismerési technológiával azonosítja a hallott zenét másodpercig, így megtudhatja az előadó nevét, és nyomon követheti, videókat nézhet, sőt megvásárolhatja vagy streamelheti is a dalt eszköz.
Letöltés: Shazam for iOS |Android (Ingyenes)
Hogyan működik a Shazam?
Kép 1/4
2. kép 4-ből
3. kép 4-ből
4/4-es kép
A Shazam egy saját technológiát használ, amelyet Avery Lin-Chun Wang, az alkalmazás társalapítója és fő adatkutatója fejlesztett ki, hogy azonosítsa a platformján lekérdezett dalok egyezését. A technológia ujjlenyomatokat hoz létre a hangfelvételek számára, ez a titkos szósz Shazam félelmetes felismerési képességei mögött.
A Shazam létrehoz és tárol audio ujjlenyomatokat, amelyek számszerű adatok gyűjteményéből állnak, több mint 15 milliárd dalhoz. Amikor a felhasználó „Shazams” egy dalt, a Shazam gyorsan létrehoz egy audio ujjlenyomatot az okostelefonról vagy a számítógép mikrofonjáról kapott hangról.
Miután elkészült a felvételhez szükséges audio ujjlenyomat, a Shazam feltölti az audio ujjlenyomatot (nem a hangot) a szerverére, ahol adatbázis-keresést végez a mérkőzések után. Ha talál egyezést, akkor az azonosító adatokkal együtt visszaadja a dal adatait, ahol megadhatja, hol továbbíthatja vagy megvásárolhatja.
Mi az audio ujjlenyomat?
Az audio ujjlenyomat az audiojelek sűrített digitális összefoglalása. Hangminta azonosítására vagy hasonló elemek felkutatására szolgálnak egy audio adatbázisban.
A Shazam audio-ujjlenyomat-technológiája képes felcímkézetlen hangtartalom-darabokat összehangolni az audio-adatbázis megfelelő mérkőzéseivel. A Shazam azonosítja a felvett dal címét (felirat nélküli hangtartalom) úgy, hogy a dal ujjlenyomatát illeszti az adatbázisában található dalok ujjlenyomatához.
A Shazam egyedi ujjlenyomatokat hoz létre az adatbázisában szereplő dalokhoz a spektrogram segítségével azonosított egyes adatpontok felhasználásával.
Mi az a spektrogram?
A spektrogram háromdimenziós grafikon, amelyet a hang ábrázolására használnak. A spektrogram mutatja a frekvenciák változását egy adott időszakban, figyelembe véve az amplitúdót vagy a térfogatot is. Az alábbi fotó egy példa a spektrogram leolvasására.
2003-as interjúban Tudományos amerikai, Avery Wang elárulta, hogy a Shazam algoritmus a legmagasabb energiájú jegyzeteket ábrázoló spektrogrampontokat használja az audio ujjlenyomatok előállításához.
A Shazam figyelmen kívül hagyva a dalban szereplő információk nagy részét és csak a néhány meghatározó hangra koncentrálva, hihetetlen sebességgel kereshet az adatbázisában, és pontos egyezéseket adhat a dalok lekérdezéseihez.
Hogyan képes Shazam azonosítani a dalokat a zajos helyeken?
A Shazam háttérzajtól és torzulásoktól mentes dalfelvételeket használ az ujjlenyomatok létrehozásához az adatbázisához. Ha egy dalt az alkalmazással zajos helyen rögzít, akkor az létrehoz egy audio ujjlenyomatot a felvételéről azáltal, hogy azonosítja a felvételen a legnagyobb energiájú jegyzeteket.
Ezután az adatbázisában keres egyezést a felvétel audio ujjlenyomataival, feltéve, hogy a háttérzajszint nem volt elég magas ahhoz, hogy torzítsa a hang létrehozásához felhasznált adatokat ujjlenyomat.
Olyan esetek, amikor Shazam nem tud segíteni egy dal azonosításában
A Shazam kiválóan alkalmas dalok összeillesztésére, még homályos zenékre is, amelyekről úgy gondolja, hogy nincsenek az adatbázisában. De vannak olyan pillanatok, amikor Shazam nem tudja azonosítani a pályát?
Torz felvétel
Amikor Shazam egy dalt olyan helyen, ahol a háttérzajszint túl magas, a zaj torzítja a Spektrogram adatait. Emiatt a felvételének audio ujjlenyomata eltér az eredeti dalétól.
Amikor ez megtörténik, Shazam visszaadja a A dal nem ismert párbeszédet, mert nem talál megfelelőt az audio ujjlenyomat számára.
Élő zene
A Shazam elmarad attól a képességtől, hogy élő előadásokból azonosítsa a zenét. Ennek oka, hogy az élő előadásokban felvett hang gyakran eltér a Shazam dal eredeti verziójától, amelyet audio ujjlenyomatok létrehozására használ.
A Shazam csak akkor tud azonosítani egy dalt egy élő fellépés során, ha a zenekar elég ügyes ahhoz, hogy pontosan úgy adja elő a dalt, ahogyan azt rögzítették. Sok sikert a zenekarhoz, aki ezt megpróbálja...
Az Ön hangfelvétele
"Felkérhetném Shazamot, hogy ismerje fel az általam énekelt dalt, ha nagyon jó énekes voltam?"
Röviden: nem.
A Shazam algoritmus csak előre rögzített zenét tud azonosítani. Ahhoz, hogy Shazam azonosítsa az általad énekelt dalt, ugyanazzal az énekkel kell rendelkeznie az instrumentálissal, a dal eredeti felvételével megegyező ütemben.
Zúgolód
A Shazam nem tudja azonosítani a humuszok egyezését, mert algoritmusa pontos frekvenciákat és amplitúdókat használ az audio ujjlenyomatok létrehozásához az adatbázisában található dalokhoz.
Amikor dúdol egy dalt, Shazam létrehoz egy ujjlenyomatot hozzá. De mivel a dúdolás csak egy dal újraszintetizálására tett kísérlet, az algoritmus nem fog megfelelni a felvételnek.
Shazam az egyetlen zenei azonosító alkalmazás?
A Shazam volt az első zenei azonosító szolgáltatás, és jelenleg a legelterjedtebb dalazonosító alkalmazás. Vannak azonban más alkalmazások, amelyek segítségével azonosíthat egy dalt játszik körülötted. Vannak, akik még egy dalt is képesek azonosítani, amit énekelnek vagy dúdolnak.
A Shazam legnépszerűbb alternatívái közül három a SoundHound, a Musixmatch Lyrics és a Genius. A Musixmatch és a Genius elsősorban a körülötted játszó zene szövegeinek azonosításában segít, míg a SoundHound a Shazam legközelebbi versenytársa.
Összefüggő: A legjobb zenefelismerő alkalmazások dallamuk megkereséséhez
A SoundHound alkalmazással nagyjából mindent megtehet, amit a Shazam csinál. A Shazammal szembeni fő előnye, hogy hozzáadott funkcióval azonosítja az Ön által énekelt vagy dúdolt dalokat.
Kép jóváírása: Sulastri Sulastri / Shutterstock.com
Kíváncsi arra, hogyan lehet azonosítani egy dalt egy YouTube-videóból? Ez a YouTube-dalkereső bemutatja a videókból származó zene azonosítását.
Olvassa el a következőt
- Technológia magyarázata
- Shazam
- Zene felfedezése
- SoundHound
- Musixmatch
John születésétől fogva a technika szerelmese, képzettséggel digitális tartalom-készítő, szakmája szerint pedig a Tech Lifestyle Writer. John hisz abban, hogy segít az embereknek a problémák megoldásában, és cikkeket ír, amelyek éppen ezt teszik.
Iratkozzon fel hírlevelünkre
Csatlakozzon hírlevelünkhöz, amely műszaki tippeket, véleményeket, ingyenes e-könyveket és exkluzív ajánlatokat tartalmaz!
Még egy lépés…!
Kérjük, erősítse meg e-mail címét az imént elküldött e-mailben.