A Google kiadta a Lyra audiokodek béta forráskódját a GitHub-on, hihetetlen minőségű alacsony bitrátájú audio-feldolgozást biztosítva minden fejlesztő számára. A kodek leginkább beágyazott és sávszélesség-korlátozott helyzetekben hasznos, amikor a lehető legtöbb adatot el kell menteni.

Lyra: Szinte semmi sem hangzott ilyen jól

Az audiokodek azon az elven működik, hogy a lehető legtermészetesebben hangzó beszédet adja a lehető legkisebb adatsebességgel. Sikeresen kísérteties hangreprodukciót hoz létre 3 kbps-os bitrátával. A Google a valós idejű Lyra tömörítést használja már a Duo alkalmazásában, bár téged nem hibáztatnának azért, ha észre sem veszi a különbséget a szokásos sávszélességű hangokhoz képest.

Annak bemutatására, hogy a Lyra mennyivel jobb, mint más kodekek, a Google példákat mutat be az a segítségével blog bejegyzés a Machine Learning vezérelt tömörítési kodek összehasonlítása más 3 és 6 kbps alternatívákkal.

Ez egy éjszakai különbség a nap folyamán, és a fejlesztők világszerte történő megadása ezen eszközök révén jelentős hajtóereje lesz a kommunikáció minőségének javításában, ahol a sávszélesség kevés. Kiváló motiváció azoknak a fejlesztőknek is, akik új alkalmazásokat szeretnének létrehozni a feltörekvő piacokon, amire a Google biztosan kitér az idei évben

ingyenes virtuális Google I / O online konferencia.

A béta forráskód jelenleg a 64 bites Arm eszközöket szem előtt tartva készül, bár a példák 64 bites x86 Linux rendszereken is futni fognak. A forráskód teljesen dokumentált, bár bétaverzióban van, és a GitHub oldalon találhatók telepítési utasítások és a Lyra Linuxra építése a 64 bites Arm célpontokhoz.

A Lyra béta forráskódjának megszerzéséhez menjen a Lyra GitHub oldal.

Hogyan működik a Lyra?

Míg a Lyra által használt tényleges folyamat a gépi tanulási modellek hihetetlenül összetett kombinációja, amelyre betanítottak több ezer órányi beszédadat és a meglévő audiokodek technológia optimalizálása, az elmélet meglehetősen egyszerű.

40 ms-onként a funkciókat beszédből veszik és tömörítik 3 kbps-ig. Ezek a jellemzők a beszédenergia pontjait mutatják az emberi hallási beszédreakcióhoz legközelebb eső frekvenciaspektrumban - azokat a dolgokat, amelyeket fel kell ismernünk és meg kell értenünk, ha valaki beszél.

A Lyra különlegessége az, hogy miként használja ezeket az információkat:

Ugyanakkor a hagyományos paraméteres kodekek, amelyek egyszerűen kibontják a beszédkritikus paramétereket, amelyek akkor lehetnek arra használják, hogy a jelet a vevő végén újrateremtsék, alacsony bitrátát érjenek el, de gyakran robotnak és természetellenesnek hangzanak. Ezek a hiányosságok a kiváló minőségű audio generatív modellek új generációjának kifejlesztéséhez vezettek forradalmasította a terepet azzal, hogy nemcsak megkülönböztetni tudta a jeleket, hanem teljesen újakat is generált azok.

Az átvitel után a Lyra újjáépíti a hullámformát azzal, hogy kitölti a hiányzó folyamatot, miközben valahogy nem túlságosan bonyolult számítási szempontból.

Egyrészt ez egy technológiai csoda, amely szinte bárhol el fog futni. Másrészt még mindig nem vagyok 100% -osan meggyőződve arról, hogy ez nem boszorkányság.

Email
10 Google Duo-szolgáltatás, amelyet valóban használnia kell

A Google Duo az egyik legjobb videohívó alkalmazás. Nagyon sok funkcióval rendelkezik, és itt vannak azok, amelyeket szerintünk valóban használnia kell.

Olvassa el a következőt

Kapcsolódó témák
  • Tech News
  • Google
  • Android
  • Gépi tanulás
A szerzőről
Ian Buckley (209 közzétett cikk)

Ian Buckley szabadúszó újságíró, zenész, előadó és videoproducer, Németországban, Berlinben él. Amikor nem ír vagy színpadon van, barkácsoló elektronikát vagy kódot bütyköl, abban a reményben, hogy őrült tudós lesz.

Ian Buckleytől többet

Iratkozzon fel hírlevelünkre

Csatlakozzon hírlevelünkhöz, amely műszaki tippeket, véleményeket, ingyenes e-könyveket és exkluzív ajánlatokat tartalmaz!

Még egy lépés…!

Kérjük, erősítse meg e-mail címét az imént elküldött e-mailben.

.