Valószínűleg látott olyan alkalmazásokat, amelyek azt állítják, hogy lefordítják a macskája mondanivalóját. De vajon valóban lefordíthatják-e angolul a macskád nyávogását? A rövid válasz igen, mintegy. Nehéz, mivel az egyes macskák "nyelve" egyedülálló, de a modern technológiával elég közel kerülhetnek egymáshoz.

A MeowTalkhoz hasonló macskafordító alkalmazások olyan beszédfelismerési formát használnak, amely hangsúlyozza a gépi tanulást. Nézzük meg közelebbről.

Beszédfelismerés és gépi tanulás

Mary Theresa McLean /Pixabay

A beszédfelismerés a beszéd rögzítésével és a hang digitális adatfájlokká alakításával működik. Olyan adatokat kódol, mint a hangmagasság és a hangerő adatpontokként, amelyeket az alkalmazás elemezhet és a jelentésekhez illesztheti. DPA mikrofonok elmagyarázza, hogy ezek az adatpontok nagyon eltérően nézhetnek ki a háttérhangoktól és a szó kimondásának módjától függően.

Néha a hangfelismerést természetesnek vesszük, de ez a technológia hihetetlen bravúrja. Különösen figyelembe véve, hogy az emberi beszéd mennyire összetett. Mint

instagram viewer
A tudós kifejti, hogy minden szó magában foglalja a hangok vagy "fonémák" széles skáláját, amelyekbe keverednek. Nagyon nehéz elérni, hogy a számítógép megértse a beszédet. A macskahangok új határa még nehezebb lesz.

A beszédfelismerést használó alkalmazásokat az adatkészletnek nevezett szavak "szókincsével" programozzák. Ezután az alkalmazás a beszédét az adatszókincsében a legközelebbi lehetőséghez illeszti.

Ha hibázik, kijavítja, és ezeket az adatokat legközelebb elmenti. Ez a gépi tanulás része. Így tanulja meg a program a beszéd felismerését akkor is, ha nem azonos azzal az adatkészlettel, amellyel elindult.

Összefüggő: Mik azok a gépi tanulási algoritmusok? Így működnek

A hangfelismerésnek még mindig vannak problémái, különösen a beszédhibákkal és az ékezetekkel. Egyes vállalatok a gépi tanulás fejlesztése ezen problémák leküzdése érdekében, bár. Idővel a gépi tanulás a beszédfelismerést hatékony eszközzé teheti.

Így működik a beszédfelismerés az emberek számára. De vajon macskáknál működik?

Beszédfelismerés vs. Miau elismerés

Ariana Suárez /Unsplash

Először is meg kell értenünk, miért különbözik egy bizonyos fajta nyávogás "éhes vagyok" fordításától, mint az emberi beszéd elemzése. A probléma leginkább az, hogy a macska kommunikációja nagyobb mértékben támaszkodik a nonverbális jelekre, mint a testtartás. További probléma az univerzális "macskanyelv" hiánya.

Szerint a ASPCA, a felnőtt vadon élő macskák soha nem nyávogják egymást, csak az embereket. Egyéb kutatások a Humán Társaság hozzáteszi, hogy ezek a hangok "nem vákuumban jelentkeznek". A testbeszéd és más összefüggések mellett kell értelmeznünk őket. Sok esetben ezek a néma jelek jelentik az egyetlen különbséget az "éhes vagyok" és egy "játszani akarok" jelentést jelentő nyávogás között.

Hozzáadva ehhez a problémához, nincs két macskának ugyanaz a nyelve. A macskák személyre szabott "nyelveket" fejlesztenek ki gazdáik számára. Ezek részben a tulajdonos hangjának utánzásán, részben a macska személyiségén alapulnak. Nincs két macska egyformán, még akkor sem, ha ugyanazon igényt vagy igényt közvetíti. Tehát hogyan lehet lefordítani az egyik alkalmazás beszédszókincsét mindannyiuk számára?

Rugalmas gépi tanulás macskáknak

Ingyenesen használható hangok /Unsplash

Bár néhány virtuális asszisztens kedveli Oto próbálják megérteni a hangot és az érzelmeket, a beszédfelismerés még mindig szörnyű a nonverbális jeleknél. De ez nem jelenti azt, hogy lehetetlen értelmezni őket.

A MeowTalk rugalmasabb típusú gépi tanulást használ ezeknek a problémáknak a leküzdésére.

Letöltés: MeowTalk for Android | iOS (Ingyenes)

A Meowtalkot Javier Sanchez készítette, aki az Alexa csapatában is dolgozott. Az alkalmazást úgy képzelte el, mint egy lépést az intelligens gallérok felé. Ezek a gallérok a macskahangokat emberi beszéddé alakítanák át, komplex gépi tanulási stratégiákra támaszkodva, hogy az emberek jobban megértsék és gondozzák macskáikat.

A MeowTalk csapata kompenzálta az egyediség problémáit azáltal, hogy minden macskához specifikusabb profilokat hozott létre. Az alkalmazásban minden macskát külön regisztrál. Science Norvégia jelentése szerint a cicák másképpen nyávognak, mint a felnőtt macskák, ezért az alkalmazás a macska születésnapjára is kér. Minden profil egyedi adathálózatot generál a macska számára, beépítve egy kis mély tanulást a gépi tanulásba.

Összefüggő: Mély tanulás vs. Gépi tanulás vs. AI: Hogyan mennek együtt?

A szókincs szempontjából a MeowTalk az adatkészletében 10 hangprofillal indul. Mindegyiknek más és más jelentése van, például a "boldog" vagy a "vadászat". Amikor az alkalmazás hall egy hangot, és téved, akkor vagy kijavíthatja, vagy új értelmezést hozhat létre.

CATSOUNDS adatok gyűjtöttek Akvelon

A javítás azt mondja az alkalmazásnak, hogy cserélje ki az alapszókincset az új hangzással.

Például elmondhatja az alkalmazásnak, hogy a "Vadászat" rövid csipogáshoz illeszkedjen a hosszú nyávogás helyett. Ez a fajta korrekció hasznosabb, mint több hang hozzáadása, hogy az egy értelemben megfeleljen a beszédfelismerés módjának, ami olyan lenne, mintha azt mondanánk az alkalmazásnak, hogy egy hosszú nyáj és rövid csipog mindkét jelentése: "Anyahívás".

A gépi tanulás a beszédfelismerő alkalmazásokban általában ellenáll az ilyen típusú felülírásnak. Olyan lenne, mintha megpróbálnánk megtanítani Sirit arra, hogy amikor "technológiai blogot" mond, akkor valóban "körtére" gondol. De a MeowTalk által használt rugalmasabb gépi tanulási forma jobban képes kezelni ezt a korrekciót könnyen.

Új értelmezés létrehozása olyan jelentést ad hozzá, amelyet korábban nem kódoltak. Például, ha macskája hívást kezdeményez, amikor a kedvenc játékát szeretné, akkor opcióként megadhatja a "Szeretném az egeremet" lehetőséget. Hasonló, mint egy szó hozzáadása az automatikus javítási szótárhoz.

Összefüggő: Hogyan definiálhatjuk saját automatikus javító szavainkat az Android rendszeren

Idővel kifejleszthet egy nagyon személyre szabott beszédprofilt macskája számára. Végül akár elég kifinomult is lehet ahhoz, hogy hasznos legyen a kisállat-gondozóknak vagy a viselkedési problémák megoldására. Ha más nem, a macskatulajdonosok figyelmesebbé válnak kedvenceik iránt.

Az ítélet: A macskafordító alkalmazások működnek?

Végül a "macska fordítás" még mindig nagyon támaszkodik arra, hogy a felhasználó megtanítja az alkalmazást arra, hogyan beszél macskája. Ez valószínűleg mindig így lesz, mivel az egyes macskák kommunikációja egyedülálló.

De az a tény, hogy a gépi tanulás olyan messzire jutott, hogy a fejlesztőknek ez akár részben is sikerrel járhat, hihetetlen. A gépi tanulás és az intelligencia rohamos sebességgel halad előre, és alig várjuk, hogy merre haladnak tovább.

Email
Kapcsolódó témák
  • Technológia magyarázata
  • Nyelvtanulás
  • Gépi tanulás
A szerzőről
Natalie Stewart (16 cikk megjelent)

Natalie Stewart a MakeUseOf írója. Először az egyetemen kezdett érdeklődni a technológia iránt, és az egyetemen a médiaírás iránti szenvedélye alakult ki. Natalie a hozzáférhető és könnyen használható technológiákra összpontosít, és szereti azokat az alkalmazásokat és eszközöket, amelyek egyszerűbbé teszik a mindennapi emberek életét.

Natalie Stewart további alkotásai

Iratkozzon fel hírlevelünkre

Csatlakozzon hírlevelünkhöz, amely műszaki tippeket, véleményeket, ingyenes e-könyveket és exkluzív ajánlatokat tartalmaz!

Még egy lépés…!

Kérjük, erősítse meg e-mail címét az imént elküldött e-mailben.

.