Hirdetés

A hangfelismerés régen szörnyen pontatlan volt. Csak maroknyi embernek működött néhány alkalommal. De most valójában meglehetősen jó, a Nuance, a Microsoft, az Apple és a Google együttes erőfeszítéseinek köszönhetően, akik számtalan erőforrást dobtak el annak tényleges fejlesztésére.

Ezek közül a vállalatok közül kevesen feleltek meg a Google hangfelismerés iránti elkötelezettségének, amely a mobil- és szolgáltatási stratégiájának alapvető fontosságúvá tette.

A Google egyik legkorábbi fellépése a rövid élettartamú GOOG-411 (vagy a Google Voice Helyi Kereső) volt. 2008-ban indult, és lehetővé tette az emberek számára, hogy hangjuk segítségével üzleti telefonszámokat keressenek. A hangfelismerő technológia az Android központi eleme, és a a JellyBean indítása Melyek a legjobbak az Android 4.2 és 4.3 verziókban?Ha elakad a 4.0 Ice Cream Sandwich vagy a 4.1 Jelly Bean, frissítenie kell? Olvass tovább végül offline is elérhetővé vált.

A hét elején a Google végül bevezette a hangfelismerést a Google Dokumentumokba.

A felhasználók szó szerint diktálja dokumentumaikat (hasonlóan a cikkhez), anélkül, hogy bármilyen kiegészítő szoftvert vagy beépülő modult telepíteni kellene. Jelentős előrelépés az online irodai csomag számára, de vajon jó?

Elkezdeni

Mielőtt elkezdenénk belemerülni a szolgáltatásaiba, meg szeretném vizsgálni, hogyan kapja meg a Google Voice Typing szolgáltatást. Ha van Google Fiókja, akkor már rendelkezik ezzel. Csak nyissa meg a Google Dokumentumokat, és nyisson meg egy új vagy meglévő dokumentumot. Ezután megjelenik egy ablak, amely megkérdezi, hogy szeretne-e kipróbálni a hangos diktálást. kettyenés Próbáld ki.

GoogleVoiceTypingTry

Ezután engedélyt kell adnia a Google Dokumentumoknak a mikrofon használatához. Csak kattintás kérdése Lehetővé teszi egy felbukkanó ablakhoz.

MicrophonePermission

Ezután ki kell választania azt a nyelvet, amelyet használni szeretne a Google Voice Typing szolgáltatásban. A kínált nyelvek és nyelvjárások tartománya az angol és a spanyol, az afrikán és arab nyelv.

Képernyőkép 2016-02-25, 10.14.12

Ezután csak kattintson a mikrofon ikonra, és kezdje el beszélni.

Mennyire pontos?

A hangfelismerés egyik legnagyobb akadálya, amely a mainstream-et megcélozza, ez gyakran nem elég pontos. Régen adták, hogy ha látja a hangfelismerést, akkor jó néhány órát töltenek a szöveg szerkesztésével és javításával. Szóval hogyan kínál a Google viteldíjat ebben a tekintetben?

Valójában nagyon kedvezően. A Google Voice Typing nagyrészt megértette, amit mondtam, annak ellenére, hogy regionális angol kiejtésem van (később az akcentusokról beszélünk).

GoogleVoiceOn

Különösen lenyűgözött, hogy a Google hangfelismerése hogyan kezeli a háttérzajt. Ahogy ezt a cikket írtam, egy yorkshire terrier ugatott a nappali szobámban, és ablakom részben nyitva volt. Forgalmas úton élek, ahol az autók folyamatosan haladnak el. De ennek ellenére a Google képes kiszűrni ezt, és arra összpontosítani, amit mondok.

A legnagyobb probléma a Google Voice Typing volt, gyakran küzdött az írásjelekkel. Azt mondanám, hogy „vessző”, „periódus” és „teljes pont”, és ezt úgy értelmezné, hogy én azt akarom, hogy „vesszőt”, „periódust” és „teljes leállítást” írjak. Ez két okból is bosszantó volt.

Pont

Először azért, mert ez elkísért engem, először a helyes írásjelek használatával, mielőtt azonnal visszatérne a szó kimondott változatához. Ezt nem lehetett megállítani, és manuálisan kellett szerkesztenem a dokumentumot annak javításához.

De ami talán még rosszabb, nem tudtam megakadályozni, hogy ez megtörténjen. Nincs olyan szótár, amelyben felülírhatná a helyesírást. Csak történik, és ezzel foglalkoznia kell.

Nem akarom alábecsülni, mennyire frusztráló ez. Komolyan bosszantó. Ugyanakkor biztos vagyok abban is, hogy javulni fogok, mivel egyre többen használják ezt a funkciót, és mivel a Google több erőforrást vállal a hangfelismerés javítására.

Ezen a különleges bosszankodáson túl nagyon elégedett voltam a Google hangfelismerésének pontosságával.

Hogyan kezeli az ékezeteket?

Csodálkoztam, hogy a Google Voice Typing hány nyelvet és dialektust támogat. Csak angolul támogatja az Új-Zéland, az ausztrál, az indiai, a dél-afrikai, az amerikai és a brit nyelvjárásokat, csak néhányat említve. A probléma az, hogy nincs igazán amerikai akcentus, ugyanúgy, mint nincs brit akcentus. Inkább ékezetes és dialektus-sorozat létezik, amelyek helyről-helyre különböznek.

Igaz, hogy az Egyesült Királyság minden egyes irányítószámmal szerepel. A MakeUseOf Team különféle akcentussal büszkélkedhet a brit alkalmazottak körében. Christian Cawley széles Middlesbrough kiejtéssel beszél. Rob Nightingale, aki Southportból érkezik, sokkal északibb húzással rendelkezik. Míg Mark O’Neil van egy skót kettős.

Liverpoolban élek, tehát van egy Scouse-féle akcentussal, amely kissé az Atlanti-óceánba sodródik, főleg amerikai vőlegényem és a svájci időben eltöltött időnek köszönhetően.

És igazságos azt mondani, hogy a hangfelismerő programok gyakran küzdenek a regionális angol nyelvjárások megértésében. Amikor például a Siri kijött, futó vicc lett a skót felhasználók megértésének képtelensége.

De a Google kínálata kivételes volt. Hidd el, amikor azt mondom, hogy nem kell gyakorolnod más akcentussal beszélt Milyen alkalmazások és webhelyek javíthatják az én kiejtésem, ha másik nyelvet beszélünk?Nagyon szeretném, ha kiejtésem megegyezzen az anyanyelvi szavaimmal. Van olyan alkalmazás vagy webhely, amely segíthet nekem? Olvass tovább . Marokkóval beszéltem, akik regionális angol kiejtéssel is rendelkeznek, és hasonlóképpen pozitív tapasztalatokkal is éltek vele. Noha elismerem, hogy ez egy kicsi és teljesen tudománytalan minta, minden bizonnyal ígéretes.

Hangdiktálási sebesség

A hangfelismerő programokat hagyományosan hátráltatja az a képtelenség, hogy lépést tartson a felhasználó által diktált sebességgel. Igaz, kissé aggódtam, hogy a Google kínálata nem különbözik egymástól, különös tekintettel arra, hogy online szolgáltatásról van szó, nem pedig a felállított MacBook Pro-on futó programról.

De lenyűgözött. A Google képes volt lépést tartani a nagyon koffeinmentes beszédértemmel, és nem volt szűk keresztmetszetem a termelékenységnek. Ez teljesen ellentétes volt a más diktáló eszközökkel kapcsolatos tapasztalataimnak.

VoiceRecognitionSpeed

Nem tudom, hogy azért van-e, mert van egy böjtöm FTTC (szál a kabinethez) Mi a különbség az FTTC és az FTTP között, és miért érdekel?Mindannyian ott voltunk egy vagy másik ponton. Beteg az internetszolgáltatásunkban, amely új módszert keres az internethez való kapcsolódáshoz, ám a sokféle lehetőség zavarja. Olvass tovább otthoni internetkapcsolat, vagy az a tény, hogy a Google rendelkezésére áll korlátlan mennyiségű gyors szerver. Akárhogy is, sikerült elkészítenem a dolgokat.

Megjegyzés a mikrofonokról

A beépített mikrofonok általában hiányoznak. Tapasztalataim szerint vagy kiválóak, mint például az Apple laptopjai, vagy nem. Nagyon ritkán van középút.

Általános szabályként, a legolcsóbb laptopok Legjobb 300 dollár alatti laptopok: Minden, amit tudnod kellManapság szinte lehetetlen jó laptopot találni kevesebb, mint 300 dollárért, de megteheti, ha tudja, mit kell keresnie. Itt van minden, amit tudnia kell a vásárláshoz ... Olvass tovább a legrosszabb belső mikrofonok lesznek. Ez csak egyike azoknak a szolgáltatásoknak, amelyeket az eszközgyártók általában figyelmen kívül hagynak.

Elkezdtem diktálni ezt a cikket a MacBook Pro belső mikrofonjával. Noha a Google Docs gyakran mondta, hogy nehezen hallott engem, ez nem jelentette a lassabb vagy pontatlan diktálást. Minden jól működött.

Kipróbáltam egy drága Google Voice Typing alkalmazást is Kék Yeti külső mikrofon. Ezek olyan podcast minőségű mikrofonok, amelyek az Amazonon több mint 100 dollárért árusítanak.

Igaz, hogy a diktálás pontosságára vagy sebességére vonatkozóan nem vettem észre különbségeket. Ennek a mikrofonnak a legnagyobb előnye az volt, hogy be tudtam helyezni egy pár AKG fejhallgatót és monitorként használni őket. Ez lehetővé tette számomra, hogy jobban tudom a háttérzajt, és önbeállítsam magam, ha túl hangos vagy túl csendes vagyok.

Végső gondolatok

A Google hangfelismerése nem tökéletes. De ez aligha meglepő, hiszen a szilárd hangfelismerés elég nehéz feladat. Sokat érzem, hogy javíthatom.

Ez elsősorban arra koncentrál, hogy a szoftver hogyan működik az írásjelek és a mondat szerkezete. Egy ideális világban a Google automatikusan beszúrja az írásjeleket hangja ritmusának és ütemének alapján, ám mi egy hosszú távol tőle.

Kár, hogy ezt a szoftvert még nem sikerült bejuttatnia a Google más kínálatába, például a Gmailbe. Ideális esetben szeretném, ha a Google Voice Typing alkalmazást letöltené, és más szoftverekkel együtt felhasználná, például Az iWork oldalai Az Mac 5.0-es oldal tartalmazza az Intelligens ellenőrpanelt, de kevesebb szolgáltatástRengeteg könnyű és könnyen használható szövegszerkesztő van a Mac felhasználók számára, de az asztali kiadói funkciókat igénylő projektekhez az Apple által nemrégiben felújított oldalak továbbra is jó megoldás. Olvass tovább vagy a jelölő szerkesztő IA író iA Writer Mac és iOS számára: A legjobb szövegszerkesztő, amelyet még soha nem használtLegyen az iskolai folyóirat vagy blogbejegyzés, mindannyian valamikor abban a helyzetben vagyunk, hogy egy csomó karaktert kell letennünk egy szöveges fájlba. Míg a mobiltelefon ... Olvass tovább .

De ezek két apró bosszantás, a Google Voice Typing olyan jó, ahogy csak kap. Ezzel szemben a cikk ezt a részét az OS X beépített hangfelismerésével írtam, és ez sehol sem volt olyan pontos és gyors.

Ha ez nem arra készteti az embereket, hogy váltsanak a Google Drive-ra, nem tudom, mi fog.

Most neked! Megkísértette a Google Drive beszédfelismerése? Kipróbálta még? Mondjon nekem mindent az alábbi megjegyzésekben.

Matthew Hughes szoftverfejlesztő és író, az angliai Liverpoolból. Ritkán talál egy csésze erős fekete kávé nélkül a kezében, és teljesen imádja a MacBook Pro-t és a kameráját. A blogját a következő címen olvashatja el: http://www.matthewhughes.co.uk és kövesse őt a Twitteren a @matthewhughes oldalán.