A hangfelismerő technológia gazdag fejlődéstörténettel rendelkezik, ami a maihoz vezetett. Ez a modern élet magja, és képességet ad arra, hogy csak egy eszközzel beszélve végezzünk feladatokat. Tehát hogyan fejlődött ez az elképesztő technológia az évek során? Lássuk.

1952: Az Audrey -rendszer

A hangfelismerés első lépése az 1950 -es évek elején történt. A Bell Laboratories 1952 -ben fejlesztette ki az első gépet, amely megértette az emberi hangot, és Audrey System nevet kapta. Az Audrey név az automatikus számjegyfelismerés kifejezés összevonása volt. Bár ez jelentős újítás volt, volt néhány jelentős korlátozása.

A legszembetűnőbb, hogy Audrey csak a 0-9 számjegyeket tudta felismerni, szavak nélkül. Audrey visszajelzést adna, ha a hangszóró mondana egy számot, 10 -ből 1 izzót felgyújtva, amelyek mindegyike egy számjegynek felel meg.

Kép jóváírása: metamorworks/Shutterstock.com

Bár Audrey 90% -os pontossággal megértette a számokat, Audrey egy bizonyos hangtípusra korlátozódott. Ez az oka annak, hogy az egyetlen személy, aki valóban használni akarta, HK Davis volt, az egyik fejlesztő. Egy szám kimondásakor a beszélőnek legalább 300 milliszekundumot kell várnia, mielőtt kimondja a következőt.

Nem csak a funkcionalitása, hanem a hasznossága is korlátozott volt. Nem sok haszna volt egy olyan gépnek, amely csak a számokat tudta megérteni. Az egyik lehetséges felhasználási mód a telefonszámok tárcsázása volt, de sokkal gyorsabb és egyszerűbb volt a számok kézi tárcsázása. Bár Audrey nem rendelkezett kecses létezéssel, mégis nagy mérföldkő az emberi teljesítményben.

Összefüggő: A hangalapú gépelés használata a Microsoft Word alkalmazásban

1962: Az IBM cipősdoboza

Egy évtizeddel Audrey után az IBM kipróbálta magát egy hangfelismerő rendszer kifejlesztésében. Az 1962 -es világkiállításon az IBM bemutatta a Showbox nevű hangfelismerő rendszert. Audreyhoz hasonlóan a fő feladata a 0-9 számjegyek megértése volt, de hat szót is megértett: plusz, mínusz, hamis, teljes, részösszeg és ki.

A Shoebox egy matematikai gép volt, amely egyszerű számtani feladatokat tud megoldani. Ami a visszajelzéseket illeti, a Shoebox fények helyett papírra tudta nyomtatni az eredményeket. Ez számítástechnikailag hasznos lett, bár a beszélőnek továbbra is szünetet kell tartania az egyes számok/szavak között.

1971: Az IBM automatikus hívásazonosítása

Audrey és a Shoebox után a világ más laboratóriumai fejlesztették ki a hangfelismerő technológiát. Azonban csak az 1970-es években indult útnak, amikor 1971-ben az IBM hozta piacra az első ilyen jellegű találmányt. Ezt hívták automatikus hívásazonosító rendszernek. Ez volt az első hangfelismerő rendszer, amelyet telefonon keresztül használtak.

A mérnökök felhívnák és csatlakoznának a számítógéphez Raleigh -ben, Észak -Karolinában. A hívó ekkor kiejtette szókincsének 5000 szavából az egyiket, és válaszként "szóbeli" választ kapott.

Összefüggő: A hangdiktálás használata Mac gépeken

1976: Harpy

A hetvenes évek elején az Egyesült Államok Védelmi Minisztériuma érdeklődött a hangfelismerés iránt. A DARPA (Defense Advanced Research Projects Agency) 1971 -ben fejlesztette ki a Speech Understanding Research (SUR) programot. Ez a program több vállalatnak és egyetemnek nyújtott finanszírozást a hangfelismerés kutatásának és fejlesztésének támogatására.

1976 -ban a SUR miatt a Carnegie Mellon Egyetem kifejlesztette a Harpy rendszert. Ez jelentős ugrás volt a hangfelismerő technológia terén. A rendszerek addig megértették a szavakat és a számokat, de Harpy egyedülálló volt abban, hogy teljes mondatokat értett.

A szókincse csak mintegy 1011 szóból állt, amely a kiadvány szerint B. Lowerre és R. Reddy, több mint ezermilliárd különböző lehetséges mondattal egyenlő. A kiadvány ezután azt állítja, hogy Harpy 93,77% -os pontossággal érthetett szavakat.

Az 1980 -as évek kulcsfontosságú időszakot jelentettek a hangfelismerő technológia számára, mivel ez az évtized a hang felismerési technológia, hiszen ez volt az az évtized, amikor megismertük a rejtett Markov -módszert (HMM). A HMM fő hajtóereje az valószínűség.

Amikor egy rendszer regisztrál egy fonémát (a beszéd legkisebb eleme), bizonyos valószínűséggel a következő lesz. A HMM ezeket a valószínűségeket használja annak meghatározására, hogy melyik fonéma következik nagy valószínűséggel legközelebb, és alkotja a legvalószínűbb szavakat. A legtöbb hangfelismerő rendszer ma is a HMM -et használja a beszéd megértéséhez.

A kilencvenes évek: A hangfelismerés eléri a fogyasztói piacot

A hangfelismerő technológia koncepciója óta utazik, hogy helyet találjon a fogyasztói piacon. A nyolcvanas években az IBM bemutatta a számítógép prototípusát, amely képes beszéd-szöveg diktálásra. Az emberek azonban csak a kilencvenes évek elején kezdték látni az ilyen alkalmazásokat otthonukban.

1990-ben a Dragon Systems bemutatta az első beszéd-szöveg diktáló szoftvert. Sárkánydiktátumnak hívták, és eredetileg Windowsra jelent meg. Ez a 9000 dolláros program forradalmi volt a hangfelismerő technológia tömegekhez való eljuttatására, de volt egy hiba. A használt szoftver diszkrét diktálás, ez azt jelenti, hogy a felhasználónak szünetet kell tartania minden szó között, hogy a program fel tudja venni.

1996 -ban az IBM ismét hozzájárult az iparághoz a Medspeak segítségével. Ez is beszéd-szöveg diktáló program volt, de nem szenvedett diszkrét diktálástól, mint a Dragon Dictate. Ehelyett ez a program folyamatos beszédet diktálhat, ami vonzóbb termékké tette.

Összefüggő: A Google Segéd használata fejhallgatóval

2010: Siri nevű lány

A 2000 -es években a hangfelismerő technológia népszerűsége robbanásszerű. Minden eddiginél több szoftverbe és hardverbe került, és a hangfelismerés fejlődésének egyik döntő lépése Siri volt, a digitális asszisztens. 2010 -ben egy Siri nevű cég bevezette a virtuális asszisztenst iOS -alkalmazásként.

Abban az időben a Siri lenyűgöző szoftver volt, amely diktálhatja az előadó mondanivalóját, és jól képzett és szellemes választ adhat. Ez a program annyira lenyűgöző volt, hogy az Apple ugyanebben az évben felvásárolta a céget, és egy kicsit átalakította Siri -t, és a ma ismert digitális asszisztens felé tolta.

A Siri az Apple -n keresztül kapta ikonikus hangját (Susan Benett hangja) és számos új funkciót. Használja természetes nyelvi feldolgozás a rendszer legtöbb funkciójának vezérlésére.

A 2010 -es évek: A nagy négy digitális asszisztens

Jelenleg négy nagy digitális asszisztens uralja a hangfelismerést és a kiegészítő szoftvereket.

  • Siri az Apple szinte minden termékében megtalálható: iPhone, iPod, iPad és Mac számítógépcsalád.
  • Google Segéd jelen van a piacon lévő 3 milliárd+ Android -eszköz nagy részén. Ezenkívül a felhasználók használhatják parancsokat számos Google -szolgáltatásban, mint a Google Home.
  • Amazon Alexa nincs sok dedikált platformja, ahol él, de mégis kiemelkedő asszisztens. Letölthető és használható Android -eszközökön, Apple -eszközökön. és még a Lenovo laptopokat is kiválaszthatja
  • Bixby a digitális asszisztens lista legújabb bejegyzése. Ez a Samsung hazai digitális asszisztense, és jelen van a vállalat telefonjai és táblagépei között.

Beszélt történelem

A hangfelismerés hosszú utat tett meg az Audrey -korszak óta. Több területen is jelentős eredményeket ért el; például szerint Clear Bridge Mobile, az orvosi terület részesült a hangvezérelt chatbotokból a 2020-as járvány idején. A hangfelismerés attól kezdve, hogy csak a számok megértésétől a teljes mondatok különböző változatainak megértéséig tart, modern korunk egyik leghasznosabb technológiájának bizonyul.

RészvényCsipogEmail
Hogyan működik a hangfelismerés?

Mindig hangfelismerést használunk, de hogyan működik?

Olvassa tovább

Kapcsolódó témák
  • Technológia magyarázata
  • Siri
  • Google Segéd
  • Alexa
  • Bixby
  • Hangutasítások
A szerzőről
Arthur Brown (31 cikk megjelent)

Arthur Amerikában élő tech újságíró és zenész. Közel egy évtizede tevékenykedik az iparban, internetes kiadványokhoz, például Android Headlines -hez írt. Mély ismeretekkel rendelkezik az Android és a ChromeOS alatt. Az információs cikkek írása mellett ügyes a technikai hírek közlésében is.

Továbbiak Arthur Brown -tól

Iratkozzon fel hírlevelünkre

Csatlakozz hírlevelünkhöz, ahol technikai tippeket, véleményeket, ingyenes e -könyveket és exkluzív ajánlatokat találsz!

Feliratkozáshoz kattintson ide