Čo je rozpoznávanie reči?

Používanie hlasu ako metódy vstupu

Rozpoznávanie reči je technológia, ktorá umožňuje hovorený vstup do systémov. Hovoríte s počítačom, telefónom alebo zariadením a používa to, čo ste uviedli ako vstup na spustenie nejakej akcie. Táto technológia sa používa na nahradenie iných metód zadávania ako písanie, kliknutie alebo výber inými spôsobmi. Je to spôsob, ako robiť zariadenia a softvér používateľsky príjemnejšími a zvýšiť produktivitu.

Existuje veľa aplikácií a oblastí, kde sa používa rozpoznávanie reči, vrátane vojenskej, ako pomôcka pre zhoršené osoby (predstavte si človeka so zmrzačenými alebo žiadnymi rukami alebo prstami), v lekárskej oblasti, v robotike atď. V blízkej budúcnosti, takmer všetci budú vystavení rozpoznávaniu reči vďaka ich šíreniu medzi bežnými zariadeniami, ako sú počítače a mobilné telefóny.

Niektoré smartphony robia zaujímavé používanie rozpoznávania reči. Zariadenia iPhone a Android sú príkladom toho. Prostredníctvom nich môžete zavolať na kontakt prostredníctvom jednoduchých pokynov, ako je "Call office". Ďalšie príkazy môžu byť tiež zabavené, ako napríklad "Zapnúť Bluetooth".

Problémy s rozpoznávaním reči

Rozpoznávanie reči, vo svojej verzii známej ako Speech to Text (STT), sa už dlho používa na preklad slovných slov do textu. "Rozprávaš, typuje", ako by ViaVoice povedala na svojej krabici. Existuje však jeden problém so STT, ako ho poznáme. Viac ako 10 rokov späť som sa snažil ViaVoice a netrval som týždeň v mojom počítači. Prečo? Bolo to celkom nepresné a skončila som tým, že som trávila viac času a energie hovoriť a naprávať, než písať všetko. ViaVoice je jedným z najlepších v priemysle, tak si predstavte zvyšok. Technológia dozrela a vylepšila, ale reč v texte stále spôsobuje, že ľudia kladú otázky. Jednou z jeho hlavných ťažkostí sú obrovské rozdiely medzi ľuďmi pri vyslovovaní slov.

Nie všetky jazyky sa predpokladajú v rozpoznávaní reči, a tie, ktoré robia, nie sú často podporované, rovnako ako angličtina. Výsledkom je, že väčšina zariadení, ktoré používajú softvér na rozpoznávanie reči, má primerané výsledky iba v angličtine.

Súbor hardvérových požiadaviek umožňuje rozpoznávanie reči ťažko nasadiť v určitých prípadoch. Potrebujete mikrofón, ktorý je dostatočne inteligentný, aby odfiltroval hluk pozadia, ale zároveň dostatočne výkonný na prirodzené snímanie hlasu.

Keď už hovoríme o hluku v pozadí, môže to spôsobiť zlyhanie celého systému. V dôsledku toho rozpoznávanie reči v mnohých prípadoch zlyhá kvôli zvukom, ktoré sú mimo kontroly používateľa.

Rozpoznávanie reči sa ukázalo ako lepšie ako vstupná metóda pre nové telefóny a komunikačné technológie, ako je VoIP, ako ako nástroj produktivity pre hromadné zadávanie textu.

Aplikácie rozpoznávania reči

Technológia získava popularitu v mnohých oblastiach a bola úspešná v nasledujúcich oblastiach:

- Ovládanie zariadenia. Jednoducho povedané "OK Google" na telefón s Androidom prináša systém, ktorý je všetkým ušami vašich hlasových povelov.

- systémy Bluetooth pre automobily. Mnoho automobilov je vybavených systémom, ktorý spája svoj rádiový mechanizmus s vašim smartfónom prostredníctvom technológie Bluetooth. Potom môžete uskutočňovať a prijímať hovory bez toho, aby ste sa dotýkali svojho smartfónu, a dokonca môžete vytočiť čísla iba tým, že ich budete hovoriť.

- Hlasová transkripcia. V oblastiach, kde ľudia musia písať veľa, niektoré inteligentné softvéry zachytávajú svoje hovorené slová a prepisujú ich do textu. Toto je aktuálne v niektorých softvér na spracovanie textu. Hlasový prepis pracuje aj so vizuálnou hlasovou schránkou .