Glavni tehnologija

Tehnologija prepoznavanja govora

Tehnologija prepoznavanja govora
Tehnologija prepoznavanja govora

Video: InfostudHub Webinar: Govorne tehnologije na srpskom jeziku 2024, Julij

Video: InfostudHub Webinar: Govorne tehnologije na srpskom jeziku 2024, Julij
Anonim

Prepoznavanje govora, sposobnost naprav, da se odzivajo na govorjene ukaze. Prepoznavanje govora omogoča prostoročno nadziranje različnih naprav in opreme (kar je posebna blagodeja za mnoge invalide), omogoča vnos v samodejno prevajanje in ustvarja narekovanje, pripravljeno za tiskanje. Med najzgodnejšimi aplikacijami za prepoznavanje govora so bili avtomatizirani telefonski sistemi in programska oprema za medicinsko narekovanje. Pogosto se uporablja za narekovanje, za poizvedovanje po bazah podatkov in za dajanje ukazov računalniško podprtim sistemom, zlasti v poklicih, ki se opirajo na specializirane besednike. Omogoča tudi osebne pomočnike pri vozilih in pametnih telefonih, kot je Apple Siri.

Preden lahko kateri koli stroj razlaga govor, mora mikrofon prevesti vibracije človekovega glasu v valovit električni signal. Ta signal pretvori strojna oprema sistema - na primer računalniška zvočna kartica - v digitalni signal. Digitalni signal program za prepoznavanje govora analizira z namenom prepoznavanja ločenih fonemov, osnovnih gradnikov govora. Fonemi se nato rekombinirajo v besede. Vendar pa se mnoge besede slišijo podobno, in za izbiro ustrezne besede se mora program zanašati na kontekst. Številni programi vzpostavijo kontekst s pomočjo trigramske analize, metode, ki temelji na zbirki podatkov o pogostih trojezičnih grozdih, v katerih so dodeljene verjetnosti, da bo katerikoli besedi sledila tretja beseda. Na primer, če govornik reče "kdo sem", bo naslednja beseda prepoznana kot izgovornik "jaz" in ne podobno zveneč, a manj verjetno "oko". Kljub temu je včasih potreben človeški poseg za odpravo napak.

Programi za prepoznavanje nekaj izoliranih besed, na primer telefonski govorni navigacijski sistem, delujejo za skoraj vsakega uporabnika. Po drugi strani pa morajo biti nenehni govorni programi, kot so narečni programi, usposobljeni za prepoznavanje posameznikovih govornih vzorcev; vadba vključuje, da uporabnik bere glasne vzorce besedila. Danes se je z naraščajočo močjo osebnih računalnikov in mobilnih naprav natančnost prepoznavanja govora znatno izboljšala. Stopnje napak so v besednjakih, ki vsebujejo več deset tisoč besed, znižane na približno 5 odstotkov. Še večja natančnost je dosežena v omejenih besediščih za specializirane aplikacije, kot je narekovanje radioloških diagnoz.