Skip to main content

Vad är en akustisk modell?

En akustisk modell är i huvudsak en karta över rösten i förhållande till en serie tryckta ord.Denna teknik används i taligenkänningsprogram för att hjälpa en dator att lära sig att känna igen en persons talmönster.En akustisk modell är en av de två huvudfilerna som krävs för att köra ett taligenkänningsprogram;Den andra är språkmodellen, som indikerar troliga ord och talmönster som kan användas av talaren.Dessa modeller skapas genom att jämföra ljuddetaljer i en talad ljudfil med texten till de talade orden.

Taligenkänningsprogramvara är programvara utformad för att känna igen och transkribera eller svara på orden en person säger.Många operativsystem är utformade med inbyggda grundläggande taligenkänningsfunktioner som användaren kan slå på och av.Taligenkänningskapacitet på operativsystem ger vanligtvis användaren möjlighet att styra datorn och skriva ord på skärmen med sin röst.

För att få åtkomst till taligenkänningsprogramvara behöver en användare en mikrofon för att få sin röst till datorn, plus ett programDet bearbetar ljudet.Medan många datorer har inbyggda mikrofoner tillåter en extern headsetmikrofon användaren fördelen med tydligare röstljud och friheten att röra sig runt i rummet medan de talar.Fristående mjukvarumärken för taligenkänning inkluderar Lumenvox , Loquendo , och Dragon .

De flesta programm för taligenkänning har akustisk modellprogrammering som gör det möjligt för programmet att känna igen variationer i uttal.De använder mönster i ljudet från högtalarens röst för att identifiera ord i tal.Många är designade med installationsprogramvara för att hjälpa användaren att skapa en akustisk modell utformad för att tolka sin egen röst.Vissa avancerade taligenkänningsprogram kan identifiera och tolka flera språk, ofta med en liten mängd sund information.Ju mer avancerat ett taligenkänningsprogram är, desto mer sannolikt är det att exakt tolka ord baserat på dess sammanhang, inklusive var i en mening talas ett ord.

Studieområdet som utvecklar taligenkänningsteknik kallas beräkningslingvistik.Beräkningslingvistik involverar studier och design som skapar programvara programmerad för att förstå mänskligt tal.Detta område innehåller ofta information från studien av psykologi för att skapa akustiska modeller som mer exakt kan tolka tal.

Ordet akustiskt hänvisar i allmänhet till allt som har att göra med ljud.Även om akustiska modeller oftast används i taligenkänning, kan de också användas i musik.En akustisk modell av ett musikspår kan identifiera egenskaper som beats per minut, de musikaliska nycklarna eller dominerande tonhöjder i musiken.Denna information kan användas av ett datorprogram för att identifiera ett musikspår, eller den kan användas för att löst bestämma genren där musiken troligen kategoriseras.Akustiska modeller används också inom ett studieområde som kallas psykoakustik, där forskare hoppas lära sig att strukturera musik som förutsägbart påverkar hjärnan.