Skip to main content

Vad är ljudtranskription?

Ljudtranskription är processen att ta talade ord och göra dem till skriftlig text.Tidigare skulle en person sitta och skriva ord när de talades.Nu finns ljudinspelningar av olika typer och flera transkriptionsmetoder.Analoga och digitala inspelningsmetoder gör det möjligt för en person som inte finns under samtalet för att fortfarande transkribera texten.Dessutom kommer många programvarupaket att läsa ljudfiler och konvertera dem snabbt till text utan att behöva spela dem.

Under många år var ljudtranskription ett specialiserat och tråkigt yrke.Människor som transkriberade tal måste vara närvarande vid tidpunkten för att tala, vilket ofta innebär att företag skulle behöva anställa människor utbildade i avancerade tekniker som korthet.Detta begränsade också transkriptionstjänster till dem som hade tillgång till en utbildad transkriberare.

Med uppfinningen av ljudinspelningar förändrades detta fält dramatiskt.Med en inspelning kunde transkriberaren arbeta var som helst där inspelningen kunde levereras.Dessutom behövdes transkription inte längre korthet eftersom inspelningen kunde vändas och lyssnas på flera gånger.En enda transkriberare kunde också arbeta för en mängd klienter samtidigt, eftersom hon inte längre behövde vara närvarande för talarna.

Med ökningen av datoranvändning och internethastigheter förblev fältet för ljudtranskription i stort sett detsamma.Filer, snarare än band, mailades ofta istället för att skickas med normal post.Processens hastighet ökade, men metoderna gjorde det inte.

Detta förändrades i slutet av 90 -talet med den ökande användningen av taligenkänning och diktatprogramvara.Jobbet med att transkribera gick mer och mer mot datorhjälp och sedan full automatisering.Programvarupaket kom ut som kunde läsa informationen i en ljudfil och använda högtalarens vågmönster för att bygga en textversion av ett tal.Detta skulle ta några sekunder snarare än protokollet eller timmarna för en mänsklig transkription.

Dator-automatiserad ljudtranskription har några brister som är svåra att övervinna, varav den största är en relativ brist på korrigerande tal.När en mänsklig transkriberare lyssnar på text kan hon korrigera små fel i talet för att göra det mer läsbart.Medan viss transkription är ordlig, vilket betyder att det är exakt vad personen sa, är de flesta inte.Utan korrigerande tal måste en människa ofta kontrollera transkriptionen för fel innan den används.

Den andra gemensamma bristen på datorbaserad ljudtranskription ligger i själva talets tal.Eftersom människor har ett stort utbud av toner och mönster när de talar, är det exceptionellt svårt att skapa ett datorprogram som exakt kan läsa och översätta hela sortimentet.Detta innebär att ett visst fel är vanligt i nästan all transkriptionsprogramvara.Det vanligaste sättet att arbeta runt denna brist är genom lärt tal, där programmet och en enda talare arbetar tillräckligt tillsammans för att programmet fokuserar på enskilda personens mönster.