Skip to main content

Vad lyssnar maskin?

Maskinlyssning är bearbetning av ljud genom en dator på ett sätt som efterliknar mänsklig signalbehandling.Datorer kan programmeras och tränas för att känna igen och tolka en rad ljudingångar.Denna teknik kan tillämpas på ett brett sortiment av sätt, från intelligensanalys till studier av musik.Forskare inom detta område arbetar på privata företag, akademiska institutioner och myndigheter för att förbättra maskinens lyssningsverktyg och hitta nya applikationer.Det integrerar element i akustik, elektroteknik, robotik och signalbehandling.

För att känna igen ljud måste datorer kunna höra och bearbeta dem.De kan använda ljudupphämtningar för att hantera omgivande brus eller kan lyssna på inspelningar.Ljud kan köras genom algoritmer för att avgöra vad de är och vad de ska göra med dem.Datorsvar kan bero på deras programmering, träning och nivå av sofistikering.

Ett enkelt exempel på maskinlyssning kan ses med klappar och röstaktiverad programvara.Klappare tillåter människor att slå på och av kretsar med en handklapp som aktiverar basenheten.Programvara som svarar på röstkommandon kan göra det möjligt för människor att kontrollera det med sina röster, vilket kräver förmågan att identifiera rösten och tolka ljuden.Sådana program kan använda utbildning för att lära sig att känna igen en specifik högtalare och hantera accenter, förändringar i syntax och andra variationer mellan högtalare.

Mer komplex maskinlyssning kan användas inom områden som musik, där forskare identifierar och studerar mönster.Kriminaltekniska musikologer kan till exempel jämföra och kontrastera musik från olika källor och kan använda maskinlyssning i sitt arbete.De kan avgöra om musik verkar ha ett gemensamt ursprung eller har andra intressanta egenskaper.Denna teknik kan också användas för att studera harmoni och utveckla teorier om hur historisk musik kan ha låtit ut.

Intelligensanalys förlitar sig också på maskinlyssning.Enorma mängder ljuddata i form av telefonsamtal, diskussioner i offentliga utrymmen, och så vidare kan behöva behandlas av underrättelsebyråer.Att betala människor för att lyssna på alla ljud och utveckla rapporter kan vara dyra, och uttråkade lyssnare kan missa viktig information.Maskinlyssning kan göra det möjligt för en byrå att automatiskt bearbeta ljud för att dra ut data som kräver noggrann uppmärksamhet, baserat på nyckelord, stresstoner i röster och andra parametrar.Intelligensanalytiker kan prioritera sitt arbete på grundval av denna automatiska analys för att lyssna på ljudet som troligen är viktigt först.