Filosofian maisteri Lauri Tavin väitöstutkimuksessa tarkasteltiin stressinalaisen puheen prosodisia ja muita foneettisia piirteitä, joita voitaisiin hyödyntää stressaantuneen puhujan tunnistamisessa puheäänestä. Tutkimusaineistona toimivat Suomessa soitetut hätäpuhelut, joissa ilmoitettiin suoraan henkeen tai terveyteen kohdistuvasta uhasta. Stressinalaisen äänen foneettisten ominaispiirteiden tutkimisessa yhdisteltiin kielitieteiden ja koneoppimisen metodologioita, mikä on ollut vielä melko harvinaista kielitieteissä.
Tutkimus osoitti, että stressin tunnistaminen hätäpuheluista on mahdollista akustisilla mittauksilla soittajan äänestä. Stressinalaisen puheen foneettisiksi indikaattoreiksi osoittautuvat muun muassa kohonneet äänen korkeus ja energiatasot ylemmissä puheen taajuuksissa sekä narinaäänenlaadun väheneminen. Osatutkimukset suomalaisista hätäpuheluista tukivat suuremmaksi osaksi aikaisempia kansainvälisiä tutkimustuloksia, mutta niissä paljastui myös uusia foneettisia erityispiirteitä kuten /i/-vokaalin ääntämisen keskittyminen suussa stressin aikana.
Hätäpuhelutallenteet ovat haaste foneettiselle ja puheteknologiselle tutkimukselle
Hätäpuhelut ovat haasteellinen aineisto akustis-foneettiselle analyysille, sillä osa puheen ylätaajuuksista on leikkautunut pois ja tallenteet sisältävät ainakin jonkin verran taustamelua. Lisäksi tallenteiden arkaluonteisuus rajoittaa niiden saantia tieteellisiin tutkimuksiin.
Hätäpuhelut ovat kuitenkin tärkeä tutkimuskohde stressin tunnistamiselle puheäänestä, sillä soittajan oletettu tunnetila on olennainen osa hätätilanteen arvioimista. Hätäpuhelut toimivat usein myös rikosaineistoina, jolloin niiden tutkiminen kuuluu forensisten puhetieteiden alaan. Esimerkiksi automaattinen puhujantunnistus hyötyy stressintunnistuksesta, sillä stressitila vaikuttaa puheääneen: puhujantunnistuksen luotettavuus kärsii, jos puhujan tunnetila on erilainen vertailtavien puhenäytteiden välillä.
Yhdistelemällä perinteisiä foneettisia ja nykyaikaisia koneoppimisen menetelmiä hätäpuheluista saadaan esiin ne akustis-foneettiset ominaispiirteet, joilla stressinalainen puhe voidaan erottaa neutraalista puheesta. Testauksessa esimerkiksi paljastui, että stressinalaisen äänen tunnistustarkkuus paranee, jos algoritmeihin syötettävät foneettiset mittaukset keskitetään vain puheen tiettyihin vokaaleihin heterogeenisten vokaaliryhmien sijaan. Myös tutkimuksissa kehitetty syviin hermoverkkoihin perustuva narinaäänen tunnistin saavutti hätäpuheluissa paremman tarkkuuden kuin eräs yleisimmin käytetyistä, mutta vanhempaa tekniikkaa hyödyntävistä narinatunnistimista.
Filosofian maisteri Lauri Tavin väitöskirja Prosodic cues of speech under stress: Phonetic exploration of Finnish emergency calls tarkastetaan Itä-Suomen yliopiston filosofisessa tiedekunnassa. Vastaväittäjänä toimii emeritaprofessori Anna-Maija Korpijaakko-Huuhka Tampereen yliopistosta ja kustoksena dosentti Stefan Werner Itä-Suomen yliopistosta.
Väitöstilaisuutta voi seurata 26.6.2020 klo 12 alkaen verkossa. Linkki ilmoitetaan myöhemmin osoitteessa https://www.uef.fi/fi/tapahtuma/fm-lauri-tavin-vaitostilaisuus-kielitiede
Väittelijän painolaatuinen kuva