dc.contributor.advisor | Pölönen, Ilkka | |
dc.contributor.advisor | Hakanen, Jussi | |
dc.contributor.author | Nummelin, Panu | |
dc.date.accessioned | 2021-06-18T07:42:14Z | |
dc.date.available | 2021-06-18T07:42:14Z | |
dc.date.issued | 2021 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/76696 | |
dc.description.abstract | Tässä tutkimuksessa etsittiin puhekomennontunnistusmallia, joka voitaisiin kouluttaa pienellä määrällä äänitteitä tunnistamaan muutamia ennalta määrättyjä tietyn henkilön komentoja. Kolmea puhujariippuvaisella datalla koulutettua neuroverkkomallia vertailtiin muun muassa tunnistustarkkuuden ja tunnistusnopeuden suhteen. Tutkimuksessa parhaitenkin suoriutunut malli todettiin liian epäluotettavaksi käytännön käyttöön. Mahdollisiksi tavoiksi parantaa mallia esitettiin muuksi kuin komennoiksi luokiteltavan äänidatan ottaminen osaksi koulutusta ja data-augmentaatio. | fi |
dc.description.abstract | In this study a speech command recognition model that could be trained with small amount of data to recognize a few predefined commands spoken by a specific person was sought. Three neural network models trained with speaker-dependent data were compared by their recognition accuracy and inference speed among other metrics. Even the best performing model of the study was deemed to be unsuitable for practical application. Integrating non-command speech data into the training process and data-augmentation were brought up as possible ways to improve the model's performance. | en |
dc.format.extent | 54 | |
dc.format.mimetype | application/pdf | |
dc.language.iso | fi | |
dc.title | Puhujariippuvainen puhekomentojentunnistus neuroverkoilla | |
dc.identifier.urn | URN:NBN:fi:jyu-202106183892 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Informaatioteknologia | fi |
dc.contributor.laitos | Information Technology | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tietotekniikka | fi |
dc.contributor.oppiaine | Mathematical Information Technology | en |
dc.rights.copyright | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. | fi |
dc.rights.copyright | This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. | en |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 602 | |
dc.subject.yso | neuroverkot | |
dc.subject.yso | puheentunnistus | |
dc.subject.yso | matemaattiset mallit | |
dc.format.content | fulltext | |
dc.type.okm | G2 | |