Näytä suppeat kuvailutiedot

dc.contributor.advisorGrahn, Tuomas
dc.contributor.authorRichterich, Nicolas
dc.date.accessioned2023-09-13T05:47:55Z
dc.date.available2023-09-13T05:47:55Z
dc.date.issued2023
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/89057
dc.description.abstractTässä tutkielmassa käsitellään puheen tuottamisen fysiikkaa ja automaattista puheentunnistamista. Tutkielma jakautuu neljään osaan, joista ensimmäisessä tutustutaan puheen fyysisiin perusteisiin lagrangelaisen mekaniikan ja termodynamiikan keinoin sekä käydään läpi pitkittäisten aaltojen seuraksena ilmeneviä akustisia ominaisuuksia fluideissa. Toisessa luvussa esitellään analogisen aaltosignaalin digitoinnin periaatteet ja tutustutaan eri muunnoksiin signaalinkäsittelyn työkaluina, jonka jälkeen syvennytään signaalin lyhytaikakäsittelyyn ja sen sovelluksiin puheenkäsittelyssä. Kolmannessa luvussa puheentuotantoa käsitellään foneettisesti lähde-suodin-mallin avulla sekä käydään läpi yksittäisten foneemien laskennallisia tunnistamismetodeja. Tutkielman neljännessä luvussa perehdytään ensin neuroverkkojen ja koneoppimisen perusteisiin, jonka jälkeen käydään läpi niille perustuvia nykyaikaisessa puheentunnistuksessa käytetyttyjä kielimalleja ja akustisia malleja. Lopuksi esitellään suomenkielinen puheentunnistumalli. Tutkielman tavoite on tutustuttaa lukija puheen aaltomekaaniseen luonteeseen sekä luoda yleiskatsaus puheentuotannon ja -tunnistamisen mekanismeihin.fi
dc.description.abstractThis thesis is concerned with the physics of speech production and the mechanisms of automatic speech recognition. The thesis is split into four parts, of which the first investigates the physical basis of speech through Lagrangian mechanics and thermodynamics and the acoustic phenomena caused by longitudinal waves in fluids. The second chapter presents the principles of analog signal discretization and examines different transformation methods as tools for signal processing, after which short-term signal processing and its applications in speech processing are delved into. In the third chapter speech production is explained with the source-filter-model of phonation and different ways of phoneme recognition are discussed. Neural networks and machine learning are presented in the fourth chapter, after which language models and acoustical models based on them are investigated. Finally, a Finnish language speech recognition model is presented. The goal of the thesis is to familiarize the reader with the wave mechanical nature of speech and to give an overview in the mechanisms of speech production and recognition.en
dc.format.extent85
dc.language.isofi
dc.rightsIn Copyrighten
dc.subject.otherpuheakustiikka
dc.titleAutomaattinen puheentunnistus ja puheen fysikaaliset perusteet
dc.typebachelor thesis
dc.identifier.urnURN:NBN:fi:jyu-202309135080
dc.type.ontasotBachelor's thesisen
dc.type.ontasotKandidaatintyöfi
dc.contributor.tiedekuntaMatemaattis-luonnontieteellinen tiedekuntafi
dc.contributor.tiedekuntaFaculty of Sciencesen
dc.contributor.laitosFysiikan laitosfi
dc.contributor.laitosDepartment of Physicsen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.oppiaineFysiikkafi
dc.contributor.oppiainePhysicsen
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.rights.accesslevelopenAccess
dc.type.publicationbachelorThesis
dc.contributor.oppiainekoodi4021
dc.subject.ysopuheteknologia
dc.subject.ysopuheentunnistus
dc.subject.ysosignaalinkäsittely
dc.subject.ysotekoäly
dc.subject.ysofonetiikka
dc.subject.ysoakustiikka
dc.subject.ysofysiikka
dc.rights.urlhttps://rightsstatements.org/page/InC/1.0/


Aineistoon kuuluvat tiedostot

Thumbnail

Aineisto kuuluu seuraaviin kokoelmiin

Näytä suppeat kuvailutiedot

In Copyright
Ellei muuten mainita, aineiston lisenssi on In Copyright