dc.contributor.advisor | Saarela, Mirka | |
dc.contributor.author | Ahonen, Eemil | |
dc.date.accessioned | 2023-06-16T06:25:09Z | |
dc.date.available | 2023-06-16T06:25:09Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/87849 | |
dc.description.abstract | Tämän Pro gradu -tutkielman tavoitteena on tutkia takaisinkytkettyjen neuroverkkojen (RNN) käyttöä luonnollisen kielen generointiin pienillä tietoaineistoilla. Pieni tietoaineisto luodaan keräämällä tekstiä laulun sanoista, ja kaksi mallia, sanatason RNN ja merkkitason RNN, rakennetaan luonnollisen kielen generoimista varten. Mallien suorituskykyä verrataan generoidun tekstin laadun ja tulosteen monimuotoisuuden perusteella ja tarkastellaan eri hyperparametrien vaikutusta mallien suorituskykyyn. Havaitaan, että sanatason RNN luo koherentimpaa tekstiä kuin merkkitason RNN malli. | fi |
dc.description.abstract | This thesis studies the use of recurrent neural networks (RNNs) for natural language generation on small datasets. A small dataset is created by collecting text on song lyrics, and two models, a word-level RNN and a character-level RNN, are built for natural language generation. The performance of the models is compared based on the quality of generated text and the diversity of the output, and the impact of different hyperparameters on the models' performance is explored. Word-level model is found to outperform the character-level model in generating coherent sentences. | en |
dc.format.extent | 46 | |
dc.language.iso | en | |
dc.rights | In Copyright | |
dc.subject.other | natural language processing | |
dc.subject.other | recurrent neural network | |
dc.title | Natural language generation methods on small datasets | |
dc.identifier.urn | URN:NBN:fi:jyu-202306163904 | |
dc.type.ontasot | Master’s thesis | en |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Informaatioteknologia | fi |
dc.contributor.laitos | Information Technology | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tietotekniikka | fi |
dc.contributor.oppiaine | Mathematical Information Technology | en |
dc.rights.copyright | © The Author(s) | |
dc.rights.accesslevel | restrictedAccess | |
dc.contributor.oppiainekoodi | 602 | |
dc.subject.yso | neuroverkot | |
dc.subject.yso | luonnollinen kieli | |
dc.subject.yso | neural networks (information technology) | |
dc.subject.yso | natural language | |
dc.rights.url | https://rightsstatements.org/page/InC/1.0/ | |
dc.rights.accessrights | The author has not given permission to make the work publicly available electronically. Therefore the material can be read only at the archival workstation at Jyväskylä University Library (https://kirjasto.jyu.fi/collections/archival-workstation). | en |
dc.rights.accessrights | Tekijä ei ole antanut lupaa avoimeen julkaisuun, joten aineisto on luettavissa vain Jyväskylän yliopiston kirjaston arkistotyösemalta. Ks. https://kirjasto.jyu.fi/kokoelmat/arkistotyoasema.. | fi |