dc.contributor.advisor | Äyrämö, Sami | |
dc.contributor.advisor | Jauhiainen, Susanne | |
dc.contributor.author | Toivanen, Ida | |
dc.date.accessioned | 2022-06-07T10:17:16Z | |
dc.date.available | 2022-06-07T10:17:16Z | |
dc.date.issued | 2022 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/81526 | |
dc.description.abstract | Tekstin luokitteluun on olemassa laaja tutkimuksen kirjo, mutta vain osa siitä on puoliohjattujen syvien neuroverkkojen pohjalta tehtyä – etenkin, kun opetusaineisto on ollut englannin kielellä, tai muulla huomattavan paljon tutkitulla kielellä. Tässä pro gradussa käymme läpi puoliohjattujen syväoppimismenetelmien kirjallisuutta tekstin luokittelussa, ja luomme käytännön toteutuksen kolmelle puoliohjatulle tekstin luokittelumenetelmälle. Nämä menetelmät opetetaan ja testataan pienenpuoleisella, suomenkielisellä aineistolla. Tulosten perusteella voitaisiin sanoa, että puoliohjattujen menetelmien yhteydessä on kannattavaa käyttää regularisointimenetelmiä ylisovittumisen ehkäisemiseksi, varsinkin kun opetusaineisto on pieni. Jotta voitaisiin saada kokonaisvaltaisempi kuva eri puoliohjattujen menetelmien kannattavuudesta ja luotettavuudesta luonnollisen kielen luokittelutehtävässä, olisi suomenkielisistä syväoppimismalleista ja regularisoinnista hyvä tehdä lisää tutkimusta. | fi |
dc.description.abstract | There exists extensive research for text classification, but only a handful of it is put into practice by deep neural networks that use semi-supervised learning – especially when semi-supervised deep neural networks are not trained in English, or other majorly studied languages. In this thesis we go through previous literature regarding semi-supervised deep learning methods for text classification, and then build a hands-on solution for three semi-supervised text classification methods. These methods are trained and tested on a small dataset, that is in Finnish. The results suggest that regularization methods should be taken into consideration when using semi-supervised methods for training – particularly when using smaller datasets that easily leads to overfitting. More research on regularization and Finnish deep learning models should be conducted to have a more comprehensive view on the applicability and reliability of text classification in natural language processing. | en |
dc.format.extent | 63 | |
dc.format.mimetype | application/pdf | |
dc.language.iso | en | |
dc.subject.other | natural language processing | |
dc.subject.other | text classification | |
dc.subject.other | semi-supervised learning | |
dc.title | Semi-supervised deep learning for the classification of eldercare workers’ sentiments | |
dc.identifier.urn | URN:NBN:fi:jyu-202206073142 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Informaatioteknologia | fi |
dc.contributor.laitos | Information Technology | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tietotekniikka | fi |
dc.contributor.oppiaine | Mathematical Information Technology | en |
dc.rights.copyright | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. | fi |
dc.rights.copyright | This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. | en |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 602 | |
dc.subject.yso | koneoppiminen | |
dc.subject.yso | syväoppiminen | |
dc.subject.yso | machine learning | |
dc.subject.yso | deep learning | |
dc.format.content | fulltext | |
dc.type.okm | G2 | |