Näytä suppeat kuvailutiedot

dc.contributor.advisorCochez, Michael
dc.contributor.authorRobertson, Frankie
dc.date.accessioned2020-04-07T07:53:06Z
dc.date.available2020-04-07T07:53:06Z
dc.date.issued2020
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/68477
dc.description.abstractTehtävää sanan oikean merkityksen määritämiseksi automattisesti jossakin luonnollisen kielen ilmaisussa kutsutaan saneiden alamerkitysten yksiselitteistämiseksi. Tämä pro gradu -tutkielma kuvaa saneiden alamerkitysten yksiselitteistämisen itoimeenpanoa ja arviointia suomen kielelle, ja sitä motivoi tämän tehtävän uudenlainen soveltaminen tietokoneavusteiseen kielen oppimiseen. Tutkielmassa kaksikieliseen tekstitysaineistoon pohjaava sanojen alamerkitysten mukaan annotoitu korpus on luotu automattisesti palvelemaan opetusaineistona koneoppimiseen pohjautuville saneiden alamerkitysten yksiselitteistämisen tekniikoille. Seuravaksi saneiden alamerkitysten yksiselitteistämisen algoritmeja on muokattu suomen kielelle ja arvioitu niiden F1-mitan mukaan. Sen jälkeen on rakennettu sekä leksikaalinen tietämyskanta klusteroimalla ja tunnistamalla vastaavuuksia että välineet kompleksisten lekseemien poimimiseen ja analysointiin. Lopuksi on esitelty NiinMikäOli?!, tietokoneavusteinen kielen oppimisen väline, joka käyttää saneiden alamerkitysten yksiselitteistämistä uudella leksikaalisella resurssilla tarjotakseen sanojen rakenteeseen ja merkitykseen liittyvää kontekstisidonaista apua kielenoppijoille. Lisäksi on selitetty NiinMikäOli?!:n rakentamista ja käyttöliittymää ohjaavat suunnittelun periaatteet.fi
dc.description.abstractThe task of automatically determining the correct meaning of a word within some natural language utterance is referred to as Word Sense Disambiguation (WSD). This thesis describes the implementation and evaluation of WSD for the Finnish language, motivated by its novel application to Computer Aided Language Learning (CALL). To serve as training data for Machine Learning (ML) based WSD techniques, a sense-annotated corpus is automatically created based on a collection of bilingual subtitles. Next, several WSD algorithms are adapted to Finnish and evaluated according to their F1-measure. Then, a Lexical Knowledge Base (LKB) is constructed by clustering and aligning existing resources, and tools to extract and analyse complex lexical units are created. Finally, TheWhatNow?!, a CALL tool which uses WSD on this new lexical resource to offer in context help related to word structure and meaning to language learners is introduced and the design principles guiding its construction and user interface are expounded.en
dc.format.extent191
dc.format.mimetypeapplication/pdf
dc.language.isoen
dc.subject.otherword sense disambiguation
dc.subject.othercomputer aided language learning
dc.subject.othersaneiden alamerkitysten yksiselitteistäminen
dc.subject.othertietokoneavusteinen kielen oppiminen
dc.titleWord sense disambiguation for Finnish with an application to language learning
dc.identifier.urnURN:NBN:fi:jyu-202004072692
dc.type.ontasotPro gradu -tutkielmafi
dc.type.ontasotMaster’s thesisen
dc.contributor.tiedekuntaInformaatioteknologian tiedekuntafi
dc.contributor.tiedekuntaFaculty of Information Technologyen
dc.contributor.laitosInformaatioteknologiafi
dc.contributor.laitosInformation Technologyen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.oppiaineTietotekniikkafi
dc.contributor.oppiaineMathematical Information Technologyen
dc.rights.copyrightJulkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.fi
dc.rights.copyrightThis publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.en
dc.type.publicationmasterThesis
dc.contributor.oppiainekoodi602
dc.subject.ysomuoto-oppi (kielitiede)
dc.subject.ysotietokoneavusteinen oppiminen
dc.subject.ysosanasemantiikka
dc.subject.ysokieli ja kielet
dc.subject.ysokieliteknologia
dc.subject.ysotietokonelingvistiikka
dc.subject.ysosuomen kieli
dc.subject.ysokielen oppiminen
dc.subject.ysoarviointi
dc.subject.ysotoinen kieli
dc.subject.ysomorphology (grammar)
dc.subject.ysocomputer-assisted learning
dc.subject.ysolexical semantics
dc.subject.ysolanguages
dc.subject.ysolanguage technology
dc.subject.ysocomputer linguistics
dc.subject.ysoFinnish language
dc.subject.ysolanguage learning
dc.subject.ysoevaluation
dc.subject.ysosecond language
dc.format.contentfulltext
dc.type.okmG2


Aineistoon kuuluvat tiedostot

Thumbnail

Aineisto kuuluu seuraaviin kokoelmiin

Näytä suppeat kuvailutiedot