Word sense disambiguation for Finnish with an application to language learning
Tekijät
Päivämäärä
2020Tekijänoikeudet
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Tehtävää sanan oikean merkityksen määritämiseksi automattisesti jossakin luonnollisen kielen ilmaisussa kutsutaan saneiden alamerkitysten yksiselitteistämiseksi. Tämä pro gradu -tutkielma kuvaa saneiden alamerkitysten yksiselitteistämisen itoimeenpanoa ja arviointia suomen kielelle, ja sitä motivoi tämän tehtävän uudenlainen soveltaminen tietokoneavusteiseen kielen oppimiseen. Tutkielmassa kaksikieliseen tekstitysaineistoon pohjaava sanojen alamerkitysten mukaan annotoitu korpus on luotu automattisesti palvelemaan opetusaineistona koneoppimiseen pohjautuville saneiden alamerkitysten yksiselitteistämisen tekniikoille. Seuravaksi saneiden alamerkitysten yksiselitteistämisen algoritmeja on muokattu suomen kielelle ja arvioitu niiden F1-mitan mukaan. Sen jälkeen on rakennettu sekä leksikaalinen tietämyskanta klusteroimalla ja tunnistamalla vastaavuuksia että välineet kompleksisten lekseemien poimimiseen ja analysointiin. Lopuksi on esitelty NiinMikäOli?!, tietokoneavusteinen kielen oppimisen väline, joka käyttää saneiden alamerkitysten yksiselitteistämistä uudella leksikaalisella resurssilla tarjotakseen sanojen rakenteeseen ja merkitykseen liittyvää kontekstisidonaista apua kielenoppijoille. Lisäksi on selitetty NiinMikäOli?!:n rakentamista ja käyttöliittymää ohjaavat suunnittelun periaatteet.
...
The task of automatically determining the correct meaning of a word within some natural language utterance is referred to as Word Sense Disambiguation (WSD). This thesis describes the implementation and evaluation of WSD for the Finnish language, motivated by its novel application to Computer Aided Language Learning (CALL). To serve as training data for Machine Learning (ML) based WSD techniques, a sense-annotated corpus is automatically created based on a collection of bilingual subtitles. Next, several WSD algorithms are adapted to Finnish and evaluated according to their F1-measure. Then, a Lexical Knowledge Base (LKB) is constructed by clustering and aligning existing resources, and tools to extract and analyse complex lexical units are created. Finally, TheWhatNow?!, a CALL tool which uses WSD on this new lexical resource to offer in context help related to word structure and meaning to language learners is introduced and the design principles guiding its construction and user interface are expounded.
...
Asiasanat
word sense disambiguation computer aided language learning saneiden alamerkitysten yksiselitteistäminen tietokoneavusteinen kielen oppiminen muoto-oppi (kielitiede) tietokoneavusteinen oppiminen sanasemantiikka kieli ja kielet kieliteknologia tietokonelingvistiikka suomen kieli kielen oppiminen arviointi toinen kieli morphology (grammar) computer-assisted learning lexical semantics languages language technology computer linguistics Finnish language language learning evaluation second language
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Pro gradu -tutkielmat [29545]
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
The dynamics of foreign versus second language development in Finnish writing
Tilma, Corinne (University of Jyväskylä, 2014) -
Show, Don't Tell : Visualising Finnish Word Formation in a Browser-Based Reading Assistant
Robertson, Frankie (LiU Electronic Press, 2020)This paper presents the NiinMikaOli?! reading assistant for Finnish. The focus is upon the simplified presentation and visualisation of a wide range of word-level linguistic phenomena of the Finnish language in a unified ... -
Learning to read for the first time as adult immigrants in Finland : Reviewing pertinent research of low-literate or non-literate learners’ literacy acquisition and computer-assisted literacy training
Malessa, Eva (Centre for Applied Language Studies, University of Jyväskylä, 2018)Against the backdrop of increasing global humanitarian migration to highly literate countries and the resulting necessity and challenge to provide language and literacy education to non-literate or low-literate adult second ... -
L2 English vocabulary breadth and knowledge of derivational morphology : One or two constructs?
Leontjev, Dmitri; Huhta, Ari; Tolvanen, Asko (SAGE Publications, 2023)Derivational morphology (DM) and how it can be assessed have been investigated relatively rarely in language learning and testing research. The goal of this study is to add to the understanding of the nature of DM knowledge, ... -
Video games in informal language learning : a learner perspective
Honkanen, Hanna (2024)Videopeliharrastukset ovat suuressa suosiossa kaikenikäisten kesken. Opetuksessa hyödynnetään usein opetuskäyttöön tehtyjä pelejä, kuten Kahoot!ia, mutta myös kaupallisia pelejä voidaan käyttää kielenoppimisen tukena. ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.