Dokumenttien luokittelu luonnollisen kielen prosessointimenetelmillä
Tekijät
Päivämäärä
2020Tekijänoikeudet
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Tämä tutkimus käsittelee dokumenttien luokittelua luonnollisen kielen prosessoinnin menetelmillä. Tutkimuksessa esitellään vektoriavaruusmallit ja dokumentin luokittelu kolmella yleisellä ohjatun oppimisen menetelmällä. Tämän lisäksi tutkimuksessa selitetään luonnollisen kielen prosessoinnin kielitieteellistä taustaa.
Asiasanat
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Kandidaatintutkielmat [5329]
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Luonnollisen suomen kielen ymmärtäminen koneellisesti
Lehtomäki, Eerik; Kukkaniemi, Riku (2020)Tässä tutkimuksessa selvitettiin, miten luonnollisen kielen ymmärtämiseen rakennetut teknologiat soveltuvat suomen kielen käsittelyyn. Tutkimusosuuksissa selvisi, että vain harvat teknologioista tukevat suomen kieltä. ... -
Tekstin representointi katkaistulla pääakselihajotelmalla luokittelussa
Patron, Anri (2019)Tekstin representaatio on kiinteä osa luonnollisen kielen prosessointia, sillä se mahdollistaa luonnollisten kielten laskennallisen analysoinnin. Yleiset representaatiomenetelmät ovat syntaksiin perustuvia. Luonnolliseen ... -
Clustering of vocabulary for different levels of Finnish learners of EFL : a content analysis on textbooks
Kujala, Jaakko (2016)Sanaston oppiminen on keskeisimpiä edellytyksiä vieraan kielen oppimiselle, jonka vuoksi vieraiden kielten oppikirjojen tulisi panostaa erityisesti tapoihin, joilla uutta sanastoa opetetaan oppijoille. Semanttinen klusterointi, ... -
Luonnollisen kielen käsittelyn mahdollisuudet
Smolander, Kari (1988) -
Semantic versus thematic clustering of new lexical items : a textbook analysis
Kujala, Jaakko (2015)Vocabulary acquisition is an essential part of learning a second language, yet textbook designers and language educators often have difficulties with creat-ing such vocabulary acquisition exercises and materials that would ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.