Dokumenttien luokittelu luonnollisen kielen prosessointimenetelmillä
Authors
Date
2020Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Tämä tutkimus käsittelee dokumenttien luokittelua luonnollisen kielen prosessoinnin menetelmillä. Tutkimuksessa esitellään vektoriavaruusmallit ja dokumentin luokittelu kolmella yleisellä ohjatun oppimisen menetelmällä. Tämän lisäksi tutkimuksessa selitetään luonnollisen kielen prosessoinnin kielitieteellistä taustaa.
Keywords
Metadata
Show full item recordCollections
- Kandidaatintutkielmat [5341]
Related items
Showing items with similar title or keywords.
-
Luonnollisen suomen kielen ymmärtäminen koneellisesti
Lehtomäki, Eerik; Kukkaniemi, Riku (2020)Tässä tutkimuksessa selvitettiin, miten luonnollisen kielen ymmärtämiseen rakennetut teknologiat soveltuvat suomen kielen käsittelyyn. Tutkimusosuuksissa selvisi, että vain harvat teknologioista tukevat suomen kieltä. ... -
Tekstin representointi katkaistulla pääakselihajotelmalla luokittelussa
Patron, Anri (2019)Tekstin representaatio on kiinteä osa luonnollisen kielen prosessointia, sillä se mahdollistaa luonnollisten kielten laskennallisen analysoinnin. Yleiset representaatiomenetelmät ovat syntaksiin perustuvia. Luonnolliseen ... -
Clustering of vocabulary for different levels of Finnish learners of EFL : a content analysis on textbooks
Kujala, Jaakko (2016)Sanaston oppiminen on keskeisimpiä edellytyksiä vieraan kielen oppimiselle, jonka vuoksi vieraiden kielten oppikirjojen tulisi panostaa erityisesti tapoihin, joilla uutta sanastoa opetetaan oppijoille. Semanttinen klusterointi, ... -
Luonnollisen kielen käsittelyn mahdollisuudet
Smolander, Kari (1988) -
Semantic versus thematic clustering of new lexical items : a textbook analysis
Kujala, Jaakko (2015)Vocabulary acquisition is an essential part of learning a second language, yet textbook designers and language educators often have difficulties with creat-ing such vocabulary acquisition exercises and materials that would ...