University of Jyväskylä | JYX Digital Repository

  • English  | Give feedback |
    • suomi
    • English
 
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
View Item 
  • JYX
  • Opinnäytteet
  • Kandidaatintutkielmat
  • View Item
JYX > Opinnäytteet > Kandidaatintutkielmat > View Item

Tekstin representointi katkaistulla pääakselihajotelmalla luokittelussa

Thumbnail
View/Open
191.1Kb

Downloads:  
Show download detailsHide download details  
Authors
Patron, Anri
Date
2019
Discipline
TietotekniikkaMathematical Information Technology
Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

 
Tekstin representaatio on kiinteä osa luonnollisen kielen prosessointia, sillä se mahdollistaa luonnollisten kielten laskennallisen analysoinnin. Yleiset representaatiomenetelmät ovat syntaksiin perustuvia. Luonnolliseen kieleen liittyy kuitenkin olennaisesti tulkinnanvaraisuutta, mikä aiheuttaa syntaktisiin representaatioihin vääristymiä. Tutkielmassa tarkastellaan tekstin representointia katkaistulla pääakselihajotelmalla luokitteluongelman näkökulmasta. Pääakselihajotelmalla approksimoimalla tekstiaineistosta voidaan löytää termien ja dokumenttien assosiatiivisten yhteyksien rakenne, jota voidaan käyttää tekstin representointiin. Menetelmällä saatavat tulokset vaikuttavat lupaavilta syntaksiin perustuviin representaatiomentelmiin verrattuna.
 
Text representation is a critical part of natural language processing and a prerequisite for any computational analysis. Popular representational methods are based on syntactic terms. However interpretability of natural language causes noise in syntactic representations. This paper evaluates the use of truncated singular value decomposition as text representation in text categorization. Singular value decomposition is used in transforming original term by document matrix into a subspace where text is represented as associations of terms and documents. Results show truncated singular value decomposition to be promising replacement for syntactic representation methods.
 
Keywords
pääakselihajotelma luokittelu representaatio luonnollinen kieli approksimointi
URI

http://urn.fi/URN:NBN:fi:jyu-201905242780

Metadata
Show full item record
Collections
  • Kandidaatintutkielmat [4029]

Related items

Showing items with similar title or keywords.

  • Naishiihtäjien representointi : suhtautumisen kuvaus 

    Rasa, Anna-Riikka (2014)
    Tässä maisterintutkielmassa tutkin suomalaisten naishiihtäjien representaatiota suhtautumisen teorian ja feminis-tisen urheilututkimuksen avulla. Tutkimukseni tavoitteena on selvittää, miten naishiihtäjiin suhtaudutaan eri ...
  • Brexitin representointi Helsingin Sanomien pääkirjoituksissa 

    Lundstedt, Hilda (2020)
    Tutkimukseni tavoitteena on selvittää, millainen kuva brexitistä muodostuu Helsingin Sanomien pääkirjoituksissa. Tähän tavoitteeseen pyrin seuraavien tutkimuskysymysten avulla: 1) Miten brexitiä representoidaan Helsingin ...
  • Tutkijoiden representointi Helsingin Sanomien tiedeuutisissa 

    Takula, Veera (2020)
    Tutkielma käsittelee sitä, miten tutkijoita representoidaan Helsingin Sanomien tiedeuutisissa. Tutkimuksen aineisto koostuu 21:stä Helsingin Sanomien tiedeuutisesta. Aineisto on kerätty lokakuusta joulukuuhun 2019. ...
  • ”Hankala tyttö” : Lisbeth Salander ja erilaisuuden representointi Stieg Larssonin Millenium -trilogiassa 

    Kulmala, Elina (2021)
    Tutkimuksessa käsitellään Lisbeth Salanderin erilaisuutta ja erilaisuuden representaatioita Stieg Larssonin tunnetussa Millennium-trilogiassa. Erilaisuuden kuvauksia lähestytään poikkitieteellisesti muun muassa kirjallisuuden-, ...
  • Naisen representointi kielellisesti teoksessa Miestä ei voi raiskata 

    Nisonen, Sanna (2000)
  • Browse materials
  • Browse materials
  • Articles
  • Conferences and seminars
  • Electronic books
  • Historical maps
  • Journals
  • Tunes and musical notes
  • Photographs
  • Presentations and posters
  • Publication series
  • Research reports
  • Research data
  • Study materials
  • Theses

Browse

All of JYXCollection listBy Issue DateAuthorsSubjectsPublished inDepartmentDiscipline

My Account

Login

Statistics

View Usage Statistics
  • How to publish in JYX?
  • Self-archiving
  • Publish Your Thesis Online
  • Publishing Your Dissertation
  • Publication services

Open Science at the JYU
 
Data Protection Description

Accessibility Statement

Unless otherwise specified, publicly available JYX metadata (excluding abstracts) may be freely reused under the CC0 waiver.
Open Science Centre