dc.contributor.advisor | Äkkinen, Tuomo | |
dc.contributor.author | Ilves, Tarmo | |
dc.date.accessioned | 2024-06-07T07:09:04Z | |
dc.date.available | 2024-06-07T07:09:04Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/95628 | |
dc.description.abstract | Tässä tutkielmassa perehdytään singulaariarvohajotelmaan sekä sen hyödyntämiseen data-analytiikan ja koneoppimisen näkökulmasta. Singulaariarvohajotelma on olemassa mille tahansa matriisille A muodossa A = UΣV^T, missä U ja V ovat ortonormaaleja matriiseja, ja Σ on diagonaalimatriisi. Matriisin Σ diagonaalialkioita kutsutaan matriisin A singulaariarvoiksi, ja ne on järjestetty suuruudeltaan laskevaan järjestykseen.
Singulaariarvohajotelma ja singulaariarvot mahdollistavat erinomaisen menetelmän alkuperäisen matriisin approksimoimiseksi. Matriisilla on aina astettaan r vastaava määrä singulaariarvoja, ja valitsemalla näistä vain k < r suurinta ja asettamalla loput nolliksi saadaan Eckartin ja Youngin lauseen nojalla paras astetta k oleva approksimaatio alkuperäisestä matriisista. Alempiasteisen matriisiapproksimaation hyödyntäminen on laskentatehokkuuden lisäksi myös datan yksinkertaistamisen kannalta houkuttelevaa, etenkin kun kyseessä on approksimaatioista paras.
Visuaalisin esimerkki parhaasta approksimaatiosta alempiasteisella matriisilla ilmenee tarkastelemalla digitaalisia valokuvia. Digikuvat voidaan esittää matriisimuodossa, mikä mahdollistaa singulaariarvohajotelman käytön. Suurimmat singulaariarvot sisältävät pääpiirteet alkuperäisestä kuvasta, ja pienimmät unohdettaessa saadaan alkuperäistä kuvaa muistuttava approksimaatio, joka vie vähemmän tallennustilaa riippuen valittujen singulaariarvojen määrästä. Valittava k vaikuttaa tallennustilan lisäksi kuvanlaatuun.
Kuvanpakkauksen lisäksi singulaariarvohajotelmaa voidaan soveltaa digitaalisissa palveluissa kerättävän tiedon analysoimiseen, jolloin pystytään tuottamaan käyttäjille personoituja suosituksia. Suosittelujärjestelmien perusideana on tarjota mahdollisimman hyviä suosituksia käyttäjän toiminnan, kuten tuotearvostelujen perusteella. Ihmisten tekemiä arvosteluja esimerkiksi elokuvista voidaan käsitellä suurena datamatriisina, jolloin singulaariarvohajotelmaa on mahdollista käyttää.
Suosittelujärjestelmän rakentamisessa puhutaan yleisesti minimointiongelmasta, jossa halutaan etsiä lähimpänä alkuperäistä datamatriisia R oleva matriisi XY, missä X kuvastaa käyttäjäpiirteitä ja Y tässä tapauksessa elokuviin liittyviä piirteitä. Koska kaikki ihmiset eivät arvostele kaikkia elokuvia, täytyy matriisin tyhjät alkiot ensin alustaa, esimerkiksi käyttäjäkohtaisilla keskiarvoilla. Alustamisella on paljon vaikutusta singulaariarvohajotelmalla saataviin approksimaatioihin ja elokuvasuosituksiin. Tyypillisesti suositusten toimivuutta testataan mallin koulutus- eli opetusjoukosta erillisellä testijoukolla, jota ei ole käytetty approksimaation tekemiseen. Approksimaation tarkkuutta voi parantaa lisäämällä alkuperäiseen minimointiongelmaan regularisointitermin, jolloin paras approksimaatio saadaan vähentämällä singulaariarvoista regularisointikerroin γ ≥ 0. Toinen numeerinen tapa on iteroimalla laskea singulaariarvohajotelma useaan kertaan, ja päivittää ainoastaan puuttuneet arvot kullakin iterointikierroksella saatavilla uusilla approksimaatioilla. | fi |
dc.format.extent | 56 | |
dc.language.iso | fin | |
dc.rights | In Copyright | |
dc.subject.other | singulaariarvohajotelma | |
dc.subject.other | data-analytiikka | |
dc.subject.other | kuvanpakkaus | |
dc.title | Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa | |
dc.type | master thesis | |
dc.identifier.urn | URN:NBN:fi:jyu-202406074390 | |
dc.type.ontasot | Master’s thesis | en |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.contributor.tiedekunta | Faculty of Sciences | en |
dc.contributor.tiedekunta | Matemaattis-luonnontieteellinen tiedekunta | fi |
dc.contributor.laitos | Department of Mathematics and Statistics | en |
dc.contributor.laitos | Matematiikan ja tilastotieteen laitos | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.oppiaine | Mathematics | en |
dc.contributor.oppiaine | Matematiikka | fi |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.rights.accesslevel | openAccess | |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 4041 | |
dc.subject.yso | koneoppiminen | |
dc.subject.yso | suosittelujärjestelmät | |
dc.subject.yso | matematiikka | |
dc.subject.yso | matriisit | |
dc.subject.yso | approksimointi | |
dc.subject.yso | matriisilaskenta | |
dc.subject.yso | lineaarialgebra | |
dc.rights.url | https://rightsstatements.org/page/InC/1.0/ | |