Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa

Ilves, Tarmo

dc.contributor.advisor	Äkkinen, Tuomo
dc.contributor.author	Ilves, Tarmo
dc.date.accessioned	2024-06-07T07:09:04Z
dc.date.available	2024-06-07T07:09:04Z
dc.date.issued	2024
dc.identifier.uri	https://jyx.jyu.fi/handle/123456789/95628
dc.description.abstract	Tässä tutkielmassa perehdytään singulaariarvohajotelmaan sekä sen hyödyntämiseen data-analytiikan ja koneoppimisen näkökulmasta. Singulaariarvohajotelma on olemassa mille tahansa matriisille A muodossa A = UΣV^T, missä U ja V ovat ortonormaaleja matriiseja, ja Σ on diagonaalimatriisi. Matriisin Σ diagonaalialkioita kutsutaan matriisin A singulaariarvoiksi, ja ne on järjestetty suuruudeltaan laskevaan järjestykseen. Singulaariarvohajotelma ja singulaariarvot mahdollistavat erinomaisen menetelmän alkuperäisen matriisin approksimoimiseksi. Matriisilla on aina astettaan r vastaava määrä singulaariarvoja, ja valitsemalla näistä vain k < r suurinta ja asettamalla loput nolliksi saadaan Eckartin ja Youngin lauseen nojalla paras astetta k oleva approksimaatio alkuperäisestä matriisista. Alempiasteisen matriisiapproksimaation hyödyntäminen on laskentatehokkuuden lisäksi myös datan yksinkertaistamisen kannalta houkuttelevaa, etenkin kun kyseessä on approksimaatioista paras. Visuaalisin esimerkki parhaasta approksimaatiosta alempiasteisella matriisilla ilmenee tarkastelemalla digitaalisia valokuvia. Digikuvat voidaan esittää matriisimuodossa, mikä mahdollistaa singulaariarvohajotelman käytön. Suurimmat singulaariarvot sisältävät pääpiirteet alkuperäisestä kuvasta, ja pienimmät unohdettaessa saadaan alkuperäistä kuvaa muistuttava approksimaatio, joka vie vähemmän tallennustilaa riippuen valittujen singulaariarvojen määrästä. Valittava k vaikuttaa tallennustilan lisäksi kuvanlaatuun. Kuvanpakkauksen lisäksi singulaariarvohajotelmaa voidaan soveltaa digitaalisissa palveluissa kerättävän tiedon analysoimiseen, jolloin pystytään tuottamaan käyttäjille personoituja suosituksia. Suosittelujärjestelmien perusideana on tarjota mahdollisimman hyviä suosituksia käyttäjän toiminnan, kuten tuotearvostelujen perusteella. Ihmisten tekemiä arvosteluja esimerkiksi elokuvista voidaan käsitellä suurena datamatriisina, jolloin singulaariarvohajotelmaa on mahdollista käyttää. Suosittelujärjestelmän rakentamisessa puhutaan yleisesti minimointiongelmasta, jossa halutaan etsiä lähimpänä alkuperäistä datamatriisia R oleva matriisi XY, missä X kuvastaa käyttäjäpiirteitä ja Y tässä tapauksessa elokuviin liittyviä piirteitä. Koska kaikki ihmiset eivät arvostele kaikkia elokuvia, täytyy matriisin tyhjät alkiot ensin alustaa, esimerkiksi käyttäjäkohtaisilla keskiarvoilla. Alustamisella on paljon vaikutusta singulaariarvohajotelmalla saataviin approksimaatioihin ja elokuvasuosituksiin. Tyypillisesti suositusten toimivuutta testataan mallin koulutus- eli opetusjoukosta erillisellä testijoukolla, jota ei ole käytetty approksimaation tekemiseen. Approksimaation tarkkuutta voi parantaa lisäämällä alkuperäiseen minimointiongelmaan regularisointitermin, jolloin paras approksimaatio saadaan vähentämällä singulaariarvoista regularisointikerroin γ ≥ 0. Toinen numeerinen tapa on iteroimalla laskea singulaariarvohajotelma useaan kertaan, ja päivittää ainoastaan puuttuneet arvot kullakin iterointikierroksella saatavilla uusilla approksimaatioilla.	fi
dc.format.extent	56
dc.language.iso	fin
dc.rights	In Copyright
dc.subject.other	singulaariarvohajotelma
dc.subject.other	data-analytiikka
dc.subject.other	kuvanpakkaus
dc.title	Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
dc.type	master thesis
dc.identifier.urn	URN:NBN:fi:jyu-202406074390
dc.type.ontasot	Master’s thesis	en
dc.type.ontasot	Pro gradu -tutkielma	fi
dc.contributor.tiedekunta	Faculty of Sciences	en
dc.contributor.tiedekunta	Matemaattis-luonnontieteellinen tiedekunta	fi
dc.contributor.laitos	Department of Mathematics and Statistics	en
dc.contributor.laitos	Matematiikan ja tilastotieteen laitos	fi
dc.contributor.yliopisto	University of Jyväskylä	en
dc.contributor.yliopisto	Jyväskylän yliopisto	fi
dc.contributor.oppiaine	Mathematics	en
dc.contributor.oppiaine	Matematiikka	fi
dc.type.coar	http://purl.org/coar/resource_type/c_bdcc
dc.rights.accesslevel	openAccess
dc.type.publication	masterThesis
dc.contributor.oppiainekoodi	4041
dc.subject.yso	koneoppiminen
dc.subject.yso	suosittelujärjestelmät
dc.subject.yso	matematiikka
dc.subject.yso	matriisit
dc.subject.yso	approksimointi
dc.subject.yso	matriisilaskenta
dc.subject.yso	lineaarialgebra
dc.rights.url	https://rightsstatements.org/page/InC/1.0/