dc.contributor.author | Ahtinen, Suvi | |
dc.date.accessioned | 2020-06-18T06:40:49Z | |
dc.date.available | 2020-06-18T06:40:49Z | |
dc.date.issued | 2020 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/70059 | |
dc.description.abstract | Tässä tutkielmassa sovelletetaan k:n prototyypin ryhmittelymenetelmää aineistoon,
joka perustuu peruskoulun ja toisen asteen oppilaitosten henkilökunnan mielipidekyselyyn omasta työhyvinvoinnistaan. Menetelmä on valittu, koska sen avulla voidaan ryhmitellä aineistoa yksilöiden välisten vastauksien samankaltaisuuksien perusteella ja huomioida aineiston kategoriset sekä jatkuvat muuttujat. Aineisto sisältää runsaasti puuttuvaa tietoa, joten ryhmittely toteutetaan täydellisesti havaitun aineiston lisäksi moniimputoituihin aineistoihin.
Moni-imputoinnissa muodostetaan iteratiivisesti viisi eri aineistoa, joihin tehdään ryhmittely ja vertaillaan ryhmille muodostuneita keskustojen keskiarvoja. Imputoitavalle vastemuuttujalle valitaan sopivat selittävät muuttujat,
jotka sisältävät vähintään 50 prosenttia havaittuja arvoja ja korreloivat vastemuuttujan kanssa.
Ryhmittelyanalyysiin valitaan 70 mielipidekysymyksestä 22 kysymystä tulosten raportoinnin selkeyttämiseksi. Valinnassa käytettävän algoritmin avulla etsitään muuttujia, joissa voidaan havaita klusteroitumista. Aineistosta on valittu myös kaksi taustamuuttujaa: ikä ja työvuodet. Tällöin voidaan tarkastella myös työhyvinvointiin vaikuttavien taustatekijöiden ryvästymistä.
Ennen ryhmittelymenetelmän suorittamista valitaan, kuinka moneen ryhmään havainnot lajitellaan. Valinta tehdään sisäisten validointikriteerien indeksien
avulla. Tässä tutkielmassa esitellään neljä yleisesti käytettyä indeksiä, joista Davies–Bouldin- ja Calinski–Harabasz-indeksien perusteella aineistoon
sopii kaksi ryhmää. Lisäksi esitellään ulkoinen Rand-indeksi, jonka avulla voidaan tutkia täydellisesti havaitun ja moni-imputoitujen aineistojen ryhmittelyiden
yhtäläisyyksiä.
Kahteen klusteriin ryhmitellystä moni-imputoidusta sekä täydellisesti havaitun aineiston tuloksista voidaan todeta ensimmäisen klusterin sisältävän negatiivisesti työhyvinvoinnistaan ajattelevia, jotka kokevat itsensä myös väsyneeksi ja stressaantuneeksi. Toinen klusteri taas sisältää enemmän positiivisesti työhyvinvoinnistaan ajattelevia, jotka kokevat väsymystä ja stressiä
vähemmän, sekä ovat työskennelleet vähemmän aikaa samassa koulussa kuin ensimmäisen klusterin henkilöt. | fi |
dc.format.extent | 53 | |
dc.format.mimetype | application/pdf | |
dc.language.iso | fi | |
dc.rights | In Copyright | en |
dc.subject.other | ryhmittelymenetelmä | |
dc.subject.other | koulun hyvinvointiprofiili | |
dc.subject.other | moni-imputointi | |
dc.title | K:n prototyypin ryhmittelymenetelmän ja moni-imputoinnin sovellus työhyvinvointiaineistoon | |
dc.type | master thesis | |
dc.identifier.urn | URN:NBN:fi:jyu-202006184270 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Matemaattis-luonnontieteellinen tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Sciences | en |
dc.contributor.laitos | Matematiikan ja tilastotieteen laitos | fi |
dc.contributor.laitos | Department of Mathematics and Statistics | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tilastotiede | fi |
dc.contributor.oppiaine | Statistics | en |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 4043 | |
dc.subject.yso | klusterit | |
dc.subject.yso | työhyvinvointi | |
dc.subject.yso | tilastotiede | |
dc.format.content | fulltext | |
dc.rights.url | https://rightsstatements.org/page/InC/1.0/ | |
dc.type.okm | G2 | |