K:n prototyypin ryhmittelymenetelmän ja moni-imputoinnin sovellus työhyvinvointiaineistoon
Abstract
Tässä tutkielmassa sovelletetaan k:n prototyypin ryhmittelymenetelmää aineistoon,
joka perustuu peruskoulun ja toisen asteen oppilaitosten henkilökunnan mielipidekyselyyn omasta työhyvinvoinnistaan. Menetelmä on valittu, koska sen avulla voidaan ryhmitellä aineistoa yksilöiden välisten vastauksien samankaltaisuuksien perusteella ja huomioida aineiston kategoriset sekä jatkuvat muuttujat. Aineisto sisältää runsaasti puuttuvaa tietoa, joten ryhmittely toteutetaan täydellisesti havaitun aineiston lisäksi moniimputoituihin aineistoihin.
Moni-imputoinnissa muodostetaan iteratiivisesti viisi eri aineistoa, joihin tehdään ryhmittely ja vertaillaan ryhmille muodostuneita keskustojen keskiarvoja. Imputoitavalle vastemuuttujalle valitaan sopivat selittävät muuttujat,
jotka sisältävät vähintään 50 prosenttia havaittuja arvoja ja korreloivat vastemuuttujan kanssa.
Ryhmittelyanalyysiin valitaan 70 mielipidekysymyksestä 22 kysymystä tulosten raportoinnin selkeyttämiseksi. Valinnassa käytettävän algoritmin avulla etsitään muuttujia, joissa voidaan havaita klusteroitumista. Aineistosta on valittu myös kaksi taustamuuttujaa: ikä ja työvuodet. Tällöin voidaan tarkastella myös työhyvinvointiin vaikuttavien taustatekijöiden ryvästymistä.
Ennen ryhmittelymenetelmän suorittamista valitaan, kuinka moneen ryhmään havainnot lajitellaan. Valinta tehdään sisäisten validointikriteerien indeksien
avulla. Tässä tutkielmassa esitellään neljä yleisesti käytettyä indeksiä, joista Davies–Bouldin- ja Calinski–Harabasz-indeksien perusteella aineistoon
sopii kaksi ryhmää. Lisäksi esitellään ulkoinen Rand-indeksi, jonka avulla voidaan tutkia täydellisesti havaitun ja moni-imputoitujen aineistojen ryhmittelyiden
yhtäläisyyksiä.
Kahteen klusteriin ryhmitellystä moni-imputoidusta sekä täydellisesti havaitun aineiston tuloksista voidaan todeta ensimmäisen klusterin sisältävän negatiivisesti työhyvinvoinnistaan ajattelevia, jotka kokevat itsensä myös väsyneeksi ja stressaantuneeksi. Toinen klusteri taas sisältää enemmän positiivisesti työhyvinvoinnistaan ajattelevia, jotka kokevat väsymystä ja stressiä
vähemmän, sekä ovat työskennelleet vähemmän aikaa samassa koulussa kuin ensimmäisen klusterin henkilöt.
Main Author
Format
Theses
Master thesis
Published
2020
Subjects
The permanent address of the publication
https://urn.fi/URN:NBN:fi:jyu-202006184270Use this for linking
Language
Finnish