K:n prototyypin ryhmittelymenetelmän ja moni-imputoinnin sovellus työhyvinvointiaineistoon
Tässä tutkielmassa sovelletetaan k:n prototyypin ryhmittelymenetelmää aineistoon,
joka perustuu peruskoulun ja toisen asteen oppilaitosten henkilökunnan mielipidekyselyyn omasta työhyvinvoinnistaan. Menetelmä on valittu, koska sen avulla voidaan ryhmitellä aineistoa yksilöiden välisten vastauksien samankaltaisuuksien perusteella ja huomioida aineiston kategoriset sekä jatkuvat muuttujat. Aineisto sisältää runsaasti puuttuvaa tietoa, joten ryhmittely toteutetaan täydellisesti havaitun aineiston lisäksi moniimputoituihin aineistoihin.
Moni-imputoinnissa muodostetaan iteratiivisesti viisi eri aineistoa, joihin tehdään ryhmittely ja vertaillaan ryhmille muodostuneita keskustojen keskiarvoja. Imputoitavalle vastemuuttujalle valitaan sopivat selittävät muuttujat,
jotka sisältävät vähintään 50 prosenttia havaittuja arvoja ja korreloivat vastemuuttujan kanssa.
Ryhmittelyanalyysiin valitaan 70 mielipidekysymyksestä 22 kysymystä tulosten raportoinnin selkeyttämiseksi. Valinnassa käytettävän algoritmin avulla etsitään muuttujia, joissa voidaan havaita klusteroitumista. Aineistosta on valittu myös kaksi taustamuuttujaa: ikä ja työvuodet. Tällöin voidaan tarkastella myös työhyvinvointiin vaikuttavien taustatekijöiden ryvästymistä.
Ennen ryhmittelymenetelmän suorittamista valitaan, kuinka moneen ryhmään havainnot lajitellaan. Valinta tehdään sisäisten validointikriteerien indeksien
avulla. Tässä tutkielmassa esitellään neljä yleisesti käytettyä indeksiä, joista Davies–Bouldin- ja Calinski–Harabasz-indeksien perusteella aineistoon
sopii kaksi ryhmää. Lisäksi esitellään ulkoinen Rand-indeksi, jonka avulla voidaan tutkia täydellisesti havaitun ja moni-imputoitujen aineistojen ryhmittelyiden
yhtäläisyyksiä.
Kahteen klusteriin ryhmitellystä moni-imputoidusta sekä täydellisesti havaitun aineiston tuloksista voidaan todeta ensimmäisen klusterin sisältävän negatiivisesti työhyvinvoinnistaan ajattelevia, jotka kokevat itsensä myös väsyneeksi ja stressaantuneeksi. Toinen klusteri taas sisältää enemmän positiivisesti työhyvinvoinnistaan ajattelevia, jotka kokevat väsymystä ja stressiä
vähemmän, sekä ovat työskennelleet vähemmän aikaa samassa koulussa kuin ensimmäisen klusterin henkilöt.
...
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29740]
License
Related items
Showing items with similar title or keywords.
-
Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
Lehtonen, Eero (2014)Tutkielmassa on tarkoitus selvittää vesimuodostumien kunnostustarvetta logistisella regressiomallilla. Vaste eli kunnostustarve on muunnos alkuperäisen aineiston viisiportaisesta ekologinen tila -muuttujasta. Haluttiin ... -
Analysis and evaluation of cell imputation
Horppu, Ismo (University of Jyväskylä, 2008) -
Moni-imputoinnin ja sekamallien sovellus Liikkuva koulu -aineistoon : kyselylomakkeella ja mittarilla mitatun liikunnan ero
Pesonen, Pinja (2018)Tämän pro gradu -tutkielman tarkoituksena oli etsiä mahdollisia taustatekijöitä, jotka vaikuttavat lasten ja nuorten itsearvioidun liikunnan määrän ali- tai yliarvioimiseen. Aineistona käytettiin maanlaajuisen Liikkuva ... -
Peruskoululaisten yhteiskunnallisen osaamisen estimointi sekamallilla : sovellus ICCS 2009 -aineistoon
Huttu, Tuomo (2013)Nuorten yhteiskunnallisia tietoja ja eri yhteiskunnallisten ilmiöiden ymmärtämistä, samoin kuin kansalaisuuteen ja yhteiskunnassa toimimiseen liittyviä asenteita tutkimalla voidaan selvittää kansalaisyhteiskunnan tulevaisuuden ...