Lokaalin regressiomallin sovittaminen järjestysasteikoisille muuttujille hyödyntäen aineiston augmentaatiota
Ihmistieteissä tilastollinen tutkimusaineisto kerätään usein kyselylomakkeissa järjestysasteikollisten Likert-asteikollisten muuttujien avulla. Näin kerätty aineisto on karkeaa, eli todellinen havaintoavaruus on pyöristetty rajalliseen määrään kategorioita, ja tällainen diskreetti järjestysasteikollinen tilastoaineisto voi osoittautua ongelmalliseksi niissä tapauksissa, joissa käytettävät tilastolliset analyysimenetelmät on kehitetty jatkuville muuttujille. Yksi tällainen menetelmä on parametriton lokaali regressioanalyysi, jota voidaan hyödyntää esimerkiksi käyräviivaisten yhteyksien analysointiin.
Tutkielma ehdottaa ja testaa aineiston augmentaatioon perustuvaa menetelmää lokaalin regressioanalyysin toteuttamiseen järjestysasteikollisilla muuttujilla. Menetelmässä järjestysasteikolliset muuttujat augmentoidaan satunnaisesti tasajakaumasta arpoen jatkuviksi muuttujiksi, joille suoritetaan lokaali regressioanalyysi. Simuloimalla agmentointeja ja lokaalin regression sovituksia saadaan estimoitua keskimääräinen sovite ja sille luottamusväli. Menetelmää testataan kolmella erilaiselle generoiduille aineistoille, jotka kuvaavat erilaisia käyräviivaisia riippuvuuksia ja empiirisellä esimerkillä.
Simuloinnin tulokset osoittavat menetelmän tarkkuuden olevan kiinni eniten järjestysasteikollisten muuttujien luokkien lukumäärästä. Luokkien lukumäärän kasvaessa menetelmän tarkkuus paranee. Aineiston koko tai yhteyden funktionaalisen muodon monimutkaisuus eivät olleet niin merkittäviä tekijöitä. Empiirisen esimerkin perusteella voi päätellä, että suuri hajonta ja muuttujien vinous heikentävät myös analyysin tarkkuutta. Empiiriset aineistot voivat olla hyvin karkeita, hajonta isoa, jakaumat vinoja ja efektit pieniä. Aineiston augmentaatioon perustuva lokaalin regression menetelmä antaa kuitenkin useaan käyttötarpeeseen riittävän approksimaation käyräviivaisen yhteyden luonteesta jo viisi- tai seitsemän-luokkaisilla järjestysasteikoillisilla muuttujilla.
...
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Pro gradu -tutkielmat [29410]
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Logistisen regressiomallin selitysasteesta
Puntila, Eero (1991) -
Oppivelvollisuuslain uudistuksen vaikutusten arvioiminen kausaalimallinnusta hyödyntäen
Väisänen, Jenni (2023)Tämän pro gradu -tutkielman tarkoituksena on selvittää, onko vuoden 2021 oppivelvollisuuslain uudistuksella ollut vaikutusta nuorten opintojen jatkamiseen heti yhdeksännen luokan päätyttyä. Tutkimusongelmaa lähestytään ... -
Alueellisen kauppavirta-aineiston imputointi ja imputointimenetelmien vertailu
Vertanen, Ville (2004) -
Ennustavan analytiikan menetelmät
Takamäki, Herman (2019)Tutkielmassa on tavoitteena käydä läpi ennustemalleissa käytettyjä menetelmiä. Klusterointi-, regressio-, luokittelu- ja assosiaatiosääntömenetelmäluokkia tarkastellaan lyhyesti. Tarkempi tarkastelu kohdistetaan yksinkertaiseen ... -
Luokan työrauhaan vaikuttavat tekijät : sekamallin sovellus
Korhonen, Elisa (2017)Tämän pro gradu -tutkielman tarkoituksena oli tarkastella koululuokkien työrauhaan vaikuttavia tekijöitä. Aineistona käytettiin Niilo Mäki Instituutin Prokoulu-projektin tutkimusaineistoa. Vastemuuttujana käytettiin ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.