Kansainvälisten koulutusarvioiden vertailu koulutuksellisen tiedonlouhinnan keinoin
Koulutusta ja eri ikäisten lasten akateemista suorituskykyä mittaavat tutkimustulokset ovat kiinnostavaa tarkasteltavaa monien alojen työntekijöille ja tutkijoille. Nykyään monet organisaatiot, kuten OECD (Organisation for Economic Co-operation and Development) ja IEA (International Association for the Evaluation of Educational Achievement), järjestävät tietyin aikavälein kansainvälisiä mittauksia, joissa mitataan tietyn ikäisten lasten akateemisia kykyjä ja kysellään heidän elämästään koulussa ja kotona. Näistä mittauksista syntyvät tietokannat ovat suuria ja ne tarjoavat monipuolista tietoa koulutuksesta ja lasten oppimiseen vaikuttavista tekijöistä. Kaiken tämän lisäksi, nämä tietokannat ovat vapaassa käytössä tutkijoille, mikä puolestaan lisää tietokantojen käytettävyyttä tutkimuksen kentällä.
Mitä suuremmaksi tietokannat kasvavat, sitä suuremmalla todennäköisyydellä ne sisältävät tietoa, joka ei paljastu vain datan perinteisellä silmäilyllä tai listauksella. Tällaisten koulutuksellista tietoa sisältävien tietokantojen tutkimiseksi on viimeisten 20 vuoden aikana kehitetty monenlaisia menetelmiä ja työkaluja, joita yhdessä kutsutaan koulutukselliseksi tiedonlouhinnaksi. Koulutuksellisen tiedonlouhinnan tarkoituksena on yleensä löytää tietokannasta uutta tietoa tai tiivistää sen tulokset. Koulutuksellisen tiedonlouhinnan avulla tutkijat ovat onnistuneet löytämään koulutukseen liittyvistä tietokannoista monenlaista kiinnostavaa tietoa, jonka pohjalta ollaan pyritty mm. ennustamaan opiskelijoiden menestystä heidän aikaisempien suoritustensa pohjalta ja etsimään vahvistusta maakohtaisille stereotyypeille.
Tässä tutkimuksessa sovellan K-means++ -klusterointialgoritmia vuoden 2012 PISA-aineistoon ja vuoden 2011 yhdistettyyn TIMSS ja PIRLS -aineistoon ja tarkastelen, löytyisikö niistä keskenään samanlaisia oppilasprofiileja. Pitääkseni tutkimuksen pro gradu -tutkielman rajoissa käytän tutkimuksessani vain suomalaisista oppilaista ja kouluista kerättyä dataa. Klusteroinnin tuloksena muodostuneet oppilasprofiilit olivat aineistojen välillä erilaisia, mutta jakoivat keskenään joitakin samoja piirteitä, paljastaen koko tutkimusalan näkökulmasta uutta tietämystä.
...
Research data about education and academic abilities of students of all ages has been an interesting subject for many people in different areas of work. These days there are many organizations, like OECD (Organisation for Economic Co-operation and Development) and IEA (International Association for the Evaluation of Educational Achievement), that organize international measurements of academic skills of children of certain ages on a certain time frame. The databases of these measurements are huge and they can offer versatile knowledge about the education systems and things that can affect student’s ability to learn. On top of that, some of these databases are free to use for the public, increasing their usability in the field of research.
The bigger the databases get, the more likely it is for them to contain information that’s not visible with just looking at the results or ranking them. During the past twenty years many methods and tools has been developed to analyze these kind of education oriented databases. All together these kind of methods and tools are called educational data mining. Usually the aim of educational data mining research is to either find new information from the used databases or to summarize the findings. Using educational data mining, researchers have managed to find out all kind of interesting information from the educational databases. Ranging from making predictions on students performance according their past results to figuring out if country stereotypes exists amongst PISA-data.
In this study I’m going to apply K-means++ clustering algorithm to the PISA 2012 database and the unified TIMSS and PIRLS 2011 database in order to test if similar student profiles can be found from them. In order to keep the study in the frames of a master’s thesis, I’m going to focus only on the Finnish student results. The student profiles formed with the clustering were different between datasets, but they shared some features between each other and revealed some new knowledge to the field of research.
...
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29564]
Related items
Showing items with similar title or keywords.
-
Exploring the differences of Finnish students in PISA 2003 and 2012 using educational data mining
Koskela, Anu (2016)Suomi on aina saanut hyviä tuloksia PISA-tutkimuksissa, mutta vuonna 2012 tulokset huononivat merkittävästi. Vuosien 2003 ja 2012 aineistoihin sovellettiin muokattua tiedonlouhinta-algoritmia nimeltään k-means++. Tuloksena ... -
Tiedonlouhinnan hyödyntäminen asiakkaan sitoutumisen tutkimisessa
Halonen, Merja (2019)Pro gradu -tutkielma käsittelee Knowledge Discovery in Databases (KDD) -prosessin soveltamista asiakkaan sitoutumisen tutkimiseen asiakkuuden elinkaaren eri vaiheissa. Tavoitteena on selvittää, voidaanko suurista ... -
Ohjelmistojen ylläpidon tukeminen tiedonlouhinnan keinoin
Sikanen, Heikki (2004) -
Lokidatan käyttö oppilaiden profiloimisessa - sovellus matematiikan PISA-aineistoon
Kärkkäinen, Tommi; Juutinen, Sanna; Saarela, Mirka; Nissinen, Kari (Suomen kasvatustieteellinen seura, 2018) -
The Finnish success in Pisa - and some reasons behind it : Pisa 2000
Välijärvi, Jouni (University of Jyväskylä, Institute for Educational Research, 2002)