Ihmisarvioijien näkemyksiä suullisen kielitaidon automaattisesta arvioinnista, digitaalisesta arviointiprosessista sekä puhesuorituksista arvioitavista ulottuvuuksista
Zansen, A. V., Kallio, H., Sneck, M., Kuronen, M., Huhta, A., & Hildén, R. (2022). Ihmisarvioijien näkemyksiä suullisen kielitaidon automaattisesta arvioinnista, digitaalisesta arviointiprosessista sekä puhesuorituksista arvioitavista ulottuvuuksista. In T. Seppälä, S. Lesonen, P. Iikkanen, & S. D'hondt (Eds.), Kieli, muutos ja yhteiskunta (pp. 370-394). Suomen soveltavan kielitieteen yhdistys AFinLA. AFinLA:n vuosikirja, 2022. https://doi.org/10.30661/afinlavk.114821
Published in
AFinLA:n vuosikirjaAuthors
Date
2022Copyright
© Kirjoittajat & Suomen soveltavan kielitieteen yhdistys ry, 2022
Digitaaliset kielikokeet ovat nykypäivää muun muassa ylioppilastutkinnossa, ja lähes jokaisessa oppilaitoksessa on jonkinlainen digitaalinen oppimis- ja opetusalusta. Tekniikka on mullistanut kielitaidon testaamisen ja harjoittelun, mutta täysin automaattiset suullisen kielitaidon kokeet ovat vielä harvinaisia kansainvälisestikin. Tekoäly on kuitenkin arkipäiväistymässä monilla elämänalueilla, ja se herättää monenlaisia mielikuvia ja pohdintaa sen vaikutuksista ja eettisyydestä. Artikkelissa kartoitamme ja analysoimme ihmisarvioijien näkemyksiä digitaalisesti toteutetusta arviointiprosessista, jossa keräsimme ihmisarvioijilta arvioita suomen ja ruotsin puhenäytteisiin. Tutkimme myös arviointikierroksille osallistuneiden näkemyksiä suullisen kielitaidon automaattisesta arvioinnista. Kolmas tutkimuskysymyksemme (ks. luku 2) liittyy tehtävänannon ja puheen ulottuvuuksiin, joita puhesuorituksista arvioidaan. Tutkimus on osa DigiTala-tutkimushanketta (Kautonen & von Zansen 2020), jossa kehitetään puheentunnistusta, automaattista puheen arviointia sekä automaattista palautetta suomen ja ruotsin oppijoille (von Zansen ym. arvioitavana). Automatiikka lisää mahdollisuuksia puheen itsenäiseen harjoitteluun (von Zansen ym. arvioitavana). Suurissa ja tärkeissä (high-stakes) kokeissa se voi toimia ihmisarvioinnin tukena, vähentää arvioijien työtaakkaa sekä lisätä arvioinnin objektiivisuutta. Ihmisen tekemään arvioon voivat vaikuttaa esimerkiksi erilaiset testattavan yksilölliset tai kielelliset piirteet, kuten aksentteihin liittyvät ennakkokäsitykset (Halonen ym. 2020). Nykynäkemyksen mukaan arviointiin osallistuvien monien toimijoiden välinen tiedonkulku ja dialogi ovat tärkeitä laadukkaalle arvioinnille. Näitä osallisia (stakeholders) ovat niin laatijat ja käyttäjät kuin arvioitavatkin (Hidri 2020), ja kaikkien osapuolten näkemykset on syytä huomioida jo arviointivälineiden kehittelyvaiheessa. Arvioijien tai edes opettajien käsityksiä automaattisesta suullisen kielitaidon arvioinnista ei tietojemme mukaan ole aikaisemmin tutkittu. Tutkimustiedon avulla voimme kehittää automaattisen arvioinnin menetelmiä oikeudenmukaisiksi ja käyttökelpoisiksi.
...
This study investigated human raters’ perceptions of automated assessment of oral language skills. The raters (n = 37) participated in three assessment rounds organized by the DigiTala research project using Moodle and Zoom. The raters assessed Finnish and Swedish learners’ speech samples using one holistic and five analytical rating scales created in the project. After the assessment, the raters responded to a questionnaire that included Likert-scale and open-ended questions. Numerical responses were analyzed with descriptive statistics, open responses with content analysis. The raters think that automated scoring could support human rating. The assessment rounds were carried out successfully. The selected dimensions proved to be essential parts of the speaking performances. The results will benefit those working on automated assessment and oral language assessment.
Publisher
Suomen soveltavan kielitieteen yhdistys AFinLAParent publication ISBN
978-951-9388-74-8Is part of publication
Kieli, muutos ja yhteiskuntaISSN Search the Publication Forum
2343-2608Keywords
Original source
https://journal.fi/afinlavk/article/view/114821Publication in research information system
https://converis.jyu.fi/converis/portal/detail/Publication/164250737
Metadata
Show full item recordCollections
Related funder(s)
Research Council of FinlandFunding program(s)
Academy Project, AoFAdditional information about funding
Tutkimus on osa DigiTala-tutkimushanketta.License
Related items
Showing items with similar title or keywords.
-
"Voi ei, nää on tosi hyviä verrattuna muhun!" : uudenlaisen arviointimenetelmän toimivuus ranskan suullisen kielitaidon itsearvioinnissa
Leblay, Tarja (Jyväskylän yliopisto, 2013) -
Venäläisen aksentin tunnistaminen suomen suullisen kielitaidon arvioinnissa
Ullakonoja, Riikka (Suomen soveltavan kielitieteen yhdistys ry, 2024)The paper focuses on the Russian accent in the Finnish oral proficiency test. The data consist of spontaneous monologues on an intermediate proficiency level from 10 speakers (about 90 s each). Raters (n=44) were asked to ... -
Differences in acoustically determined sentence stress between native and L2 speakers of Finland Swedish
Kallio, Heini; Kuronen, Mikko; Kautonen, Maria (Lund University, 2021)This study describes a pilot attempt to use acoustically determined sentence stress in distinguishing native and L2 speakers of Finland Swedish at different proficiency levels. The study is part of the DigiTala project ... -
Prosody and fluency of Finland Swedish as a second language : Investigating global parameters for automated speaking assessment
Kallio, Heini; Kautonen, Maria; Kuronen, Mikko (Elsevier BV, 2023)This study investigates prosody and fluency of Finland Swedish as a second language (L2). The main objective is to investigate global measures of prosody and fluency as predictors of overall oral proficiency, fluency, and ... -
Developing Automated Feedback on Spoken Performance : Exploring the Functioning of Five Analytic Rating Scales Using Many-facet Rasch Measurement
Zansen, Anna von; Huhta, Ari (Jyväskylän yliopisto, 2022)In this study, we used the Many-facet Rasch measurement (MFRM) to explore the quality of ratings as well as the functioning of five analytic rating scales developed for automated assessment of L2 speech. This study is part ...