Suomen viittomakielten korpusta rakentamassa
Salonen, J., Puupponen, A., Takkinen, R., & Jantunen, T. (2019). Suomen viittomakielten korpusta rakentamassa. In J. H. Jantunen, S. Brunni, N. Kunnas, S. Palviainen, & K. Västi (Eds.), Proceedings of the Research data and humanities (RDHum) 2019 conference : data, methods and tools (pp. 83-98). Oulun yliopisto. Studia Humaniora Ouluensia, 17. http://urn.fi/urn:isbn:9789526223216
Julkaistu sarjassa
Studia Humaniora OuluensiaToimittajat
Päivämäärä
2019Tekijänoikeudet
© 2019 Oulun yliopisto
Viittomakielikorpusten rakentaminen on lisääntynyt merkittävästi 2000-luvulla: ensimmäiset korpusprojektit käynnistyivät 2000-luvun alussa Australiassa ja Hollannissa, minkä myötä laajoja, koneluettavia aineistokokoelmia on ryhdytty rakentamaan useissa Euroopan maissa 2010-luvulla. Tässä artikkelissa tarkastellaan Suomen viittomakielten, suomalaisen ja suomenruotsalaisen viittomakielen, korpuksen syntyä. Artikkeli esittelee korpuksen rakennusvaiheita eli aineiston keräämistä, käsittelyä, annotointia, pitkäaikaissäilytystä sekä julkaisua tietosuojakysymyksineen. Lisäksi artikkelissa kuvaillaan, miten korpusaineistoa on käytetty ja voidaan hyödyntää viittomakielten tutkimuksessa sekä opetuksessa.
Neljän vuoden mittainen Suomen viittomakielten korpusprojekti käynnistyi Jyväskylän yliopiston viittomakielen keskuksessa vuonna 2014. Projektin aikana kuvattiin keskusteluja ja elisitoituja kertomuksia 91 suomalaista viittomakieltä ja 12 suomenruotsalaista viittomakieltä äidinkielenään käyttävältä, eri puolilla Suomea asuvalta henkilöltä viittomakielisen kuuron projektitutkijan opastuksella. Videomateriaalia kerättiin yhteensä noin 560 tunnin edestä (seitsemästä kamerakulmasta nauhoitetut materiaalit yhteenlaskettuna).
Aineistonkeruun ja editoinnin jälkeen yhteensä 22 suomalaista viittomakieltä äidinkielenään käyttävän kielenoppaan videoaineistoihin on tehty perustason annotaatiot viittoma- ja virketasolla. Annotointivaihe eteni viittomien tunnistamisella, niiden merkitysten erottamisella ja viitotun tekstin ilmauskokonaisuuksien kääntämisellä suomen kielelle. Perusannotointi toteutettiin ELAN-ohjelmalla, jossa viittomia identifioidaan ajallisesti videoon yhteydessä olevien glossien avulla. Annotoinnissa käytettiin lisäksi Suomen Signbank -leksikkotietokantaa, johon ELAN-ohjelman glossit yhdistyvät verkkoyhteyden avulla. Laaja multimodaalinen aineistokokonaisuus täydennettiin metatiedoilla aineiston eri osa-alueista, kuten aineistokokonaisuuden yleisluonteesta, aineistonkeruussa läsnä olleista henkilöistä, videoiden sisällöistä ja video- ja annotaatiotiedostojen muodoista IMDI (ISLE Meta Data Initiative) -standardin mukaisesti. Annotoitu aineisto säilytetään ensisijaisesti Jyväskylän yliopistossa, minkä lisäksi se siirretään maaliskuun 2019 aikana FIN-CLARIN-konsortion Kielipankkiin pitkäaikaissäilytettäväksi sekä julkaistavaksi kielenoppaiden tutkimussuostumusten ja tietosuoja-asetusten mukaisesti. Kielipankissa julkaistava korpusaineisto sisältää noin 14 tunnin edestä kuudesta kamerakulmasta kuvattua videomateriaalia 21 kielenoppaalta sekä videoihin linkitetyt annotaatiotiedostot ja IMDI-kuvaukset.
Suomen viittomakielten korpuksen luonti kehittää molempien viittomakielten kielellisten ja kulttuuristen piirteiden tutkimusta sekä opetusta. Jyväskylänyliopiston viittomakielen keskuksessa korpusaineiston pohjalta on tehty tähän mennessä useita suomalaiseen viittomakieleen keskittyviä tutkimuksia, minkä lisäksi aineistoa on käytetty myös viittomakieliä vertailevassa tutkimuksessa. Kerätty videoaineisto on ainutlaatuinen kokoelma Suomen viittomakielillä tuotettua kerrontaa ja keskusteluja: materiaali sisältää eri-ikäisten ja eri alueilta tulevien henkilöiden viittomista erilaisissa viestintätilanteissa. Systemaattisen annotoinnin myötä aineisto tulee olemaan merkittävä resurssi tutkimuksen lisäksi viittomakielten opetuksessa, viittomakieliä koskevassa koulutuksessa sekä kielisuunnittelussa.
...
Julkaisija
Oulun yliopistoEmojulkaisun ISBN
978-952-62-2320-9Konferenssi
Research Data and Humanities ConferenceKuuluu julkaisuun
Proceedings of the Research data and humanities (RDHum) 2019 conference : data, methods and toolsISSN Hae Julkaisufoorumista
1796-4725Asiasanat
Alkuperäislähde
http://urn.fi/urn:isbn:9789526223216Julkaisu tutkimustietojärjestelmässä
https://converis.jyu.fi/converis/portal/detail/Publication/32719951
Metadata
Näytä kaikki kuvailutiedotKokoelmat
Lisenssi
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Miten viittomakielen korpusta luodaan ja mihin sitä tarvitaan? : viittomakielten korpukset ja niiden tehtävät
Takkinen, Ritva; Salonen, Juhana; Puupponen, Anna; Nieminen, Henri (Puheen ja kielen tutkimuksen yhdistys, 2020)Artikkeli käsittelee suomalaisen ja suomenruotsalaisen viittomakielen korpusten luontia CFINSL-projektissa (Corpus project of Finland’s sign languages, Suomen viittomakielten korpusprojekti). Viittomakielillä ei ole ... -
Creating Corpora of Finland’s Sign Languages
Salonen, Juhana; Takkinen, Ritva; Puupponen, Anna; Nieminen, Henri; Pippuri, Outi (European Language Resources Association (ELRA), 2016)This paper discusses the process of creating corpora of the sign languages used in Finland, Finnish Sign Language (FinSL) and Finland-Swedish Sign Language (FinSSL). It describes the process of getting informants and data, ... -
Building the Corpus of Finland-Swedish Sign Language : Acknowledging the Language History and Future Revitalization
Salonen, Juhana; Andersson-Koski, Maria; Hoyer, Karin; Jantunen, Tommi (Jyväskylän yliopisto, 2022)This paper presents the first steps in the process of creating a multimedia corpus for the severely endangered Finland-Swedish Sign Language (FinSSL). In the paper, we will first outline the history and current situation ... -
Saavutettavuutta kaikille? : viitottujen verkkotekstien laatu ja käytettävyys viittomakielten elinvoimaisuuden ja kielenoppimisen näkökulmasta
Sivunen, Ulla (Soveltavan kielentutkimuksen keskus, Jyväskylän yliopisto; Kielikoulutuspolitiikan verkosto, 2022)Viime aikoina on keskusteltu viittomakielisten ja viittomakielelle tulkattujen verkkotekstien laadusta. Viittomakieliset ovat kokeneet, että viitottujen verkkotekstien laatu vaihtelee paljon. Viitottuja verkkotekstejä ... -
Viittomakielet hybridisysteemeinä : hämärärajaisuus ja epäkonventionaalisuus osana viittomakielten rakennetta
Jantunen, Tommi (Puheen ja kielen tutkimuksen yhdistys, 2018)Tässä artikkelissa tarkastellaan hämärärajaisuutta ja epäkonventionaalisuutta osana joitakin kaikista viittomakielistä löydettyjä yksiköitä ja rakenteita ja niiden käyttöä. Täsmällisemmin artikkelin fokuksessa ovat tietyt ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.