Oppijansuomen n-grammit : korpusvetoinen tutkimus B1-kielitaitotason toistuvista monisanaisista rakenteista
Authors
Date
2020Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Tutkimuksessa kartoitetaan oppijansuomen B1-kielitaitotason kirjoitetuissa teksteissä ilmeneviä n-grammeja. Kielentutkimuksessa n-grammeilla tarkoitetaan tutkittavassa kieliaineistossa usein toistuvia, n-määrästä sanoja koostuvia sanaketjuja. Niiden ei tarvitse olla esimerkiksi kieliopillisesti täydellisiä rakenteita tai idiomeja. (Biber, Johansson, Leech, Conrad & Finegan 1999: 989–990; Granger & Paquot 2008: 38–39.) Tutkimus sijoittuu teoreettiselta viitekehykseltään tiiveimmin fraseologiaan, joka on kielentutkimuksen ala, jossa tutkitaan ennen kaikkea kielen käyttöä ja sen erilaisia valmisrakenteisia yksiköitä. N-grammit lukeutuvat sanojen syntagmaattisia myötäesiintymiä ilmaiseviin fraseologisiin yksikköihin.
Tutkimuksen merkittävimpänä tavoitteena on selvittää, millaisia n-grammeja Eurooppalaisella viitekehyksellä (EVK 2003) B1-kielitaitotasolle arvioidut suomenoppijat kirjoitetuissa teksteissään tuottavat ja mitä n-grammit kykenevät B1-tasoisen oppijansuomen leksikaalisista ja rakenteellisista piirteistä kertomaan. Samalla tutkimuksella halutaan laajentaa fraseologista oppijansuomen tutkimusta n-grammien osalta sekä kokeilla erilaisten metodien toimivuutta n-grammien tarkastelussa. Tutkimuksen aineistona toimii Kansainvälinen oppijansuomen korpus (ICLFI), jota lähestytään korpusvetoisella tutkimusmetodilla. Tutkimuksen aluksi korpuksen B1-taitotasoarvioinnin saaneista teksteistä haetaan korpusohjelmalla kaikki niissä esiintyvät, ennalta määrätyt raja-arvot ylittävät 3-, 4-, 5- ja 6-grammit, jotka kootaan yhdeksi listaksi frekvenssiensä mukaan järjestäen. Näitä n-grammeja analysoidaan tämän jälkeen leksikon osalta siten, että n-grammien sanoista laaditaan omat sananmuoto- ja lemmalistansa, ja rakenteiden puolesta niin, että huomio kiinnitetään ensi sijassa sellaisiin n-grammeihin, joihin sisältyy finiittiverbi, verbiliitto tai osa verbiliitosta. Verbillisistä n-grammeista selvitetään, mitä tempuksia ja syntaktisia lausetyyppejä (VISK § 891) niissä ilmenee ja kuinka paljon.
Tutkimuksen tulokset osoittavat, että leksikkonsa puolesta B1-tasoiset suomenoppijat käyttävät paljon natiivisuomestakin tuttua sanastoa, mutta mukana on myös joitain selkeitä leksikaalisia yliedustumia. Ne selittyvät pitkälti tekstien tehtävänannoilla. Sananmuotojen perusteella oppijat suosivat verbeissä runsaasti yksikön ensimmäisen persoonan muotoja. N-grammien lemmoissa edustuvat sanaluokkien osalta eniten nominit (45 %) ja verbit (32 %). Rakenteiden puolesta oppijansuomessa käytetään tempuksien osalta ylivoimaisesti eniten preesensiä (88,6 % verbillisten n-grammien esiintymistä). Syntaktisista lausetyypeistä käytetyin on kopulalause, jota ilmentää 36,4 prosenttia verbillisten n-grammien esiintymistä. Muina yleisluontoisina huomioina todetaan muun muassa, että n-grammeista yli 80 prosenttia on 3-grammeja ja että n-grammeissa esiintyy verrattain vähän kielenvastaisia muotoja. Moduksista indikatiivi on yhtä konditionaalimuotoista n-grammia lukuun ottamatta ainoa verbillisissä n-grammeissa käytetty tapaluokka. Verbittömät n-grammit toimivat tulosten perusteella pääosin asioiden rinnastajina sekä suhteuttavat tapahtumia aikaan. Tutkimustulokset lisäävät tietoa oppijankielen fraseologisista piirteistä ja viitoittavat osaltaan tietä mahdolliselle tulevalle tutkimukselle aiheesta.
...


Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [23931]
Related items
Showing items with similar title or keywords.
-
SAADA-verbin fraseologiaa : vertaileva korpustutkimus oppijan- ja natiivisuomesta
Tarvainen, Jenny (2018)Tutkielmassa vertaillaan oppijansuomen ja natiivisuomen fraseologisia piirteitä SAADA-verbin avulla. Ensin vertaillaan, missä merkityksissä SAADA-verbi esiintyy taajimmin oppijansuomen ja natiivisuomen aineistoissa, ... -
Korpusavusteinen diskurssintutkimus jokamiehenoikeuksista Helsingin Sanomien verkkoartikkeleissa
Mäkelä, Aleksi (2021)Retkeily ja luonnossa liikkuminen ovat kasvattaneet suosiotaan viime vuosina. Suomessa merkittävä luonnossa liikkumisen mahdollistaja on jokamiehenoikeudet. Ne ovat myös esimerkki elävästä kulttuuriperinnöstä. ... -
Adverbien täysin ja kokonaan kollokaatit ja semanttinen prosodia
Kangas, Akseli (2018)Tutkielmani käsittelee lähisynonyymisten adverbien täysin ja kokonaan kollokaateissa ja semanttisessa prosodiassa ilmeneviä eroja ja yhtenäisyyksiä. Kollokaateilla tarkoitetaan tutkittavien sanojen tekstuaalisessa ... -
Zur Standardvariation auf phraseologischer Ebene : Vergleich von Kookkurrenzmustern des österreichischen Deutsch und des deutschländischen Deutsch am Beispiel von Auge
Laajala, Elina (2012)Tässä työssä vertaillaan Itävallan ja Saksan kielivarieteetteja myötäesiintymisen tasolla. Saksan kielen varieteettien välisiä eroja on tutkittu mm. morfologian, fonologian ja pragmatiikan tasoilla, mutta vakiintuneet ... -
HAVAITA- ja HUOMATA-kvasirakenteiden kollokaatit ja lähisynonymia Suomi24-keskusteluissa
Kumpulainen, Aaro (2021)Tutkin maisterintutkielmassani HAVAITA- ja HUOMATA-kvasirakenteiden (esim. on havaitsevinaan, olen huomaavinani jne.) merkitseviä kollokaatteja ja lähisynonymiaa korpuslingvistiikan ja tilastollisten menetelmien avulla. ...