Datatieteilijän kompetenssien määritteleminen
Tässä pro gradu – tutkielmassa tarkasteltiin datatieteilijän kompetensseja.
Kompetensseja lähestyttiin kahdesta eri näkökulmasta, tieteellisen kirjallisuu-
den pohjalta sekä empiirisesti työpaikkailmoitusten kautta. Tutkimusmenetel-
mänä käytettiin sisällönanalyysiä. Tieteellisen kirjallisuuden pohjalta määritel-
tiin keskeiset käsitteet massadata ja massadata-analytiikka, sekä valittiin tutki-
muksessa käytetty viitekehys. Tutkimuksessa koottiin tieteellisessä kirjallisuu-
dessa esiintyneet datatieteilijän kompetenssit. Empiirinen aineisto koostui 94
työpaikkailmoituksesta, joista eriteltiin datatieteilijältä vaaditut kompetenssit.
Tieteellisestä kirjallisuudesta ja empiirisestä aineistosta kerättyjä kompetensseja
vertailtiin yhtenäisen viitekehyksen avulla. Aiempaa tutkimustietoa datatieteili-
jän kompetensseista on hyvin vähän. Tulevaisuudessa datatieteilijöistä odote-
taan olevan pulaa, joten on tärkeää tietää mitä datatieteilijän tulisi osata. Tämä
on oleellista, jotta organisaatiot osaisivat rekrytoida oikein ja koulutusorgani-
saatiot opettaa oikeita asioita. Tutkimustulokset osoittavat, että tieteellisessä
kirjallisuudessa ja työpaikkailmoituksissa datatieteilijältä vaadituissa kompe-
tensseissa ei ollut kovin suuria eroja. Yllättävin ero oli datatieteilijältä odotetus-
sa toimialaosaamisessa. Kirjallisuudessa datatieteilijältä odotettiin toimialao-
saamista, mutta sitä ei vaadittu kuin yhdessä työpaikkailmoituksessa. Tutki-
mustulosten perusteella datatieteilijän tärkeimmät kompetenssit ovat tilastotie-
teellinen ja liiketoiminnallinen osaaminen, sekä analyyttiset taidot, ohjelmointi-
ja kommunikointitaidot, koneoppiminen ja tiedonlouhinta. Lisäksi datatieteili-
jältä odotettiin intohimoa ja kykyä ratkaista liiketoiminnan ongelmia massada-
ta-analytiikan avulla.
...
The purpose of this master’s thesis is to study data scientist competencies,
which were analyzed through scientific literature and job advertisements. The
data was analyzed by using content analysis. Based on previous research the
framework for this study was selected and key concepts big data and big data
analytics were defined. The competencies of data scientist were collected from
scientific literature. The empirical data consists of 94 job advertisements, from
which the competencies required for data scientist were extracted. The compe-
tencies from these two sources where then compared by using the selected
framework. Previous research considering data scientist competencies is lacking.
In future there is expected to be a shortage of data scientists, so it is important
to be aware of requirements for this job title. Furthermore this information is
important for the recruitment as well as training of data scientists. The results of
this study show that there were little differences between data scientist compe-
tencies from scientific literature and job advertisements. The most surprising
difference was domain knowledge. In scientific literature domain knowledge
was an important competency but it was mentioned only in one of the job ad-
vertisements. Based on the results of this study the most important competen-
cies for data scientists are statistical and business knowledge, analytical, pro-
gramming and communication skills, machine learning and data mining. In
addition data scientist was required to be passionate and skilled in solving
business problems through the use of big data analytics.
...
Asiasanat
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Pro gradu -tutkielmat [29747]
Lisenssi
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Massadatan vaikutukset yritysten päätöksentekoon
Vartiainen, Emil (2017)Teknologinen kehitys on mahdollistanut ympärillämme suurella nopeudella syntyvän, monimuotoisien ja määrällisesti valtavan massadatan keräämisen ja hyödyntämisen. Yritykset eivät kuitenkaan pysty hyödyntämään kaikkea ... -
Sosiaalisesta mediasta kerätty massadata ja sen analytiikka
Malkki, Kalle (2018)Sosiaalinen media ja massadata ovat nousseet 2000-luvulla merkittäviksi tekijöiksi yhteiskunnissa ja liiketoiminnassa. Sosiaalinen media koostaa sisälleen suuren määrän käyttäjiä, jotka tuottavat myös huomattavia määriä ... -
Massadatan hyödyntäminen toimitusketjussa
Tarvainen, Jenna (2019)Suuria määriä dataa muodostuu jatkuvasti monista eri lähteistä niin yrityksien sisältä kuin ulkopuolelta. Tällaista nopeasti muodostuvaa ja monissa eri muodoissa olevaa valtavaa määrää dataa kutsutaan massadataksi. Yritykset ... -
Datan hyödyntäminen verkkokaupan liiketoimintajohtamisen päätöksenteossa
Tuominen, Valtteri (2023)Verkkokauppojen liiketoiminnasta kertyvän datan määrä kasvaa jatkuvasti. Tämän tutkimuksen tarkoituksena oli selvittää, miten verkkokauppojen dataa saadaan hyödynnettyä liiketoiminnan päätöksenteossa. Tutkielma suoritettiin ... -
Datan ja data-analytiikan hyödyntäminen joukkueurheilussa
Mahlberg, Kaarlo (2022)Tutkielma on toteutettu kirjallisuuskatsauksena ja siinä tarkastellaan kuinka dataa ja data-analytiikkaa voidaan hyödyntää joukkueurheilussa ja voidaanko sen avulla saavuttaa kilpailuetua muihin kilpailijoihin nähden. Datan ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.