dc.contributor.advisor | Koskelainen, Tiina | |
dc.contributor.advisor | Seppänen, Ville | |
dc.contributor.advisor | Taipalus, Toni | |
dc.contributor.author | Kiianmaa, Nelli | |
dc.date.accessioned | 2020-11-25T11:22:24Z | |
dc.date.available | 2020-11-25T11:22:24Z | |
dc.date.issued | 2020 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/72803 | |
dc.description.abstract | Terveydenhuollon kliinistä tietoa ja big dataa, kuten sairauskertomustietoa, hyödynnetään enenevässä määrin toissijaisiin tarkoituksiin, kuten tutkimukseen ja tiedolla johtamiseen. Tietolähteet ovat hyvin moninaisia ja tiedon laatu alhainen, mikä hankaloittaa tiedon käyttöä. Laatuongelmiin on big dataa käsittelevässä kirjallisuudessa kiinnitetty verrattain vähän huomiota.
Tässä tutkimuksessa tutkittiin kliinisen big datan laatuongelmia, niiden syitä ja niihin kehitettyjä ratkaisuja tutkimuksessa ja tiedolla johtamisessa. Näkökulma oli sosiotekninen. Tutkimus toteutettiin laadullisena tapaustutkimuksena Varsinais-Suomen sairaanhoitopiirin tietoallasympäristössä ja urologian tietoal-lashankkeessa. Aineisto koostui puolistrukturoiduista haastatteluista ja julkisista dokumenteista. Analyysimenetelminä käytettiin aineisto- ja teorialähtöistä sisällönanalyysiä sekä visualisointia.
Tapauskontekstissa tiedon laatuongelmia syntyy kaikissa vaiheissa potilastiedon kirjaamisesta sen pohjalta tehtyihin johtopäätöksiin asti. Laatuongelmien syyt ovat moninaisia ja kytköksissä toisiinsa. Tietoaltaan potilastietojen relevanssi ja arvo toissijaisessa käytössä on lähtökohtaisesti heikko. Syynä on potilastietojen kirjaamisen muoto ja tapa, erityisesti rakenteisen tiedon puute. Rakenteisen tiedon puuttuessa on käytettävä sairauskertomustekstiä, jonka hyödyntäminen on vaativaa. Tiedon varastointi- ja jalostusvaiheessa tiedon laatuongelmia aiheuttaa tiedon sirpaleisuus, viiteavainten ja metatiedon puute sekä monipolvinen, virhealtis jalostusprosessi. Ilman riittäviä osaamis- ja teknologiaresursseja tietoallastiedon tehokas hyödyntäminen ei ole mahdollista. Urologian tietoallashankkeessa tiedon laatuongelmia pyrittiinkin ratkaisemaan erityisesti panostamalla kliinikoiden ja it-asiantuntijoiden yhteiseen, pitkäjänteiseen kehitystyöhön.
Tutkimustulokset auttavat ymmärtämään, mitkä ovat keskeisiä kehityskohteita, kun kliinisestä tiedosta pyritään jalostamaan arvoa tietoallasympäristössä. | fi |
dc.description.abstract | Healthcare clinical data and big data, such as electronic health record, are increasingly being utilised for secondary purposes, such as research and knowledge management. The data sources are very diverse, and of low quality, creating challenges for their use. Relatively little attention has been paid to quality problems in the big data literature.
This study examined the quality problems of clinical big data, their causes, and the solutions developed in research and knowledge management. The perspective was socio technical. The study was carried out as a qualitative case study in the data lake environment of the Hospital District of Southwest Finland and in their urology data lake project. The research material consisted of semi-structured interviews and public documents. Conventional and directed content analysis and visualisation were used as analysis.
In the case context, data quality problems arise at all stages from the recording of patient data to the conclusions derived. The causes of quality problems are manifold and interconnected. The relevance and value of the data lake patient data in secondary use is weak per se. This is due to the form and manner of recording patient data, especially the lack of structured information. In the absence of structured information, narrative text must be used, the utilization of which is demanding. In the data storage and processing phase, data quality problems are caused by data fragmentation, lack of reference keys and metadata, and a multi-phase, error-prone processing process. Without sufficient know-how and technology resources, effective utilisation of data lake information is not possible. The urology data lake project sought to solve data quality problems, especially by investing in the joint, long-term development work of clinicians and IT experts.
The results help to understand the key areas for development in the pursuit of acquiring value from clinical data in a data lake environment. | en |
dc.format.extent | 103 | |
dc.format.mimetype | application/pdf | |
dc.language.iso | fi | |
dc.rights | In Copyright | en |
dc.subject.other | toissijainen käyttö | |
dc.subject.other | toisiokäyttö | |
dc.subject.other | tiedolla johtaminen | |
dc.subject.other | tiedon laatu | |
dc.subject.other | tiedon laatuongelmat | |
dc.title | Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä | |
dc.type | master thesis | |
dc.identifier.urn | URN:NBN:fi:jyu-202011256773 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Informaatioteknologia | fi |
dc.contributor.laitos | Information Technology | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tietojärjestelmätiede | fi |
dc.contributor.oppiaine | Information Systems Science | en |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 601 | |
dc.subject.yso | tiedonhallinta | |
dc.subject.yso | tieto | |
dc.subject.yso | laatu | |
dc.subject.yso | terveydenhuolto | |
dc.subject.yso | tietovarastot | |
dc.subject.yso | big data | |
dc.subject.yso | tietokannat | |
dc.subject.yso | tiedontarve | |
dc.format.content | fulltext | |
dc.rights.url | https://rightsstatements.org/page/InC/1.0/ | |
dc.type.okm | G2 | |