Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
Terveydenhuollon kliinistä tietoa ja big dataa, kuten sairauskertomustietoa, hyödynnetään enenevässä määrin toissijaisiin tarkoituksiin, kuten tutkimukseen ja tiedolla johtamiseen. Tietolähteet ovat hyvin moninaisia ja tiedon laatu alhainen, mikä hankaloittaa tiedon käyttöä. Laatuongelmiin on big dataa käsittelevässä kirjallisuudessa kiinnitetty verrattain vähän huomiota.
Tässä tutkimuksessa tutkittiin kliinisen big datan laatuongelmia, niiden syitä ja niihin kehitettyjä ratkaisuja tutkimuksessa ja tiedolla johtamisessa. Näkökulma oli sosiotekninen. Tutkimus toteutettiin laadullisena tapaustutkimuksena Varsinais-Suomen sairaanhoitopiirin tietoallasympäristössä ja urologian tietoal-lashankkeessa. Aineisto koostui puolistrukturoiduista haastatteluista ja julkisista dokumenteista. Analyysimenetelminä käytettiin aineisto- ja teorialähtöistä sisällönanalyysiä sekä visualisointia.
Tapauskontekstissa tiedon laatuongelmia syntyy kaikissa vaiheissa potilastiedon kirjaamisesta sen pohjalta tehtyihin johtopäätöksiin asti. Laatuongelmien syyt ovat moninaisia ja kytköksissä toisiinsa. Tietoaltaan potilastietojen relevanssi ja arvo toissijaisessa käytössä on lähtökohtaisesti heikko. Syynä on potilastietojen kirjaamisen muoto ja tapa, erityisesti rakenteisen tiedon puute. Rakenteisen tiedon puuttuessa on käytettävä sairauskertomustekstiä, jonka hyödyntäminen on vaativaa. Tiedon varastointi- ja jalostusvaiheessa tiedon laatuongelmia aiheuttaa tiedon sirpaleisuus, viiteavainten ja metatiedon puute sekä monipolvinen, virhealtis jalostusprosessi. Ilman riittäviä osaamis- ja teknologiaresursseja tietoallastiedon tehokas hyödyntäminen ei ole mahdollista. Urologian tietoallashankkeessa tiedon laatuongelmia pyrittiinkin ratkaisemaan erityisesti panostamalla kliinikoiden ja it-asiantuntijoiden yhteiseen, pitkäjänteiseen kehitystyöhön.
Tutkimustulokset auttavat ymmärtämään, mitkä ovat keskeisiä kehityskohteita, kun kliinisestä tiedosta pyritään jalostamaan arvoa tietoallasympäristössä.
...
Healthcare clinical data and big data, such as electronic health record, are increasingly being utilised for secondary purposes, such as research and knowledge management. The data sources are very diverse, and of low quality, creating challenges for their use. Relatively little attention has been paid to quality problems in the big data literature.
This study examined the quality problems of clinical big data, their causes, and the solutions developed in research and knowledge management. The perspective was socio technical. The study was carried out as a qualitative case study in the data lake environment of the Hospital District of Southwest Finland and in their urology data lake project. The research material consisted of semi-structured interviews and public documents. Conventional and directed content analysis and visualisation were used as analysis.
In the case context, data quality problems arise at all stages from the recording of patient data to the conclusions derived. The causes of quality problems are manifold and interconnected. The relevance and value of the data lake patient data in secondary use is weak per se. This is due to the form and manner of recording patient data, especially the lack of structured information. In the absence of structured information, narrative text must be used, the utilization of which is demanding. In the data storage and processing phase, data quality problems are caused by data fragmentation, lack of reference keys and metadata, and a multi-phase, error-prone processing process. Without sufficient know-how and technology resources, effective utilisation of data lake information is not possible. The urology data lake project sought to solve data quality problems, especially by investing in the joint, long-term development work of clinicians and IT experts.
The results help to understand the key areas for development in the pursuit of acquiring value from clinical data in a data lake environment.
...
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29740]
License
Related items
Showing items with similar title or keywords.
-
Sovellus tietovarastokehityksen automatisointiin ja metadatan hallintaan
Homanen, Mikko (2019)Tässä tutkielmassa kuvataan suomalaisen IT-palveluita ja ohjelmistoratkaisuja tarjoavan yrityksen tarpeisiin toteutettu sovellus tietovarastokehityksen automatisointiin ja metadatan hallintaan. Sovelluksella yritys pyrki ... -
Lohkoketjuteknologian hyödyntäminen sähköisten potilaskertomusten datan hallinnassa
Tammilehto, Lasse (2021)Lohkoketjuteknologia on suhteellisen uusi, laajamittaista kiinnostusta viimeaikoina herättänyt teknologinen innovaatio, joka on tullut alunperin yleisölle tutuksi sähköisen valuuttajärjestelmän Bitcoinin myötä. ... -
Strateginen tiedolla johtaminen : tapaus Kotkan kaupunki
Hämäläinen, Kai (2022)Tämän pro gradu-tutkielman tarkoituksena oli selvittää, miten strategista tiedolla johtamista toteutetaan Kotkan kaupungilla: miten tiedolla johtaminen on linjattu suhteessa organisaation strategiaan ja millaisista tekijöistä ... -
Yhdenmukainen tiedon validointi käyttöliittymässä ja mikropalvelussa
Kaukovuo, Harri (2021)Tässä kandidaatintutkielmassa käydään läpi yhdenmukaisen validoinnin ongelmatiikkaa nykyaikaisen selainpohjaisen käyttöliittymän ja mikropalvelurajapinnan näkökulmasta. Tutkimuskysymyksenä tutkielmassa on: ”Millä tavoilla ... -
Tiedolla johtaminen sosiaali- ja terveysalalla henkilöstöhallinnon näkökulmasta
Patrikainen, Milla (2022)Suomessa on tällä hetkellä käynnissä yksi Suomen historian merkittävimmistä hallinnollisista uudistuksista: sosiaali- ja terveydenhuollon ja pelastustoimen uudistus eli sote-uudistus. Tiedolla johtaminen on tunnistettu ...