Discovering Business Processes from Unstructured Text
Authors
Date
2020Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Asiakirjojen käsittely manuaalisesti kuluttaa paljon tietotyöntekijän resursseja. Tämä koskee myös liiketoimintaprossien johtamisen asiantuntijoita, joiden työ voi vaatia useiden liiketoimintaprosessien kuvausten lukemista. Tämän tutkielman tavoitteena oli löytää ratkaisuja, jotka vähentävät tietotyöläisen asiakirjojen lukemiseen käyttämää aikaa soveltamalla luonnollisen kielen käsittelyn menetelmiä liiketoimintaprosessien etsimiseen asiakirjoista. Tutkimusmenetelmänä oli suunnittelutieteellinen tutkimus, joka sisälsi useita iteratiivisia vaiheita. Nimetyn kohteen tunnistamista käytettiin ensimmäisen ratkaisun suunnittelemiseen. Se ei kuitenkaan tuottanut toivottuja tuloksia, joten tutkimus siirtyi arvioimaan parempia mahdollisia ratkaisuja genre-teoriaa soveltavalla analyysillä. Tämän analyysin perusteella kehitettiin neljä asiakirjojen otsikkojen luokittelevaa ratkaisua tunnistamaan liiketoimintaprosesseja. Luokitteluratkaisut arvioitiin ristiinvalidoinnilla. Ensimmäinen luokitteluratkaisu suoriutui sattumanvaraisesti jaetusta ristiinvalidoinnista lupaavasti. Validoinnissa, jossa arvioitiin prosessien tunnistamista uusista asiakirjoista, ratkaisu ei kuitenkaan suoriutunut hyvin. Toinen luokitteluratkaisu sovelsi luokittelussa sanaluokkien tunnistamista. Kolmas luokitteluratkaisu hyödynsi listaa joka sisälsi liiketoimintaprosesseissa käytettäviä verbejä. Neljäs luokitteluratkaisu käytti syötteenä otsikon lisäksi kontekstia eli lauseita joissa otsikot esiintyivät asiakirjan tekstissä. Nämä luokitteluratkaisut eivät kuitenkaan tuottaneet merkittävästi ensimmäistä ratkaisua parempia tuloksia.
...
Manual processing of the documents can be a time-taking task for a knowledge worker. This workload can be familiar to Business Process Management professionals who may have to go through multiple process descriptions in their work. This thesis attempts to find a way to mitigate the workload of the knowledge worker by proposing a natural language processing solution for discovering Business Processes from Business Process description documents. The research applied the design science research method and took several steps to produce the solution. The named entity recognition solution provided weak results, and instead of improving the solution, the research utilized genre analysis methods to seek an alternative approach. The classification of the headings of the document was deemed as a possibly viable solution. Four classification pipelines were built for classification of the headings and evaluated with cross-validation. The results of the first pipeline were somewhat promising; however, the cross-validation that was supposed to evaluate the ability to retrieve processes with previously unknown words had a poor performance. The following pipelines were created to improve from the baseline set up by the first pipeline. The second pipeline used part-of-speech tagging, the third used list of verbs relevant to business processes and the fourth pipeline used the context where process names appeared. These pipelines did not, however, make substantial improvements.
...
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29541]
Related items
Showing items with similar title or keywords.
-
The Design Science Research Process : A Model for Producing and Presenting Information Systems Research
Peffers, Ken; Tuunanen, Tuure; Gengler, Charles E.; Rossi, Matti; Hui, Wendy; Virtanen, Ville; Bragge, Johanna (Claremont Graduate University, 2006)The authors design and demonstrate a process for carrying out design science (DS) research in information systems and demonstrate use of the process to conduct research in two case studies. Several IS researchers have ... -
Design science research genres : introduction to the special issue on exemplars and criteria for applicable design science research
Peffers, Ken; Tuunanen, Tuure; Niehaves, Björn (Taylor and Francis, 2018)We propose the definition of genres in IS design science research (DSR). In recent years DSR has become a well-accepted research paradigm within IS; however, now the diversity of purpose, methodology, and mental models has ... -
Reconsidering the Role of Research Method Guidelines for Qualitative, Mixed-methods, and Design Science Research
Holtkamp, Philipp; Soliman, Wael; Siponen, Mikko (University of Hawai'i at Manoa, 2019)Guidelines for different qualitative research genres have been proposed in information systems (IS). As these guidelines are outlined for conducting and evaluating good research, studies may be denied publication ... -
Exploring the elements of successful business process modeling : a case study
Suni, Ella (2019)Tämä raportti on Jyväskylän yliopiston Informaatioteknologian laitoksen pro gradu -tutkielma. Tutkielmassa käsiteltiin liiketoimintaprosessien mallintamisen hyötyjä sekä vaatimuksia niiden toteutumiselle. Tutkielmalla oli ... -
Knowledge mining of unstructured information : application to cyber domain
Takko, Tuomas; Bhattacharya, Kunal; Lehto, Martti; Jalasvirta, Pertti; Cederberg, Aapo; Kaski, Kimmo (Nature Publishing Group, 2023)Information on cyber-related crimes, incidents, and conflicts is abundantly available in numerous open online sources. However, processing large volumes and streams of data is a challenging task for the analysts and experts, ...