Natural language processing – potential and utilization in an organizational context

Abstract
Luonnollisen kielen käsittely (eng. Natural language processing, NLP) on ottanut viimevuosina suuria kehitysaskelia ja tämä teknologia tarjoaa organisaatioille lukuisia mahdollisia hyödyntämiskohteita. Aiheesta puhuttaessa on ilmeistä, että alan termistö ei ole lainkaan vakiintunut ja eri toimijat määrittelevät teknologian eri tavoin. Tämä epäselvyys siitä, mitä NLP oikeastaan tarkoittaa ja mihin sitä voidaan hyödyntää saattaa hankaloittaa teknologian laajamittaista käyttöönottoa organisaatioissa ja näin ollen myös jarruttaa alan vahvaa kehitystä jatkossa. Tässä tutkielmassa on pyritty esittelemään mahdollisimman laajasti NLP:n keskeisiä käsitteitä käyttäen määrittelyssä alan tieteellistä kirjallisuutta ja pyritty valottamaan teknologian nykyistä potentiaalia sekä toisaalta tulevaisuudennäkymiä. Tutkielmassa on esitelty erilaisia kirjallisuudessa käytettyjä määritelmiä NLP:lle, erilaisia näkemyksiä tehtävistä, joista NLP koostuu sekä teknologian hyödyntämiskohteita yleisesti eri toimialoilla. Tutkielma on toteutettu toimeksiantona käyttäen suunnittelutieteellistä tutkimusmenetelmää ja tutkielman perimmäinen tarkoitus on selvittää, kuinka NLP:tä voitaisiin hyödyntää kansainvälisen B2B-liiketoimintaa harjoittavan organisaation toiminnassa. Tutkielmassa on tunnistettu ja esitelty teknologian kyvykkyyksiä sekä nykyisiä hyödyntämiskohteita ja näiden pohjalta laadittu kolme artefaktia, tässä tapauksessa ratkaisuehdotusta, jotka otettiin lähempään tarkasteluun. Nämä artefaktit ovat toimeksiantajan kannalta potentiaalisia NLP:n käyttötapauksia, joista yhdestä rakennettiin Azure AI Language palvelua ja Language Studio työkalua käyttäen havainnollistava prototyyppi, jonka suorituskykyä ja hyötyä voitiin arvioida toimeksiantajan edustajien kanssa. Asiasanat: luonnollisen kielen käsittely, tekoäly, kielimallit, chatbotit, suunnittelutieteellinen tutkimus

The field of natural language processing (NLP) has seen many advancements in recent years and this technology offers numerous potential use-cases for organizations. When observing the discussion surrounding NLP, it is apparent that the terminology is not properly established with different actors defining the technology in different ways. This ambiguity regarding what NLP actually means and what it can be used for potentially delays a more widespread adoption across different organizations and therefore hinders the continued advancement of the field. This thesis aims to present a comprehensive overview of NLP including the relevant terminology using academic literature while also illustrating the current potential of this technology as well as the imminent future prospects. The thesis includes various definitions for NLP, the sub-tasks it is comprised of as well as general examples of current use-cases across different industries found in academic literature. The thesis is written as an assignment for a client organization using design science research methodology with the explicit goal of discovering how NLP could be utilized from the perspective of a specific global B2B organization. In scope of this thesis various NLP capabilities and current use-cases are identified and presented resulting in the design of three research artifacts. These artifacts represent proposed solutions that are potential use-cases for NLP utilization within the client organization context with one eventually being developed into a tangible prototype using Azure AI Language service and Language Studio tool. This custom text classification prototype is subsequently evaluated in terms of performance and utility together with the client organization representatives. Keywords: natural language processing, artificial intelligence, language models, chatbots, design science research
Main Author
Format
Theses Master thesis
Published
2024
The permanent address of the publication
https://urn.fi/URN:NBN:fi:jyu-202407315274Use this for linking
Language
English
License
In CopyrightOpen Access
Copyright© The Author(s)

Share