Näytä suppeat kuvailutiedot

dc.contributor.advisorTaipalus, Toni
dc.contributor.authorLappalainen, Markus
dc.date.accessioned2023-06-01T06:53:26Z
dc.date.available2023-06-01T06:53:26Z
dc.date.issued2023
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/87381
dc.description.abstractKoneoppimisalgoritmit ja neuroverkot ovat nykyään osa jokapäiväistä elämäämme, ja niiden tuoma kehitys on mullistanut yhteiskunnan montaa osa-aluetta. Nopean kehityksen vuoksi asiaan perehtymätön henkilö tuskin yleensä edes huomaa käyttävänsä koneoppimiseen perustuvia teknologioita. Koneoppiminen, ja varsinkin neuroverkot, ovat nykyään niin monimutkaisia, että niiden toimintaa voi olla vaikeaa, tai jopa mahdotonta ymmärtää. Tutkimus toteutettiin kuvailevana kirjallisuuskatsauksena. Tutkimuksessa annetaan ensin lyhyt yleiskatsaus koneoppimisesta lukijan ymmärryksen tueksi. Tutkimuksen päätarkoitus, sekä tutkimusongelma, oli selvittää koneoppimistyökalujen toimintaperiaatteet. Tutkimusongelmaa selvitettiin tutustumalla koneoppimistyö-kalujen toimintaan, etenkin niiden opetusvaiheeseen, jonka aikana luodaan edellytykset niiden päätöksenteolle. Tutkimuksessa selvitettiin joidenkin suosittujen koneoppimistyökalujen toimintaperiaatteita, sekä esitellään ne helppolukuisessa ja helposti ymmärrettävässä muodossa, ilman matemaattisia kaavoja. Koneoppimistyökalujen perustoimintaperiaatteeksi löydettiin virhefunktiot, ja niiden minimoiminen. Virhefunktiot esittävät koneoppimistyökalun ennusteen ja toteutuneen tapahtuman välistä eroa, joten virhefunktion minimoiminen on koneoppimisen ydintavoite. Keinot virhefunktioiden minimoimiseksi riippuu käsiteltävän koneoppimistyökalun piirteistä. Tarkasteltaessa valittujen koneoppimistyökalujen optimointiongelmia, paljastui yleisimmäksi keinoksi gradienttimenetelmään perustuvat iteratiiviset optimointialgoritmit. Tutkimuksen aikana löytyi myös muita optimointiongelmia, joita ei pystytä ratkaisemaan gradienttimenetelmällä. Tutkimuksen aikana selvisi myös koneoppimisen perustuvan vahvasti matematiikkaan, erityisesti lineaarialgebraan sekä derivointiin.fi
dc.description.abstractMachine learning algorithms and neural networks are a ubiquitous part of our everyday lives, and their recent development has revolutionized many areas of society. Due to the rapid pace of development, a person who is not familiar with the subject may not even realize that they are using technologies based on machine learning. Machine learning, especially neural networks, are now so complex that understanding the logic behind their decision can sometimes be impossible. The study was conducted as a descriptive literature review. The study begins by providing a brief overview of machine learning to support the reader's understanding. The main objective of the study, and the research question, was to clarify the basic principles of machine learning tools. This was done by examining the operation of machine learning tools, particularly their training phase, during which the conditions for their decision-making are established. The study examined the operating principles of some popular machine learning tools and presented them in an easy-to-understand form, without mathematical formulas. The basic operating principle of machine learning tools was found to be cost functions and their minimization. Cost functions measure the difference between the prediction of the machine learning tool and the actual outcome, so minimizing the cost function can be seen as the primary goal of machine learning. The method for minimizing a cost function depends on the characteristics of the machine learning tool being used. When examining the optimization methods of the studied machine learning tools, iterative optimization algorithms based on the gradient descent algorithm were found to be the most common approach. The study also identified other optimization problems that cannot be solved by the gradient descent algorithm. At the time of writing the study, it became clear that machine learning is heavily based on mathematics, especially linear algebra, and differentiation.en
dc.format.extent28
dc.language.isofi
dc.titleKoneoppimistyökalujen toimintaperiaatteet
dc.identifier.urnURN:NBN:fi:jyu-202306013436
dc.type.ontasotBachelor's thesisen
dc.type.ontasotKandidaatintyöfi
dc.contributor.tiedekuntaInformaatioteknologian tiedekuntafi
dc.contributor.tiedekuntaFaculty of Information Technologyen
dc.contributor.laitosInformaatioteknologiafi
dc.contributor.laitosInformation Technologyen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.oppiaineTietojärjestelmätiedefi
dc.contributor.oppiaineInformation Systems Scienceen
dc.rights.copyrightJulkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.fi
dc.rights.copyrightThis publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.en
dc.contributor.oppiainekoodi601
dc.subject.ysotekoäly
dc.subject.ysoneuroverkot
dc.subject.ysokoneoppiminen
dc.subject.ysoalgoritmit


Aineistoon kuuluvat tiedostot

Thumbnail

Aineisto kuuluu seuraaviin kokoelmiin

Näytä suppeat kuvailutiedot