University of Jyväskylä | JYX Digital Repository

  • English  | Give feedback |
    • suomi
    • English
 
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
View Item 
  • JYX
  • Opinnäytteet
  • Kandidaatintutkielmat
  • View Item
JYX > Opinnäytteet > Kandidaatintutkielmat > View Item

Voiko vähästä oppia : koneoppimisen haasteet pienellä aineistolla

Thumbnail
View/Open
600.7Kb

Downloads:  
Show download detailsHide download details  
Authors
Kauppinen, Jussi
Date
2019
Discipline
TietotekniikkaMathematical Information Technology
Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

 
Tämä kandidaatintutkielma käsittelee koneoppimista pienellä aineistolla. Koneoppimisessa kone parantaa suorituskykyään jonkin tietyn tehtävän ratkaisemiseksi itsenäisesti sitä mukaa kun lisää kokemusta tai dataa kertyy. Koneoppimisongelmat voidaan jakaa luokittelu- ja regressio-ongelmiin. Yleensä koneoppimistehtävät vaativat ison aineiston tarkan koneoppimismallin opettamiseksi, mutta usein kattavan aineiston hankkiminen muodostuu ongelmaksi. Tämän tutkielman tavoitteena on käydä läpi minkälaisia ongelmia koneoppimismallin opetuksessa ilmenee kun käytettävissä on pieni aineisto ja esitellä ratkaisuja näihin ongelmiin. Tutkielma tehtiin kirjallisuuskatsauksena. Tutkitut julkaisut käsittelivät edellä mainittuja ongelmia, sekä niihin kehiteltyjä ratkaisuja. Tutkielmassa selvisi, että pienellä aineistolla on haastavampaa opettaa hyvin yleistyvää koneoppimismallia, ja ylisovittumisen välttäminen on vaikeaa. Yleistymisen parantamiseksi esitellään keinotekoista lisädataa generoiva SMOTE-tekniikka, ja ylisovittumista yritetään saada kuriin regularisoinnin avulla ...
 
This bachelor’s thesis deals with machine learning with little data. In machine learning, the machine improves its performance to solve a specific task independently as more experience or data accumulates. Machine learning problems can be divided into classification and regression problems. Usually, machine learning tasks require large data to train an accurate machine learning model, but often obtaining large enough data is problematic. The aim of this thesis is to review the problems encountered in training a machine learning model when there is only little data available and solutions to these problems. The thesis was made as a literature review. The publications examined deal with the above-mentioned problems, as well as the solutions developed for them. In the thesis it became clear that it is more challenging to teach a machine learning model that generalizes well with little material, and it is difficult to avoid overfitting. In order to generalize better, we examine SMOTE technology to generate synthetic data and to prevent overfitting we talk about regularization. ...
 
Keywords
luokittelu pieni data pieni aineisto regularisointi koneoppiminen
URI

http://urn.fi/URN:NBN:fi:jyu-201905172650

Metadata
Show full item record
Collections
  • Kandidaatintutkielmat [4049]

Related items

Showing items with similar title or keywords.

  • Koneoppimisen hyödyntäminen videopeleissä 

    Saarimaa, Jose (2021)
    Tässä kandidaattitutkielmassa käsitellään koneoppimisen hyödyntämistä videopeleissä kirjallisuuskatsauksen muodossa. Ensiksi perehdytään siihen, millainen ympäristö pelit ovat koneoppimisen soveltamiselle ja erityisesti ...
  • Koneoppimisen hyödyntäminen kyberhyökkäysten havaitsemisessa ja torjunnassa 

    Seppänen, Henrik (2020)
    Tekoäly on noussut yhdeksi nykypäivän puhutuimmista uusista teknologioista. Tekoälyyn kuuluva koneoppiminen on ollut jo kauan tutkimuksen kohteena. Lähivuosina tekoälyn noustessa pinnalle, on myös koneoppimisteknologian ...
  • Koneoppimisen hyödyntäminen kaupallisen lentoyhtiön toiminnoissa 

    Korpela, Jari (2019)
    Tämä kandidaatintutkielma on kirjallisuuskatsaus, jonka tarkoituksena on selvittää, miten koneoppimista voitaisiin hyödyntää lentoyhtiön tärkeimmissä toiminnoissa. Tarkoituksena on parantaa tietojärjestelmäasiantuntijoiden ...
  • Koneoppimisen mahdollisuudet lääketieteellisessä diagnostiikassa 

    Riipinen, Tommi (2018)
    Eksponentiaalisesti kasvavan datamassan, kasvaneen laskentatehon ja jatkuvasti kehittyvien algoritmien ansiosta koneoppimismenetelmien hyötypotentiaali lisääntyy jatkuvasti lääketieteellisen päätöksenteon tukena. ...
  • Tiedonlouhinnan ja koneoppimisen menetelmät verkkohyökkäysten havaitsemisessa 

    Rautiainen, Ilkka (2016)
    Tietokoneverkoissa toimivat hyökkääjät yrittävät jatkuvasti ohittaa käytössä olevia turvajärjestelmiä, ja pyrkivät kehittämään uusia tapoja kohteidensa vahingoittamiseen. Näitä hyökkäyksiä voidaan havaita tunkeilijan ...
  • Browse materials
  • Browse materials
  • Articles
  • Conferences and seminars
  • Electronic books
  • Historical maps
  • Journals
  • Tunes and musical notes
  • Photographs
  • Presentations and posters
  • Publication series
  • Research reports
  • Research data
  • Study materials
  • Theses

Browse

All of JYXCollection listBy Issue DateAuthorsSubjectsPublished inDepartmentDiscipline

My Account

Login

Statistics

View Usage Statistics
  • How to publish in JYX?
  • Self-archiving
  • Publish Your Thesis Online
  • Publishing Your Dissertation
  • Publication services

Open Science at the JYU
 
Data Protection Description

Accessibility Statement

Unless otherwise specified, publicly available JYX metadata (excluding abstracts) may be freely reused under the CC0 waiver.
Open Science Centre