AlphaZero shakkikoneena
DeepMindin koneoppiva go:ta, shogia ja shakkia pelaava AlphaZero yllätti shakkimaailman vuoden 2017 lopussa omalaatuisella ihmisläheisellä pelityylillään ja kiistattomalla tehokkuudellaan. Tässä tutkielmassa haluttiin selvittää AlphaZeron rakennetta sekä sen taustalla olevia menetelmiä. Syy AlphaZeron menestykseen todettiin olevan sen ihmisistä riippumaton syvä vahvistettu oppiminen, sekä lupaaviin variaatioihin keskittyvä Monte-Carlo -puuhaku. Tiedon pohjalta pääteltiin, että AlphaZeron pelitilanteita analysoiva neuroverkko sekä liikkeitä etsivä puuhaku vastaavat yllättävän tarkasti perinteisten shakkikoneiden kaksiosaista mallia, mutta kummankin osan toteutus vaikuttaa olevan perinteisiä funktioita tehokkaampi. The world of chess was surprised in late 2017 by DeepMind's machine learning go-, shogi- and chess engine AlphaZero with it's unique human-like playstyle and it's undisputed efficiency. The objective of this thesis was to study the structure of AlphaZero and the methods used to complement it. According to the information gathered, the key to AlphaZero's success was it's human-independent deep reinforcement learning and it's Monte-Carlo Tree Search, that is able to concentrate on more promising variations. From these finds it was derived, that structure-wise AlphaZero resembles the traditional chess engine surprisingly well, but it seems AlphaZero's components are more effective in their tasks.
Asiasanat
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Kandidaatintutkielmat [5358]
Lisenssi
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Vahvistettu oppiminen ja sen sovellukset
Haaralahti, Elias (2019)Tässä kirjallisuuskatsauksessa tutustutaan vahvistettuun oppimiseen, joka on koneoppimisen menetelmä. Tavoite on käydä läpi koneoppimisen ja syväoppimisen menetelmiä ja verrata vahvistettua oppimista näihin. Vahvistetussa ... -
Darknet-liikenteen analysointi koneoppimisalgoritmeilla
Arikainen, Anna (2023)Tämä pro gradu -tutkielma käsittelee Darknet 2020 -nimisen datasetin testaamista random forest-, gradient boosting- ja logistic regression-algoritmeilla. Tutkimus toteutettiin konstruktiivisena tutkimuksena. Tutkimuksen ... -
DL_Track : Automated analysis of muscle architecture from B-mode ultrasonography images using deep learning
Ritsche, Paul; Faude, Oliver; Franchi, Martino; Finni, Taija; Seynnes, Olivier; Cronin, Neil (Bern Open Publishing, 2023) -
Tracking a rat in an open field experiment with a deep learning-based model
Kantola, Lauri (2021)New artificial neural network methods have changed the way animals are tracked in neuroscience and psychology experiments. The purpose of this thesis is to test the state-of-the-art method of animal tracking DeepLabCut and ... -
Neuroverkkoihin perustuva ja kovakoodattu tekoäly
Luoto, Andreas (2023)Tämä kirjoitelma on tehty kirjallisuuskatsauksena. Sen tavoitteena on tutkia kovakoodatun tekoälyn sekä neuroverkkoja hyödyntävän tekoälyn eroja ja miksi esimerkiksi shakkia käytetään usein niitä kehitettäessä. Tutkielmassa ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.