AlphaZero shakkikoneena
Authors
Date
2019Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
DeepMindin koneoppiva go:ta, shogia ja shakkia pelaava AlphaZero yllätti shakkimaailman vuoden 2017 lopussa omalaatuisella ihmisläheisellä pelityylillään ja kiistattomalla tehokkuudellaan. Tässä tutkielmassa haluttiin selvittää AlphaZeron rakennetta sekä sen taustalla olevia menetelmiä. Syy AlphaZeron menestykseen todettiin olevan sen ihmisistä riippumaton syvä vahvistettu oppiminen, sekä lupaaviin variaatioihin keskittyvä Monte-Carlo -puuhaku. Tiedon pohjalta pääteltiin, että AlphaZeron pelitilanteita analysoiva neuroverkko sekä liikkeitä etsivä puuhaku vastaavat yllättävän tarkasti perinteisten shakkikoneiden kaksiosaista mallia, mutta kummankin osan toteutus vaikuttaa olevan perinteisiä funktioita tehokkaampi. The world of chess was surprised in late 2017 by DeepMind's machine learning go-, shogi- and chess engine AlphaZero with it's unique human-like playstyle and it's undisputed efficiency. The objective of this thesis was to study the structure of AlphaZero and the methods used to complement it. According to the information gathered, the key to AlphaZero's success was it's human-independent deep reinforcement learning and it's Monte-Carlo Tree Search, that is able to concentrate on more promising variations. From these finds it was derived, that structure-wise AlphaZero resembles the traditional chess engine surprisingly well, but it seems AlphaZero's components are more effective in their tasks.
Keywords
Metadata
Show full item recordCollections
- Kandidaatintutkielmat [4645]
Related items
Showing items with similar title or keywords.
-
DL_Track : Automated analysis of muscle architecture from B-mode ultrasonography images using deep learning
Ritsche, Paul; Faude, Oliver; Franchi, Martino; Finni, Taija; Seynnes, Olivier; Cronin, Neil (Bern Open Publishing, 2023) -
Darknet-liikenteen analysointi koneoppimisalgoritmeilla
Arikainen, Anna (2023)Tämä pro gradu -tutkielma käsittelee Darknet 2020 -nimisen datasetin testaamista random forest-, gradient boosting- ja logistic regression-algoritmeilla. Tutkimus toteutettiin konstruktiivisena tutkimuksena. Tutkimuksen ... -
Tracking a rat in an open field experiment with a deep learning-based model
Kantola, Lauri (2021)New artificial neural network methods have changed the way animals are tracked in neuroscience and psychology experiments. The purpose of this thesis is to test the state-of-the-art method of animal tracking DeepLabCut and ... -
Robustness, Stability, and Fidelity of Explanations for a Deep Skin Cancer Classification Model
Saarela, Mirka; Geogieva, Lilia (MDPI AG, 2022)Skin cancer is one of the most prevalent of all cancers. Because of its being widespread and externally observable, there is a potential that machine learning models integrated into artificial intelligence systems will ... -
Neuroverkkoihin pohjautuvat koneoppimismallit aivokuvantamismenetelmien tukena
Nordlund, Tuomas (2022)Keinotekoiset neuroverkot ovat tehokkaita laskennallisia työkaluja merkityksellisten piirteiden irroittamiseen suurista datamassoista. Aivokuvantamismenetelmien kehittyessä aivoista saadaan yhä enemmän dataa terveydenhuollon ...