dc.contributor.advisor | Semenov, Alexander | |
dc.contributor.advisor | Korneev, Georgiy | |
dc.contributor.author | Eremeev, Andrei | |
dc.date.accessioned | 2016-03-27T21:48:05Z | |
dc.date.available | 2016-03-27T21:48:05Z | |
dc.date.issued | 2016 | |
dc.identifier.other | oai:jykdok.linneanet.fi:1525091 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/49203 | |
dc.description.abstract | This thesis is devoted to the shortest path problem in social graphs. Social graphs represent individuals and social relationships between them. As for social networking sites, their users are represented as vertices of the social graph, and the relationship which indicates whether two users are friends in the social networking site are represented as edges of the social graph. Therefore, social graphs are widely investigated by sociologists in order to determine rules and properties of various social processes. Analysis of such social graphs may be used in prediction of results of election, or recommendation systems. Calculation of many social graph metrics requires computation of shortest paths between vertices of the social graph. Often, analysis of social graphs requires calculation of plenty of shortest paths, for instance, paths between each pair of vertices. Searching of plenty of shortest paths is needed in calculation of betweenness centrality of a vertex. The goal of the Master’s thesis is to synthesis an efficient shortest path searching algorithm. First, characteristics of social graphs are reviewed; thereafter, existing shortest path searching algorithms are reviewed based on defined requirements. Then, an efficient algorithm which is based on the Atlas algorithm, one of the existing algorithms, is synthesized. The Master’s thesis also tells how to implement the algorithm in Java more efficiently. The developed algorithm is under deployment into the Odnoklassniki social networking site, a Russian social networking site, which contains 205 million of users and 44 million of visitors per day (the eight most visited site in Russia and former Soviet Republics). The proposed algorithm solves the shortest path problem in social graphs with acceptable performance (50 ms per query), memory usage (less than 15 GB of the primary memory) and applicable accuracy (more than 90%). Also, the algorithm supports dynamic social graphs. | en |
dc.description.abstract | Tämä pro-gradu tutkielma käsittelee lyhimmän polun ongelmaa sosiaalisia
verkostoja mallintavissa sosiaalisissa graafeissa. Tämän työn kohteena ovat sosiaalisen
median sivustot, joissa kullakin käyttäjällä on profiili ja käyttäjät voivat
olla esimerkiksi toistensa ystäviä. Sivustoa mallintavan sosiaalisen graafin
solmut mallintavat näitä profiileja ja suuntaamattomat kaaret profiilien välisiä
ystävyyssuhteita. Laajemmin tällaisia graafeja käytetään esim. vaalien tulosten
ennustamiseen, tai suosittelujärjestelmissä suositusten koostamiseen. Monet
sosiaaliseen graafin ominaisuudet vaativat etsimään polkujoukkoja eri solmujen
ja solmuryhmien välillä. Sosiaalisen graafin analyysi vaatii usein laskemaan
paljon lyhimpiäpolkuja kahden solmun välillä. Tätä tarvitaan esimerkiksi mää-
ritettäessä solmun polkukeskeisyyttä. Työn keskeisenä tavoitteena on kehittää
lyhimmän polun etsintään tehokas yhdistelmäalgoritmi. Työssä esitellään ensin
sosiaalisten graafien ominaisuuksia. Tämän jälkeen esitellään keskeiset tunnetut
lyhintä polkua etsivät algoritmit, jotka vastaavat luotua vaatimusmäärittelyä.
Työn tuloksena esitetään tehokas algoritmi, joka perustuu Atlas-algoritmiin ja
joka kattaa myös muiden esiteltyjen algoritmien toiminnallisuuden. Opinnnäyte
kertoo myös miten algoritmi toteutetaan Java-kielellä tehokkaasti. Kehittetty
algoritmi on käyttöönottovaihessa Odnoklassniki - nimisellä sosiaalisen median
sivustolla, jolla toimii venäjänkielinen verkkoyhteisö. Ko. sivustolla on kaikkiaan
205 miljoonaa käyttäjää ja 44 miljoonaa kävijää päivässä (se on kahdeksanneksi
suosituin sivusto Venäjällä ja entisen Neuvostoliiton tasavalloissa).
Ehdotettu algoritmi ratkaisee lyhimmän polun ongelman eo. sivustosta muodostetussa
sosiaalisessa graafissa suorituskykyisesti vasteajan (50 ms per kysely),
muistin käytön (alle 15 GBs ensisijaisen muistin) ja saavutetun tarkkuuden
(yli 90%) suhteen. Algoritmi tukee myös dynaamisia sosiaalisia graafeja. | fi |
dc.format.extent | 1 verkkoaineisto (70 s.) | |
dc.format.mimetype | application/pdf | |
dc.language.iso | eng | |
dc.rights | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. | fi |
dc.rights | This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. | en |
dc.subject.other | social graph | |
dc.subject.other | social network analysis | |
dc.subject.other | shortest path problem | |
dc.subject.other | Odnoklassniki | |
dc.subject.other | the Atlas algorithm | |
dc.title | The spanning tree based approach for solving the shortest path problem in social graphs | |
dc.identifier.urn | URN:NBN:fi:jyu-201603281950 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Tietojenkäsittelytieteiden laitos | fi |
dc.contributor.laitos | Department of Computer Science and Information Systems | en |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.oppiaine | Ohjelmistotuotanto | fi |
dc.date.updated | 2016-03-27T21:48:05Z | |
dc.rights.accesslevel | openAccess | fi |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 601 | |
dc.subject.yso | graafit | |
dc.subject.yso | algoritmit | |
dc.subject.yso | sosiaaliset verkostot | |
dc.subject.yso | sosiaalinen media | |
dc.format.content | fulltext | |
dc.type.okm | G2 | |