Knowledge mining using robust clustering

Äyrämö, Sami

Katso/Avaa

8.3 Mb

Lataukset:

Show download details Hide download details

Julkaistu sarjassa

Jyväskylä studies in computing

Tekijät

Äyrämö, Sami

Päivämäärä

2006

Oppiaine

Tietotekniikka

FM Sami Äyrämö tutki väitöstyössään suurten digitaalisten tietomassojen tehokasta hyödyntämistä ja siihen sovellettavia laskennallisesti älykkäitä niin kutsuttuja tiedonlouhintamenetelmiä (data mining). Aihe on ajankohtainen, sillä informaatiojärjestelmien nopea kehittyminen ja yleistyminen johtavat entistä useammin ”datatulvaan": digitaalisessa muodossa kerätään tietoa niin paljon, että oleellinen informaatio voi hukkua epäoleellisen ja moninkertaisen tiedon sekaan.Väitöstyönsä päätuloksena Äyrämö esittelee luotettavan, laskennallisesti tehokkaan ja käyttäjälle yksinkertaisen klusterointimenetelmän, joka ei ota kantaa sovelluskohteeseen ja on siten hyvin yleiskäyttöinen. Menetelmän pohjana Äyrämö on käyttänyt niin sanottuja prototyyppipohjaisia osittavia klusterointialgoritmeja.Usein tietovarastot ovat liian suuria selailtavaksi manuaalisesti tietokoneella. Datan klusteroinnin tavoitteena on löytää datasta ryhmiä eli klustereita, joiden sisällä havainnot ovat mahdollisimman samanlais ... showmore

This work is devoted to the development of scalable and robust algorithms for data mining and knowledge discovery problems. The main interest lies in so-called prototype-based clustering methods that are implemented using iterative relocation algorithms. Different elements of prototype-based data clustering are discussed and basic algorithms are described. In order to support the usability of the new methods and algorithms, a modified knowledge mining process model is also proposed. The refined model is based on the well-known knowledge discovery process, but it emphasizes more domain analysis and ''black box'' nature of data mining. Significance and importance of knowledge mining are clarified by outlining the current body of the existing knowledge with real applications.As the main outcome of this thesis, a highly automated robust clustering method is presented. The method consists of a number of separately developed and tested elements such as initialization, prototype estimation, ... showmore

Julkaisija

University of Jyväskylä

ISBN

951-39-2655-9

ISSN Hae Julkaisufoorumista

1456-5390

Lisenssi