Tiedonlouhinta rakenteisista dokumenteista

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Nurminen, Miika
dc.date.accessioned 2008-01-08T09:30:29Z
dc.date.available 2008-01-08T09:30:29Z
dc.date.issued 2005
dc.identifier.uri http://hdl.handle.net/123456789/12507
dc.description.abstract Tutkielman kokonaistavoite on vastata tietotulvan tuomiin haasteisiin tiedonlouhinnan tekniikoita käyttäen. Yleisenä tutkimuskohteena on tiedonlouhinta rakenteisista dokumenteista. Täsmällisemmin määriteltynä tutkimusongelma käsittää samaa skeemaa noudattavien XML-dokumenttien klusteroinnin ja tiedonhaun. Lisäksi käsitellään erilaisten haku- ja klusterointitekniikoiden yhdistämisen tuomia mahdollisuuksia dokumenttikokoelmien hahmottamisessa. Teoreettisessa osuudessa käydään läpi erilaisia indeksirakenteita, samanlaisuusmittoja, klusterointialgoritmeja ja hakumenetelmiä. Empiirisessä osuudessa on kehitetty ExtMiner-sovellus, joka tukee hakua, klusterointia ja visualisointia erilaisille XML-dokumenttikokoelmille. fi
dc.description.abstract The overall objective of this thesis is to consider the challenges posed by information overflow using data mining techniques. The research concentrates on data mining from structured documents. More precisely, the research problem involves information retrieval and clustering from XML documents conforming to the same schema. The potential of combining various search and clustering techniques in order to comprehend document collections is considered. Various index structures, similarity measures, clustering algorithms and ranking techniques are reviewed in the theoretical part of this thesis. In the empirical part the ExtMiner-application is developed, supporting searching, clustering and visualization for various XML document collections. en
dc.format.extent 137 s.
dc.language.iso fin
dc.rights This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. en
dc.rights Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. fi
dc.subject.other dokumenttien klusterointi
dc.subject.other tiedonlouhinta
dc.title Tiedonlouhinta rakenteisista dokumenteista
dc.type Book en
dc.identifier.urn URN:NBN:fi:jyu-200594
dc.subject.ysa bibliometriikka
dc.subject.ysa klusterit
dc.subject.ysa hakuohjelmat
dc.subject.ysa monimuuttujamenetelmät
dc.subject.ysa tekstitietokannat
dc.subject.ysa tiedonhaku
dc.subject.ysa tiedonhakujärjestelmät
dc.subject.ysa XML
dc.type.dcmitype Text en
dc.type.ontasot Pro gradu fi
dc.type.ontasot Master's thesis en
dc.contributor.tiedekunta Informaatioteknologian tiedekunta fi
dc.contributor.tiedekunta Faculty of Information Technology en
dc.contributor.laitos Tietotekniikan laitos fi
dc.contributor.laitos Department of Mathematical Information Technology en
dc.contributor.yliopisto University of Jyväskylä en
dc.contributor.yliopisto Jyväskylän yliopisto fi

This item appears in the following Collection(s)

Show simple item record