Näytä suppeat kuvailutiedot

dc.contributor.advisorKärkkäinen, Tommi
dc.contributor.advisorÄyrämö, Sami
dc.contributor.authorNurminen, Miika
dc.date.accessioned2008-01-08T09:30:29Z
dc.date.available2008-01-08T09:30:29Z
dc.date.issued2005
dc.identifier.otheroai:jykdok.linneanet.fi:959314
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/12507
dc.description.abstractTutkielman kokonaistavoite on vastata tietotulvan tuomiin haasteisiin tiedonlouhinnan tekniikoita käyttäen. Yleisenä tutkimuskohteena on tiedonlouhinta rakenteisista dokumenteista. Täsmällisemmin määriteltynä tutkimusongelma käsittää samaa skeemaa noudattavien XML-dokumenttien klusteroinnin ja tiedonhaun. Lisäksi käsitellään erilaisten haku- ja klusterointitekniikoiden yhdistämisen tuomia mahdollisuuksia dokumenttikokoelmien hahmottamisessa. Teoreettisessa osuudessa käydään läpi erilaisia indeksirakenteita, samanlaisuusmittoja, klusterointialgoritmeja ja hakumenetelmiä. Empiirisessä osuudessa on kehitetty ExtMiner-sovellus, joka tukee hakua, klusterointia ja visualisointia erilaisille XML-dokumenttikokoelmille.fi
dc.description.abstractThe overall objective of this thesis is to consider the challenges posed by information overflow using data mining techniques. The research concentrates on data mining from structured documents. More precisely, the research problem involves information retrieval and clustering from XML documents conforming to the same schema. The potential of combining various search and clustering techniques in order to comprehend document collections is considered. Various index structures, similarity measures, clustering algorithms and ranking techniques are reviewed in the theoretical part of this thesis. In the empirical part the ExtMiner-application is developed, supporting searching, clustering and visualization for various XML document collections.en
dc.format.extent137 sivua
dc.format.mimetypeapplication/pdf
dc.language.isofin
dc.rightsIn Copyrighten
dc.subject.otherdokumenttien klusterointi
dc.subject.othertiedonlouhinta
dc.titleTiedonlouhinta rakenteisista dokumenteista
dc.typemaster thesis
dc.identifier.urnURN:NBN:fi:jyu-200594
dc.type.dcmitypeTexten
dc.type.ontasotPro gradu -tutkielmafi
dc.type.ontasotMaster’s thesisen
dc.contributor.tiedekuntaInformaatioteknologian tiedekuntafi
dc.contributor.tiedekuntaFaculty of Information Technologyen
dc.contributor.laitosTietotekniikan laitosfi
dc.contributor.laitosDepartment of Mathematical Information Technologyen
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.oppiaineTietotekniikkafi
dc.contributor.oppiaineMathematical Information Technologyen
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.rights.accesslevelopenAccessfi
dc.type.publicationmasterThesis
dc.contributor.oppiainekoodi602
dc.subject.ysobibliometriikka
dc.subject.ysoklusterit
dc.subject.ysohakuohjelmat
dc.subject.ysomonimuuttujamenetelmät
dc.subject.ysotekstitietokannat
dc.subject.ysotiedonhaku
dc.subject.ysotiedonhakujärjestelmät
dc.subject.ysoXML
dc.format.contentfulltext
dc.rights.urlhttps://rightsstatements.org/page/InC/1.0/
dc.type.okmG2


Aineistoon kuuluvat tiedostot

Thumbnail

Aineisto kuuluu seuraaviin kokoelmiin

Näytä suppeat kuvailutiedot

In Copyright
Ellei muuten mainita, aineiston lisenssi on In Copyright