Contextual and structural metadata in enterprise document management
Väitöskirjatutkimuksessa tarkasteltiin dokumenttikokoelmiin liittyvän, dokumenttien tuottamisympäristöstä ja dokumenttien loogisesta rakenteesta kertovan tiedon keräämistä ja hyödyntämistä. Dokumenttien tuottamisympäristöä kuvaavaa tietoa kutsutaan kontekstimetatiedoksi ja loogisen rakenteen kuvausta rakennemetatiedoksi. Tutkimuksen tuloksena esitellään useita menetelmiä, kuten dokumenttien analysointimenetelmä, dokumenttien rakenteiden suunnittelumenetelmä, jossa käyttäjät ovat itse mukana, tietotarvemääritysmenetelmä, rakenteisten tekstiarkistojen arviointimenetelmä, ja kontekstimetatiedon visualisointimenetelmä, jota voidaan käyttää tiedonhaun parantamiseen.Dokumenttianalyysissä kerätään tietoa mm. dokumenttien tuottamisprosessista, tuottamiseen ja käyttöön liittyvistä toimijoista sekä dokumenttien suhteista toisiinsa. Analyysimenetelmään kuuluu oleellisena osana käyttäjien tietotarpeiden määrittely. Tietotarvemäärittelyyn kuuluvissa haastatteluissa hyödynnetään dokumenttien tuottamisympäristöön liittyvää tietoa. Analyysin tuloksena saadaan alustavat rakennemäärittelyt dokumenteille. Väitöskirjassa esitetään myös XML-kielellä laadittu rakennemäärittely kontekstimetatiedolle.Virpi Lyytikäisen tutkimuksen tuloksia voidaan soveltaa organisaatioissa, joissa halutaan kehittää elektronisten dokumenttien hallintaa. Dokumenttianalyysimenetelmän soveltuvuutta on testattu niin pienessä, muutaman hengen organisaatiossa kuin suuressa organisaatioiden verkostossakin. Kontekstimetatiedon visualisointi on hyödyllistä tilanteissa, joissa on tärkeää tuntea dokumenttien tuottamisprosessi ja tuottamiseen osallistuvat toimijat. Esimerkki tällaisesta tilanteesta voisi olla vaikkapa monimutkaisia tuotteita työstävä teollisuuslaitos, jonka useiden alihankkijoiden vastuulla on tuottaa osa tuotteeseen liittyvästä dokumentaatiosta. Visualisoitu kontekstimetatieto voisi toimia käyttöliittymänä eri osapuolten tuottamaan tietoon.
Documents have a central role in organizations. While the amount of information continually increases, new kinds of methods for managing the documents are needed. Enterprise document management concerns the whole life cycle of documents in organizations, from emergence to disposition, and also development of document management solutions. The utilization of metadata describing documents has been seen as an answer to the problems of finding relevant and avoiding irrelevant information. Previous research on metadata has commonly concentrated on defining appropriate metadata for document instances. This thesis is, however, focused on metadata related to collections of documents. The thesis emphasizes contextual and structural metadata of document collections. Information about the context where documents are produced or used is called contextual metadata. In the thesis, however, contextual metadata refers only to document production context. Structural metadata, on the other hand, describes the logical structure of the documents by document type definitions or schemas. The thesis describes methods and techniques for collecting and using the metadata. The methods and techniques were developed and tested in three projects in three case environments. The results of the thesis show how contextual and structural metadata can be collected and utilized in document analysis, user requirements elicitation and information retrieval. An example of a contextual metadata schema in XML format is also included. In the future, security issues, like access rights, could be included in the metadata definition.
