82
Aalto-yliopisto Perustieteiden korkeakoulu Tietotekniikan tutkinto-ohjelma Sini Pessala Linkitettyjen kevytontologioiden muutosten kuvaaminen Diplomity¨ o Espoo, 9. huhtikuuta 2015 Valvoja: Professori Eero Hyv¨ onen Ohjaaja: Diplomi-insin¨ ori Matias Frosterus Filosofian maisteri Jouni Tuominen

Linkitettyjen kevytontologioiden muutosten kuvaaminen · varten, sek a Katri Sepp al a, jonka kanssa hahmottelimme mutuun tarvittavia omi-naisuuksia. Suurkiitokset kuuluvat mutu-ty

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • Aalto-yliopisto

    Perustieteiden korkeakoulu

    Tietotekniikan tutkinto-ohjelma

    Sini Pessala

    Linkitettyjen kevytontologioiden muutostenkuvaaminen

    DiplomityöEspoo, 9. huhtikuuta 2015

    Valvoja: Professori Eero HyvönenOhjaaja: Diplomi-insinööri Matias Frosterus

    Filosofian maisteri Jouni Tuominen

  • Aalto-yliopistoPerustieteiden korkeakouluTietotekniikan tutkinto-ohjelma

    DIPLOMITYÖNTIIVISTELMÄ

    Tekijä: Sini Pessala

    Työn nimi:Linkitettyjen kevytontologioiden muutosten kuvaaminen

    Päiväys: 9. huhtikuuta 2015 Sivumäärä: vi + 76

    Professuuri: Mediatekniikka Koodi: T-75

    Valvoja: Professori Eero Hyvönen

    Ohjaaja: Diplomi-insinööri Matias FrosterusFilosofian maisteri Jouni Tuominen

    Ontologioiden avulla pyritään mallintamaan tiettyä alaa määrittelemällä kysei-seen alaan kuuluvia käsitteitä ja näiden välisiä yhteyksiä. Näitä käsitteitä voidaankäyttää alaa käsittelevän aineiston annotointiin. Lisäksi ontologioita voidaan lin-kittää toisiin ontologioihin, jolloin päästään hyödyntämään muualla tehtyä työtä.Ontologioita joudutaan luonnollisesti päivittämään, kun uusia käsitteitä tai muu-ta muutoksia tulee alalle. Tällöin myös kyseiseen ontologiaan linkittyneitä onto-logioita voi joutua muuttamaan, jotta linkittyneet ontologiat pysyvät keskenäänkonsistentteina.

    Tässä työssä luotiin mutu-työkalu auttamaan ontologiakehittäjää edellä kuvatus-sa muutostilanteessa. Työkalu välittää muutokset ontologiakehittäjälle, lajitteleemuutokset muutoksen tyypin mukaan sekä esittää nämä muutokset linkitetynontologian kehittäjälle. Tieteellisenä tuloksena työkalu sisältää algoritmin, jokapyrkii ennustamaan, milloin toisessa ontologiassa tapahtunut muutos aiheuttaamuutoksen kehittäjän ontologiaan. Työkalun tavoitteena on helpottaa linkitetynontologian päivitystä varsinkin suurilla muutosmäärillä.

    Työkalun luomia muutoslistoja sekä muutosten lajittelun toimivuutta testattiinontologiakehittäjillä todellisessa käyttötilanteessa. Työn tuloksena oli, että lajit-teluheuristiikka toimi aineistossa hyvin käsitteiden ominaisuuksien muutoksissaja auttaisi täten priorisoimaan läpikäytäviä muutoksia ontologiaa päivitettäessä.

    Asiasanat: linkitetyt ontologiat, erikoisontologiat, muutosten visualisoin-ti, muutosten luokittelu, ontologioiden kehitys, ontologioidenylläpito, tesaurukset, semanttinen web

    Kieli: suomi

    ii

  • Aalto UniversitySchool of ScienceDegree Programme of Computer Science and Engineering

    ABSTRACT OFMASTER’S THESIS

    Author: Sini Pessala

    Title:Visualising Changes in a System of Linked Lightweight Ontologies

    Date: April 9, 2015 Pages: vi + 76

    Professorship: Media Technology Code: T-75

    Supervisor: Professor Eero Hyvönen

    Instructor: Matias Frosterus M.Sc. (Tech.)Jouni Tuominen M.Sc.

    Ontologies aim to model a field by listing concepts and their relationships in thefield. These concepts are then used in annotating data regarding the field. Inaddition, ontologies can be linked to other ontologies, thus utilising the work andknowledge of other ontology developers. Naturally, ontologies need to evolve dueto the changes and advances of the field. In this case, also other ontologies linkedto the ontology might require updates to ensure the consistency of the ontologies.

    In this work, I created a tool for assisting the ontology developer in the abovedescribed update. The tool was named mutu and it conveys the changes tothe ontology developer, classifies the changes by their type and visualises thechanges for the developer. As a scientific contribution, this work introduces analgorithm for classifying changes by their priority. The algorithm aims to predictwhich changes in the related ontology will cause changes in the ontology of thedeveloper. The aim of the tool is to aid in updates with a large amount of changes.

    The created change lists and the performance of the change classification weretested in a real-life update task. The outcome of the evaluation was that thepriority classification performance was good with the changes of property values,thus being an aid in prioritising changes in updating ontologies.

    Keywords: linked ontologies, domain ontologies, change visualisation,change classification, ontology maintenance, ontology update,thesauri, Semantic Web

    Language: Finnish

    iii

  • Kiitokset

    Tämä diplomityö on tehty suurimmalta osin Aalto-yliopiston ja Helsingin yli-opiston yhteisessä Semanttisen laskennan tutkimusryhmässä osana FinnONTO2-hanketta.

    Haluan kiittää professori Eero Hyvöstä työni valvomisesta. Kiitokset kuuluvatmyös työni ohjaajille Matias Frosterukselle ja Jouni Tuomiselle aina käytettävänäolemisesta työni ohjaamiseen ja tukemiseen mitä mielikuvituksellisimmin tavoin.

    Kiitokset ansaitsee myös Osma Suominen, joka ohjelmoi ontorip-työkalun työtävarten, sekä Katri Seppälä, jonka kanssa hahmottelimme mutuun tarvittavia omi-naisuuksia.

    Suurkiitokset kuuluvat mutu-työkalun testikäyttäjille. Samaan soppaan pääseejälleen käsiksi, kun mutusta ilmestyy seuraava versio!

    Lisäksi tahdon kiittää muita Semanttisen laskennan tutkimusryhmäläisiä hetkistä,jotka liittyivät diplomityöhöni enemmän tai usein vähemmän. Kiitokset lähtevätmyös Finto-palvelun tiimille, joidenka kanssa työskennellessäni työni aihe on sy-ventynyt ja pölyttynyt kirjastomaailman ajatuksilla. Lopuksi kiitän vielä MattiNelimarkkaa diplomityöni loppurutistuksessa tukemisesta ja motivoinnista.

    Nummela, 9. huhtikuuta 2015

    Sini Pessala

    iv

  • Sisältö

    1 Johdanto 1

    2 Linkitetyt ontologiat 4

    2.1 Ontologioiden eroja . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2.2 Ontologioiden tekninen toteutus . . . . . . . . . . . . . . . . . . . . 9

    2.3 Ontologioiden linkittäminen ja yhdistely . . . . . . . . . . . . . . . 10

    3 Linkitettyjen ontologioiden päivittäminen 15

    3.1 Ontologioiden muutokset . . . . . . . . . . . . . . . . . . . . . . . . 15

    3.2 Ontologioiden kehittäminen . . . . . . . . . . . . . . . . . . . . . . 18

    4 Menetelmä 25

    4.1 Aikaisemmassa tutkimuksessa sivuun jääneitä aiheita . . . . . . . . 25

    4.2 Menetelmä ontologioiden suurten muutosmäärien esittämiseen . . . 27

    5 MUTU-muutostentunnistustyökalu 30

    5.1 MUTU-työkalun käyttäminen . . . . . . . . . . . . . . . . . . . . . 30

    5.2 Muutostyypit ja muutosten tärkeys . . . . . . . . . . . . . . . . . . 34

    5.3 Muutosten visualisointitavat . . . . . . . . . . . . . . . . . . . . . . 36

    5.4 MUTU päivityksen osana . . . . . . . . . . . . . . . . . . . . . . . 41

    6 MUTUn suoriutuminen 44

    6.1 Testikäyttäjät ja erikoisontologiat . . . . . . . . . . . . . . . . . . . 44

    6.2 Tulokset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    v

  • 7 Yhteenveto ja lopputulokset 56

    7.1 Tutkimuskysymyksiin vastaaminen . . . . . . . . . . . . . . . . . . 56

    7.2 MUTU-työkalun kehityskohteita . . . . . . . . . . . . . . . . . . . . 57

    7.3 Jatkotutkimusaiheita . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    LIITTEET 66

    A Loppukysely 67

    B Loppuhaastattelun runko 72

    C Kiinnostavat muutokset -taulukko 74

    D Muutosmäärät-taulukko 75

    E Erikoisontologiakehittäjien tekemät muutokset -taulukko 76

    vi

  • Luku 1

    Johdanto

    Luovimme päivittäin suurissa tietomassoissa etsien ja selaillen aineistoja. Modernithakukoneet löytävät helposti hakua vastaavia tekstimuotoisia asiadokumentteja,mutta ei-tekstipohjaisten aineistojen, kuten multimedian, äänitteiden tai museoe-sineiden, hakujärjestelmät eivät ole yhtä kehittyneitä [53].

    Näiden hankalasti haettavien aineistojen löytämistä voi parantaa lisäämällä me-tadataa hakukoneiden hyödynnettävässä muodossa. Esimerkiksi kirjaan voidaanliittää sen käsittelemät teemat tai museoesineestä voidaan ilmoittaa käytetty ma-teriaali. Jotta metadata olisi yhtenäistä, käytetään aineiston annotointiin alankäsitteitä kuvaavia sanaston kaltaisia malleja, kuten asiasanastoja [17], tesauruk-sia [17] tai kevytontologioita (engl. lightweight ontology) [15]. Käsitepohjaisia ke-vytontologioita on taas alettu ottaa käyttöön Suomen muistiorganisaatioissa vastaviimeisen kymmenen vuoden aikana.

    Jotta ontologiat tukisivat aineiston hakemista mahdollisimman hyvin, tulee niidenvastata aineiston annotoijan tarpeita sekä olla ajantasaisia. Tämä tarkoittaa, ettäontologioita ei luoda kerralla valmiiksi, vaan niitä täytyy kehittää ja päivittää.Ontologian kehittäjänä tulisi olla kyseisen aihealueen asiantuntija, jotta ontolo-gian rakenne ja käsitteiden väliset suhteet ovat muodostettu erikoisalan tiedonperusteella.

    Annotointiin tarkoitettujen ontologioiden koko vaihtelee tuhansista kymmeniintuhansiin käsitteisiin riippuen ontologian aihepiiristä. Laajimpia näistä ontolo-gioista kehitetään useamman henkilön voimin, joko samassa tai erillisissä ontolo-gioissa. Erillisissä ontologioissa kehitettäessä on mahdollista olla yksi laaja, yleisiäkäsitteitä sisältävä yleisontologia, jota laajentaa siihen linkitetty erikoisontologioi-den joukko. Tällaisia yleisontologioita ovat esimerkiksi SUMO [46] ja KOKO [16].

    Ontologiaa päivitettäessä voivat muiden alojen tai yleiskäsitteiden muutokset vai-

    1

  • LUKU 1. JOHDANTO 2

    kuttaa erikoisalan käsitteistöön. Läheisesti yhteistyötä tekevät ontologiakehittäjätvoivat tiedottaa muutoksista toisilleen suullisesti, kirjallisesti tai selaamalla onto-logian muutoslokia. Mikäli kehitystä tehdään fyysisesti eri paikoissa tai organisaa-tioissa, voi tiedonkulku olla hankalampaa, varsinkin mikäli erikoisalan ontologianpäivittäminen ei ole säännöllistä. Organisaation resurssien mukaan vaihteleva kehi-tys voi johtaa tilanteeseen, jossa katkonaisen kehityksen takia myös muuttuneidenkäsitteiden määrä voi olla suuri, eikä kunnollisia välineitä muutoksista tiedotta-miseen ole.

    Tämä diplomityö keskittyy tarkastelemaan, miten ontologioiden muutoksia voivälittää ontologiakehittäjille, joiden ontologia on linkittynyt muuttuneeseen on-tologiaan. Työssä keskitytään erityisesti yleisontologian muutosten välittämiseenerikoisontologian kehittäjille, mutta menetelmä on sovellettavissa myös suuriin yk-sittäisiin ontologioihin, joiden kehittäjillä on vastuullaan tietyn alan käsitteet.

    Tässä diplomityössä keskitytään seuraavaan tutkimuskysymykseen ja sen osaon-gelmiin:

    Miten kevytontologioita kehittävien erikoisontologiakehittäjien päivitystyötä voi-daan tukea, kun yleisontologian muutosmäärät ovat suuria?

    • Voidaanko yleisontologian muutoksista erotella automaattisesti sellaiset, jot-ka aiheuttavat muutoksia erikoisontologiassa?

    • Onko mahdollista käydä läpi nämä muutoskategoriat jossakin tietyssä jär-jestyksessä?

    Työssä keskitytään vain RDFS- ja SKOS-mallinnuskielillä esitettävissä oleviin ke-vytontologioihin. Työn ulkopuolelle rajautuvat raskasontologiat, ontologioiden va-lidointi [10, 69], muutosten levittäminen (engl. change propagation) [6] sekä ins-tanssidatan muutoksissa validina säilyttäminen [48].

    Tutkimuskysymyksiin vastattiin luomalla prototyyppityökalu muutosten esittämi-seen. Tämän prototyypin käyttöä arvioitiin todellisessa ontologiapäivitystilantees-sa.

    Diplomityön sisältö on seuraavanlainen: Luvussa 2 tutustutaan tarkemmin onto-logioihin sekä näiden välisiin linkkeihin. Muutoksiin ja kehitykseen linkitetyissäontologioissa syvennytään luvussa 3. Luku 4 listaa aikaisemmassa tutkimuksessasivuun jääneitä aiheita sekä esittelee menetelmän, jota on käytetty luvussa 5 esi-teltävän muutostyökalun pohjana. Luvussa 6 esitellään arviointi työkalun käytöstäpäivitystilanteessa. Luvussa 7 tarkastellaan vastauksia tutkimuskysymyksiin sekähahmotellaan tulevaisuuden tutkimus- ja kehityssuuntia.

  • LUKU 1. JOHDANTO 3

    Tämä diplomityö perustuu osittain mutu-työkalusta aikaisemmin julkaistuun ar-tikeliin [51].

  • Luku 2

    Linkitetyt ontologiat

    Termi ontologia on alun perin ollut käytössä filosofiassa merkitsemässä oppia to-dellisuudesta. Ontologiatutkimus voimistui erityisesti 80- ja 90-luvuilla, jolloin te-koäly-, ohjelmistokehitys- ja tietokantatutkimus huomasivat toisistaan tietämät-tään tarvitsevansa tapoja korkeamman tason konseptuaalisia malleja. Nämä alatomaksuivat ontologia-termin merkitsemään esityksiä käsitteistä ja niiden välisistäsuhteista. Gruber [21] määritteli ontologian olevan ”tietyn aihealueen käsitteistöneksplisiittinen malli” (suom. [63]). Tämä määritelmä on hyvin laaja, eikä juuri-kaan ota kantaa toteutustapaan, jotta se olisi yhteensopiva näiden kolmen alannäkemyksien kanssa. [57]

    Muita määritelmiä ja selityksiä ovat tarjonneet muun muassa Struder [61] sekäGuarino ja Giaretta [18]. Uschold ja Jasper [27] määrittelivät ontologian yleisem-min näin:

    An ontology may take a variety of forms, but it will necessarilyinclude a vocabulary of terms and some specification of their mea-ning. This includes definitions and an indication of how concepts areinter-related which collectively impose a structure on the domain andconstrain the possible interpretations of terms.

    Heidän määritelmänsä pyrkii kokoamaan yhteen useilla tieteenaloilla käytetyt on-tologiat tai ontologian kaltaiset tiedonesitystavat. Yksi keskeisistä ontologioidentarkoituksista on toimia yhteisenä ”sanastona”useamman toimijan kesken. Tämätarkoittaa, että hyödynnettävyyden takia ontologioiden tulisi olla yhteisesti sovit-tuja, koneluettavia formaaleja esityksiä. Tavoitteena on ontologioiden käyttäminenkommunikaation tehostamisessa sekä koneiden että ihmisten välillä toteuttaentäten Semanttisen Webin periaatteita [5].

    4

  • LUKU 2. LINKITETYT ONTOLOGIAT 5

    Sovelluskohde vaikuttaa vahvasti siihen millaisia tarpeita ontologiaa kohtaan on.Käyttötapa määrää paljonko käsitteitä tarvitaan ja kuinka paljon rakennetta kä-sitteisiin ja niiden välille tarvitaan. Gómez-Pérez ja kumppanit listaavat seuraaviakäyttökohteita ontologioille [20, s. 8]

    • luonnollisen kielen käsittely

    • tietämyksen hallinta

    • verkkokauppa

    • älykäs tietojen yhdistely

    • semanttinen web

    Tyypillisesti semanttisessa webissä toimivat agentit tarvitsevat päättelyyn paljonaksioomia ja rajoituksia sisältäviä ontologioita [24] kun taas tietämyksenhallinnas-sa on käytetty pääosin rakenteeltaan kevyempiä tesauruksia [25]. Seuraava alilukuesitteleekin erilaisia ontologioita sekä näiden luokittelutapoja.

    2.1 Ontologioiden eroja

    Ontologioita tehdään erilaisilla aloilla, kuten biologiassa, kirjastoissa ja tekoäly-tutkimuksessa, joten ontologioiden näkökulmat että käyttökohteet voivat erotatoisistaan huomattavasti. Aikaisemmassa tutkimuksessa ontologioita onkin luoki-teltu monin eri tavoin [37, 45, 65]. Seuraavaksi esittelen kaksi erilaista tapaa jao-tella ontologioita: Van Heijstin ja kumppanien [65] kahden näkökulman jaottelukäsitteistön rakenteiden sekä kohteen mukaan. Tämän jälkeen esittelen Lassilanja McGuinnessin [37] ontologian sisäisen rakenteen rikkauteen perustuvan jatku-mon. On hyvä huomata, että Van Heijstin sekä Lassilan ja McGuinnessin tavatjaotella ontologioita eivät ole toisiaan poissulkevia, vaan ne täydentävät toisiaan.Van Heijstin esitystapa keskittyy enemmän ontologioihin käyttötarkoituksen pe-rusteella ja Lassila ja McGuinness tarkastelevat ontologioiden rakennetta.

    Van Heijstin ja kumppanien ontologiakategoriat

    Jaottelu käsitteistön tyypin ja rakenteen mukaan kuvan 2.1 mukaisesti:

    • Termiontologiat (engl. Terminological Ontologies) ovat sanaston tyyppisiämalleja, jotka määrittävät tietyn alan termit.

  • LUKU 2. LINKITETYT ONTOLOGIAT 6

    Kuva 2.1: Van Heijstin ja kumppaneiden ontologiakategoriat [65] mukailtunaGómez-Pérezin ja kumppanien kuvasta [20]

    • Informaatio-ontologiat (engl. Information Ontologies) määrittävät skee-mamaisesti mallin tiedon tallennukseen tietokantaan.

    • Tiedonmallinnusontologiat (engl. Knowledge modelling Ontologies) pyr-kivät mallintamaan aihealuettaan. Tämän johdosta tiedonmallinnusontolo-giat ovat yleensä rakenteeltaan rikkaampia kuin informaatio-ontologiat.

    Jaottelu käsitteistön kohteen mukaan:

    • Sovellusontologiat (engl. Application Ontologies) ovat tiettyä sovellustavarten luotuja ontologioita. Nämä ovat yleensä kokoelmia erikois- ja yleison-tologioiden käsitteistä sekä sovelluskohtaisista laajennuksista. Sovellusonto-logiat eivät ole pääsääntöisesti uudelleenkäytettävissä muissa sovelluksissa.

    • Erikoisontologiat (engl. Domain Ontologies) sisältävät tietyn alan käsit-teistön.

    • Yleisontologiat (engl. Generic Ontologies) sisältävät yleisiä käsitteitä, joi-ta halutaan hyödyntää useammilla aloilla [65]. Yleisontologiat voivat sisältääjopa kymmeniä tuhansia käsitteitä ja erikoisontologiat voivat osaltaan laa-jentaa yleisontologioiden käsitteistöä.

  • LUKU 2. LINKITETYT ONTOLOGIAT 7

    Kuva 2.2: Lassilan ja McGuinnessin ontologiajatkumo [37] mukailtuna Gómez-Pérezin ja kumppanien kuvasta [20]

    • Yläontologiat (engl. Upper Ontology), joita aiemmin kutsuttiin englanniksitermillä Representation Ontologies, kuvaavat neutraalilla tavalla yleisimmäntason käsitteistöä. Yleis- ja erikoisontologiat pohjautuvat yläontologioidenluomille käsitejaoille [65]. Yläontologiat koostuvat tyypillisesti muutamistakymmenistä käsitteistä, joiden tavoitteena on kategorisoida muiden ontolo-gioiden käsitteet erillisiin kategorioihin.

    Lassilan ja McGuinnessin ontologiajatkumo

    Lassila ja McGuinness [37] jaottelevat ontologiat niiden sisäisten rakenteen rikkau-den mukaan ilmenevänä jatkumona (kuvassa 2.2).

    Heidän jatkumonsa sisältää seuraavat ontologioiden rikkaus- ja tarkkuustasot:

    • Kontrolloidut sanastot (engl. Controlled vocabularies) eli termilistat

    • Asiasanastot(engl. Glossary), joissa on termien listaamisen lisäksi niidenmäärittelyt luonnollisella kielellä.

    • Tesaurukset (engl. Thesauri) sisältävät termien välisiä yhteyksiä, muttaeivät välttämättä sisällä eksplisiittistä hierarkiaa.

    • Vapaamuotoinen hierarkia (engl. Informal is-a), jossa käsitteillä on ylä-käsite, mutta hierarkia ei noudattele formaalia luokkahierarkiaa.

    • Formaali luokkahierarkia (engl. Formal is-a), jossa käsitteet ovat yläkä-sitteensä aitoja alakäsitteitä, mikä mahdollistaa ominaisuuksien periyttämi-sen yläluokilta.

    • Varsinaiset instanssit (engl. Formal instance), jotka formaalin luokkahie-rarkian lisäksi sisältävät aihealueen instansseja.

  • LUKU 2. LINKITETYT ONTOLOGIAT 8

    • Kehykset (ominaisuudet) (engl. Frames (properties)), jonka tyyppisessäontologiassa käsitteille voi määritellä ominaisuuksia, jotka periytyvät käsit-teen alakäsitteille ja instansseille.

    • Arvorajoitukset (engl. Value Restrictions), jotka voivat rajoittaa instans-sien ominaisuuksien arvoja.

    • Yleiset loogiset rajoitukset (engl. General Logical Constraints), jossa on-tologiakehittäjä voi määritellä rajoitteita ensimmäisen kertaluvun logiikkaakäyttäen.

    • Erillisyys, käänteisyys, osasuhde (engl. Disjointness, Inverse, Part-Of )ja muut ilmaisuvoimaisemmat ominaisuudet ja menetelmät.

    Lassilan ja McGuinnessin jatkumo perusteella viivan vasemmalla puolella ole-via taksonomian omaisia ontologioita voidaan kutsua kevytontologioiksi (engl.lightweight ontology)[15] ja oikealla puolella olevia aksioomia ja rajoituksia sisäl-täviä ontologioita raskasontologioiksi (engl. heavyweight ontology)[20, s. 8]. Giunc-higlia [19] lisää vielä Lassilan ja McGuinnessin kevytontologian määritelmään vaa-timuksen yhtenäisestä, puumuotoisesta käsitehierarkiasta.

    Kun Lassilan ja McGuinnessin vuonna 2001 luomaa jatkumoa tarkastellaan nyky-ontologioiden ja ontologiakielien valossa, voidaan huomata että raskasontologioi-den ilmaisuskaala loppuu kesken. Esimerkiksi vuonna 2004 julkaistun OWL-ontolo-giakielen avulla pystyy ilmaisemaan sekä erillisyyttä että käänteisyyttä. Jatkumoatulisikin päivittää erittelemään myös nykyistä raskasontologioiden kirjoa.

    Toisin kuin Lassilan ja McGuinnessin jatkumo, ISO 25964-2 -standardi [26] näkee,että ontologian ja tesauruksen eroja ovat:

    • Ontologioissa instanssit ja luokat on erotettu toisistaan selvästi, kun taastesauruksissa tämä ei ole välttämätöntä

    • Tesaurukset on tarkoitettu ihmisten käytettäväksi, kun taas ontologiat ontehty koneluettaviksi. Tämän takia tesauruksissa on tärkeää olla listattunasaman termin muita muotoja, kun taas ontologioissa voi usein riittää vainoletusnimike (engl. prefLabel), sillä keskitytään päättelyyn.

    • Tesauruksissa on tärkeää erotella termin merkitykset toisistaan, esim. ”aura(maatalousväline)” ja ”aura (oire)”. Ontologioissa termitason disambiguoitiei ole niin tärkeää, sillä rakenne ei ole tarkoitettu käyttäjien nähtäväksi.

    • Ontologiassa on tärkeää esittää käsitteiden väliset suhteet eksplisiittisesti,kun taas tesauruksessa tarkoitus on tukea ihmistä sopivan termin etsimisessä.

  • LUKU 2. LINKITETYT ONTOLOGIAT 9

    Ontologioissa halutaan esimerkiksi erotella hierarkkiset ja osa-kokonaisuus-suhteet toisistaan, kun tesauruksissa riittää laajempi termi -suhde.

    Kuten ylläolevia ontologioiden luokitteluja tarkastellessa voi huomata, että onto-logioita voi jaotella useilla eri tavoilla näkökannasta riippuen. Lisäksi ontologia-käsitteen merkitys vaihtelee tutkimuksesta toiseen, kuten huomattiin verratessaLassilan ja McGuinnesin jatkumoa ISO 25964-2 -standardiin. Tämän merkityksenvaihtelevuuden takia esitän seuraavaksi, miten tässä työssä käytetään ontologia-termiä.

    Ontologia-termin määritelmä tässä työssä

    Tässä työssä:

    1. Ontologia on tesauruksenkaltainen kevytontologia sisältäen tuhansia käsit-teitä, mutta suhteessa vähän ominaisuustyyppejä. Ontologian sovelluskoh-teena on tiedonhaun tukeminen.

    2. Ontologian käsitteellä tulee aina olla määriteltynä yläkäsite ja hierarkia pe-rustuu luokkahierarkiaan.

    3. Käsitteellä on yksilöivä ja päivityksissä muuttumaton URI-tunniste ja mah-dollisuus olla nimikkeitä (engl. label) useammalla kielellä.

    On huomattava, että myös tesaurus voi täyttää yllä olevat vaatimukset, muttaontologialla näiden täytyy aina täyttyä.

    2.2 Ontologioiden tekninen toteutus

    Ontologioiden teknisen toteutuksen pohjana on Resource Description Framework -tietomalli (RDF) [38]. RDF perustuu subjekti-predikaatti-objekti-kolmikoihin (engl.triple). Subjekti on kuvailtava resurssi, predikaatti kertoo millainen ominaisuussubjektiin on liittyneenä ja objekti voi olla joko toinen resurssi tai literaaliarvo.Nämä kolmikot muodostavat suunnatun verkon kuvaten sen solmuja ja kaaria.Keskeinen asia käsiteresurssien verkon luomisessa on käsitteiden yksilölliset URI-tunnisteet (engl. Uniform Resource Identifier) [4]. URI-tunnisteet mahdollistavattietojen yhdistelyn, sillä yksilöllisiä tunnisteita tarvitaan käsitteeseen käsitteeseenviittaamisen, linkittämisen ja kuvauksen laajentamisen muissa tietolähteissä.

  • LUKU 2. LINKITETYT ONTOLOGIAT 10

    RDF itsessään sisältää vain tarvittavat elementit verkkomaisen datan esittämiseen.RDF Schema (eng. RDFS ) [42] laajentaa RDF:ää lisäämällä siihen luokkia jaominaisuuksia, jotka mahdollistavat käsite- ja ominaisuushierarkioiden luomisensekä rajoitteet. Koska RDF ja RDFS antavat vain mallin verkkomuotoisen datanesittämiseen, tarvitaan lisäksi RDF-muotoiseen dataan pohjautuvia tiedonesitys-kieliä ja -standardeja. Esimerkkinä näistä ovat SKOS (engl. Simple Knowledge Or-ganization System) [43] sekä OWL (engl. Web Ontology Language) [66]. SKOS onsuunniteltu sanastojen, luokitusten sekä kevytontologioiden esittämiseen, minkätakia siinä on valmiiksi ominaisuuksia ja luokkia käsitteiden ja nimikkeiden välistensuhteiden ilmaisemiseen, kuten skos:prefLabel- tai skos:closeMatch-ominaisuudet.OWL puolestaan on tarkoitettu raskaammille ontologioille. Sillä voi ilmaista ra-joituksia ja sääntöjä, mikä mahdollistaa logiikkaa hyödyntävän päättelyn.

    RDF itsessään ei ole tiedostomuoto, vaan tietomalli verkkomuotoisen datan e-sittämiseen. RDF-muotoisen datan tallennukseen onkin olemassa useita seriali-sointimuotoja. Aikaisemmin yleisin RDF-muotoisen datan serialisointimuoto oliRFD/XML [68], jossa RDF-graafi tallennettiin yleisesti käytössä olleessa XML-formaatissa. XML on yleisformaatti, joten se ei ole optimoitu RDF-muotoisen da-tan esittämiseen. Tämän takia RDF/XML-muotoisen datan lukeminen ja kirjoitta-minen on ihmiselle työlästä sen toisteisuuden vuoksi. Turtle-formaatti [3] sitä vas-toin suunniteltiin vartavasten RDF-muotoista dataa varten. Se on helposti ihmis-luettavaa ja se on myös tiedostokooltaan vastaava RDF/XML-tiedostoa huomatta-vasti pienempi. Lisäksi tuoreimpana serialisointimuotona on JSON-LD [36], missäRDF-data serialisoidaan nykyisin web-kehityksessä suosittuun JSON-formaattiin.

    2.3 Ontologioiden linkittäminen ja yhdistely

    Ontologioiden luominen on työlästä ja aikaa vievää. Usein onkin helpompaa hyö-dyntää tai laajentaa jo olemassa olevia ontologioita kuin luoda täysin uusi ontolo-gia. Olemassa olevia ontologioita ja muita tietolähteitä ei tarvitse kopioida omaanontologiaansa, vaan niihin voi viitata linkkien avulla. Tämä mahdollistaa toisillaontologioilla annotoidun datan hyödyntämisen muissa sovelluksissa. Lisäksi lin-kittämisen etuna on se, että kehittäjät eivät tee päällekkäistä työtä käsitteidenpäivittämiseen, vaan kehitysresurssit voidaan käyttää omien erikoiskäsitteiden yl-läpitoon.

    Ontologioita voidaan yhdistää tai liittää toisiinsa RDF-tietomallin avulla. RDF-tietomalli perustuu kolmikoihin, joten ontologioiden liityntäkohta on sellainen kol-mikko, jossa subjekti ja objekti ovat eri ontologioista Tällöin subjektin ja objektinnimiavaruudet eivät ole samat [7]. Tavoitteena on saada mahdollisimman paljon

  • LUKU 2. LINKITETYT ONTOLOGIAT 11

    yhtymäkohtia ontologioiden välille. Mitä enemmän näitä yhteyksiä eri käsitteidenvälillä on, sitä paremmin pystytään ymmärtämään miten ontologioiden käsitteetliittyvät toisiinsa. Periaatteessa ontologioita yhdistävä ominaisuus voi olla mikätahansa ja ontologioiden välillä voi olla useita erityyppisiä linkitettäviä ominai-suuksia. Tästä yleisimpänä esimerkkinä ontologioiden välisiin linkkeihin on onrdf:type-ominaisuus, jonka avulla usein määritellään käsitteelle yleinen tyyppi, ku-ten skos:Concept. Tässä työssä ontologioiden linkittämisellä tarkoitetaan kuitenkinkahden ontologian välisiä yhteyksiä, jossa yhdistävä ominaisuus on hierarkkinentai ekvivalenssiyhteys.

    Myös ontologioiden modularisoinnissa alalla keskitytään ontologioiden välisiin yh-teyksiin. Modularisoinnissa on kaksi päätapaa: suuresta ontologiasta pienempienmoduleiden eristäminen sekä laajan ontologian muodostaminen pienemmistä on-tologiamoduuleista.[55] Ontologioiden modularisointi kuitenkin on pääasiassa kes-kittynyt automaattisiin menetelmiin moduleiden eristämisessä, yhdistelyssä sekävalidoinnissa usein logiikkaa sisältävien ontologioiden kanssa. Tässä työssä kes-kitytään kevytontologioiden kehittäjiin, joten modularisointi alana rajautuu työnulkopuolelle.

    Linkitettyjen ontologioiden väliset yhteydet

    Ontologioiden välisten yhteyksien sanallinen kuvaaminen on rikasta sekä englan-niksi että suomeksi. Englanniksi voidaan puhua termeistä ontology mapping ja on-tology alignment, joissa ontologiat itsessään eivät muutu linkityksiä lisätessä, sekäontology reconciliation, jossa ontologioita voidaan muokata linkityksiä etsittäessäja lisätessä [11]. Lisäksi myös alignment-termiä vastaava ontology linking -termiäon esiintynyt kirjallisuudessa. Suomessa termejä peilaaminen, siltaaminen sekälinkittäminen voidaan käyttää sekä samaa aihealuetta olevien ontologioiden ettäylä-erikoisontologiaparien välisiin suhteisiin. Ripustaminen-termiä voi puolestaankäyttää vain kuvailtaessa erikoisontologian suhdetta yläontologiaansa ajateltaessaontologiaa tietojenkäsittelyn puumaisena tietorakenteena.

    Hameed ja kumppanit [23] ovat listanneet kolme rakennemallia ontologioiden lin-kittämiseen (kuvassa 2.3).

    Ontologiaparin väliset yhteydetLinkattavien ontologien välille on luotu suora linkitys ja ne ovat ontologia-kehittäjän hallittavissa. Menetelmä on joustava, mutta ylläpidettävien linki-tysten määrä kasvaa ja voi viedä ylimääräisiä resursseja.

    Ontologioiden yhteydet yhteiseen ontologiaanOntologiat on linkitetty yhteen yhteiseen ontologiaan, minkä ansiosta eri on-

  • LUKU 2. LINKITETYT ONTOLOGIAT 12

    Kuva 2.3: Hameedin ja kumppanien [23] rakennemallit ontologioiden lin-kittämiseen

  • LUKU 2. LINKITETYT ONTOLOGIAT 13

    tologioissa olevien käsitteiden välinen yhteys on tiedossa ilman erillisen linki-tyksen tekemistä. Varjopuolena menetelmässä on yhteisen ontologian ylläpitoja se, että linkit muihin ontologioihin eivät ole kehittäjän hallinnassa.

    Yhteisten ontologioiden yhteydet toisiinsaYhteiset ontologiat voi myös linkata toisiinsa, jolloin yhteydellisten ontolo-gioiden määrä kasvaa entisestään yhdellä ontologiaparin välisellä linkityk-sellä.

    Vastaava jako on myös esillä ISO 25964-2 -standardissa [26], jossa lisäksi maini-taan, että linkkauksilla on suunta. Tämä ei niinkään tule esiin tehdessä linkityk-siä yhdestä käsitteestä toiseen, vaan tilanteissa, joissa yhtäläisyyden esittämiseentarvitaan useampia käsitteitä sekä logiikkaa. Tässä työssä kuitenkin pitäydytäänlähtökohdassa, että ontologioiden väliset linkit ovat kahden yksittäisen käsitteenvälillä.

    On hyvä huomata, että Hameedin ja kumppanien tai ISO 25964-2 -standardin ra-kennemallit eivät ota kantaa siihen, mikä ontologioiden hierarkioiden suhde toisiin-sa on. Sunagawa ja kumppanit [62] esittelevät ontologioiden mahdolliset suhteettoisiinsa:

    Hierarkkinen suhdeOntologioilla on hierarkkinen suhde, jos on olemassa kolmikko, jossa predi-kaatti on hierarkkinen suhde ja kolmikon subjekti ja objekti ovat eri ontolo-gioista. Tällöin ontologioita kutsutaan yläontologiasi ja alaontologiaksi.

    ViittaussuhdeOntologioilla on viittaussuhde, jos on olemassa kolmikko, jossa subjekti jaobjekti ovat eri ontologioista. Tällöin puhutaan subjektin ontologiaa kutsu-taan lähdeontologiaksi ja objektin kohdeontologiasta.

    On hyvä huomata, että hierarkkinen suhde on erikoistapaus geneerisemmästä viit-taussuhteesta. Teoriassa ontologioiden väliset linkit voi toteuttaa käyttäen mitätahansa ominaisuutta, mutta kuitenkin käytännössä linkkaukseen käytetyt omi-naisuudet, varsinkin tesauruksissa, ovat ekvivalenssiyhteys, hierarkkinen sekä as-sosiatiivinen suhde [26]. Usein selkeyden ja teknisen toteutuksen yksinkertaisuu-den vuoksi linkitykset saatetaan tehdään vain ekvivalenssiyhteyttä käyttäen. Esi-merkkinä hierarkkisesta ontologiasuhteesta on muun muassa Yleinen suomalainenontologia YSO1 [54] erikoisontologioineen2 sekä SUMO [46] erikoisontologioineen,

    1http://www.seco.tkk.fi/ontologies/yso/2http://www.seco.tkk.fi/ontologies/

    http://www.seco.tkk.fi/ontologies/yso/http://www.seco.tkk.fi/ontologies/

  • LUKU 2. LINKITETYT ONTOLOGIAT 14

    kuten [46, 56, 58]. owl:sameA-suhde on käytössä esimerkiksi Freebasen3 ja DBpe-dian4 [39] välillä kun taas closeMatch-suhdetta on käytetty Kongressin kirjaston5,Saksan6 sekä Ranskan7 kansalliskirjastojen auktoriteettitietokantojen väliseen lin-kitykseen.

    Lopuksi esittelen ontologioiden välisten linkkien tallentamisvaihtoehtoja. Tesau-russtandardissa ISO 25964-2 [26] mainitaan, että ontologioiden linkitysten vaih-toehtoja tallennuspaikaksi ovat säilyttäminen ja ylläpito linkityksen lähde- taikohdeontologiassa, säilytys erillään kummastakin ontologiasta tai samassa järjes-telmässä kuin missä lähde- ja kohdeontologiat ovat. Tämä tarkoittaa, että ontolo-gioiden välisiä linkityksiä voivat tehdä muutkin kuin linkitettävien ontologioidenkehittäjät, joten kyseisten ontologioiden kehittäjät ole välttämättä tietoisia linki-tysten olemassaolosta. Mikäli linkityksiä ei ole julkaistu avoimesti, ei linkityksenkohteena oleva ontologia välttämättä tiedä linkityksistä, jolloin ei ole mahdollistahuomioida linkityksiä ontologioiden päivityksessä.

    3https://www.freebase.com/4http://dbpedia.org/5http://id.loc.gov/authorities/subjects.html6http://www.dnb.de/gnd7http://rameau.bnf.fr/

    https://www.freebase.com/http://dbpedia.org/http://id.loc.gov/authorities/subjects.htmlhttp://www.dnb.de/gndhttp://rameau.bnf.fr/

  • Luku 3

    Linkitettyjen ontologioiden päivit-täminen

    Tässä luvussa keskitytään linkitettyjen ontologioiden kehittämiseen ja kehittämisenaikana tehtäviin muutoksiin. Tarkastelun kohteena ovat vain olemassa olevienontologioiden muutokset, joten ontologioiden luominen tyhjästä ja aikaisempialähteitä tai ontologioita hyödyntäen rajautuu työn ulkopuolelle. Näihin voi tu-tustua muun muassa viitteissä [22, 50, 54, 67]. Luvussa tutustutaan ensin onto-logioiden päivityksiin ja muutoksiin yleisellä tasolla. Tämän jälkeen tarkastellaanmuutoksia konkreettisemmalla tasolla ja lopuksi perehdytään kirjallisuuteen onto-logioiden kehittämisestä sekä muutostyökaluista.

    3.1 Ontologioiden muutokset

    Ontologia voidaan luoda kerralla valmiiksi tiettyä tarkoitusta varten. Usein on-tologiaa kuitenkin halutaan päivittää vastaamaan muuttuviin tilanteisiin tai tar-peisiin. Klein ja Fensel [35] ovat määritelleet, että ontologian kehitystarpeet tu-levat joko ontologian aiheen, käsitteellistämisen tai spesifikaation muutoksista.Flouris ja kumppanit [14] ovat lähestyneet päivitystarvetta käytännöllisemmästänäkökulmasta listaten muutokseen alla olevat syyt:

    • maailma on muuttunut

    • muutos näkökulmaan, jolla ontologian aihepiiriä tarkastellaan

    • löydetty ongelma alunperäisessä käsitteellistämisessä

    • halu lisätä uusia ominaisuuksia käyttäjätoiveiden pohjalta

    15

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 16

    • aihepiiristä aikaisemmin saavuttamattomissa olleen tiedon saaminen

    Mädche ja kumppanit [41] taas listaavat syitä ontologioiden muutokseen ohjelmis-totuotannon näkökulmasta. Ontologian muutoksia aiheuttavat heidän mukaansa:

    • käyttöympäristön muutos, esimerkiksi ontologiaan voidaan haluta sisällyttääuuden alan käsitteistöä

    • käyttäjävaatimusten muutos, esimerkiksi ontologiaa käyttävälle sovelluksellevoi tulla uusi käyttäjäryhmä

    • ontologian käyttöä tarkkailtaessa huomatut uudet vaatimukset

    Näissä kaikissa muutoslistoissa on yhteistä se, että muutospaineen tuo joko ai-hepiirin tai käyttöympäristön muutos. Ontologiat eivät siis eivät ole pelkästäänaihepiirinsä kuvauksia, vaan niistä heijastuu myös niiden käyttötapa.

    Koska ontologioiden muutos- ja päivitystarpeet ovat erilaisia, ne voivat lähteä ke-hittymään erilaisiin suuntiin. Flouris ja kumppanit [14] listaavat eri näkökulmat,joista ontologioiden kehitystä ja muutoksia tutkimuksessa on tarkasteltu:

    • ontologioiden evoluutio, versiointi (engl. ontology evolution, versioning)

    • siltaaminen, morfismi, linjaus, artikulaatio, kääntäminen (engl. mapping,morphism, alignment, articulation, translation)

    • integraatio, yhdistely (engl. integration, merging)

    Ontologioiden evoluutio ja versiointi keskittyvät ratkaisemaan ontologioiden muu-toksista ja päivityksistä johtuvia yhteensopivuuden haasteita. Ala on kehittynyttietokantatutkimuksen skeemaevoluutiosta ja versioinnista (engl. schema evolutionand versioning) [48]. Tietokannoissa evoluutiolla tarkoitetaan skeeman muutostasiten, että muutoksen aikana dataa ei häviä. Verisoinnilla taas tarkoitetaan mah-dollisuutta kysellä dataa skeeman eri versioiden avulla. Ontologioiden kanssa evo-luutiolla tarkoitetaan usein ylipäätänsä muutoksia ontologiassa, kun taas versioin-nissa ollaan kiinnostuttu alaspäin yhteensopivuudesta sekä instanssidatan validinaja käytettävänä säilymisestä.

    Ontologioiden yhtäläisyyksien kartoittamiseen on useita samankaltaisia termejäja aloja. Näitä ovat ontologioiden siltaaminen, morfismi, linjaus, artikulaatio jakäännökset, jotka keskittyvät vaihtelevan sisältöisten ja esitystapaisten ontologioi-den välisten yhtäläisyyksien löytämiseen. Kyseessä voi olla esimerkiksi saman alan

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 17

    kaksi tai useampi ontologiaa, joiden samankaltaisuutta yritetään kartoittaa tai eri-koisontologia, joka halutaan linkittää yleisontologiaan. Suurin osa näistä aloista onkiinnostunut etsimään käsitteiden välisiä yhteyksiä ja esittämään tulokset halu-tussa muodossa, esimerkiksi ontologiaan lisättyinä linkkeinä ontologioiden välillätai ontologiana yhteisistä käsitteistä. Ontologioiden integraatiossa ja yhdistelyssätavoitteena on luoda uusi yhtenäinen ontologia hyödyntäen useampia ontologioitaja näiden välisiä linkityksiä.

    On hyvä huomata, että yllä esitellyt ontologioiden yhtäläisyyksien alat keskit-tyvät lähes pelkästään menetelmien kehittämiseen tai parantamiseen. Ontologiake-hittäjien tarpeet eivät ole juurikaan esillä ontologioiden evoluutiota käsittelevässäkirjallisuudessa.

    Muutostyypit

    Ontologian päivityksessä ontologiaan tehtäviä muutoksia voidaan kategorisoidausein eri tavoin. Klein ja kumppanit [33] ovat jakaneet ontologian muutokset kol-meen kategoriaan.

    • ei-loogiset muutokset, kuten muutokset luonnollisella kielellä esitettyihinarvoihin

    • loogisten määritelmien muutokset, eli muutokset käsitteen määrittelyyn,kuten subClassOf-ominaisuuden arvojen muutokset. Termi on harhaanjohta-va, koska sillä tarkoitetaan käsitteen muita kuin merkkijonoarvoihin tuleviamuutoksia eikä suinkaan logiikkaan liittyviä muutoksia.

    • tunnistemuutokset, kuten resurssien lisäykset tai poistot

    Yleisempi jakoperiaate on kuitenkin Stuckenschmidtin ja Kleinin [60] muutostenjako atomisiin (engl. atomic) sekä kompleksisiin (engl. complex change) muutok-siin. Atomiset muutokset tunnistetaan hyödyntämällä käytetyn ontologiakielenominaisuuksia, eikä tietoa ontologiasta itsestään käytetä. Kompleksiset muutoksettaas voivat hyödyntää tietoa ontologian rakenteesta tai ne olla yhdistelmä atomi-sia ja kompleksisia muutoksia. Lisäksi kompleksisia muutoksia voidaan käyttäämuutosten syiden tai vaikutusten esittämiseen.

    Klein ja Noy ovat useampaan otteeseen listanneet ontologioiden muutostyyppejä.Vuonna 2003 he listasivat yli 80 muutostyyppiä [34]. Muutostyyppejä ei oltu eri-telty tarkemmin, vaan mainittiin näiden pohjautuvat OWL-ontologiakielen omi-naisuuksiin. Oletettavasti muutostyypit ovat atomisia, sillä niiden tavoitteena onmallintaa ontologioiden muutoksia. Seuraavana vuonna he listasivat ontologioille

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 18

    22 muutosoperaatiota [48], jolloin tarkastelu kohdistui siihen, millaisissa muutok-sissa instanssidata säilyy validina. Lähes kaikki muutostyypeistä ovat kompleksisiayhdistäen useampia atomisia muutoksia ja tietoa ontologian rakenteesta. Lisäksimonet muutostyypeistä ovat ominaisuuksien määritelmien muutoksia tai muu-toksia millä käsitteillä kyseistä ominaisuutta voi käyttää. Kumpikin näistä muu-tostyyppilistoista oli siis tarkoitettu mallintamaan muutoksia raskasontologioissa,joiden skeemaa tyypillisesti muutetaan ontologiaa kehittäessä. Skeemamuutoksiaei juurikaan tehdä kevytontologioille, joten suurin osa muutoskategorioista jäisikäyttämättä kevytontologian muutoksia mallintaessa.

    Kompleksisia muutostyyppejä ovat listanneet myös muun muassa Stojanovic jakumppanit [59] sekä Stuckenschmidt ja Klein [60]. Stuckenschmid ja Klein määrit-telivät 120 kompleksista muutosta, mutta mainitsevat määrän kasvavan koko ajan,sillä kompleksisia muutoksia voi määritellä lisää. Lisäksi Klein [34] huomauttaa,että kompleksisia muutoksia ei voi täydellisesti tunnistaa, sillä käsitteisiin voidaantehdä muitakin muutoksia. Tämän takia kompleksisten muutosten tunnistaminenvaatii heuristiikkaa.

    Poiketen ontologioiden muutoksen näkökulmasta, tesaurusstandardi ISO 25964-1[25] listaa tesauruksen muutoksia kehittäjänäkökulmasta. Muutostyypit ovat sel-västi tarkoitettu ihmisten luettavaksi, sillä osa kuvauksista on epämääräisiä, kutenkohta ”k) hierarkian muuttaminen”. Monet muutoksista ovat kompleksisia muu-toksia yhdistellen useita muutoksia laajemmaksi käsitteelliseksi muutokseksi.

    3.2 Ontologioiden kehittäminen

    Tässä aliluvussa perehdytään ontologioiden kehittämiseen sekä linkitettyjen on-tologioiden kehityksen haasteisiin. Usein ontologia tai ontologiakokonaisuus ei oletäysin yhden kehittäjän vastuulla. Yleisempi tilanne on, että useampi kehittäjä ke-hittää samaa ontologiaa tai toisiinsa linkittyneitä ontologioita. Noy ja kumppanit[47] ovat listanneet seuraavia ontologioiden yhteiskehityksen ulottuvuuksia:

    Synkroninen vs. asynkroninen kehittäminenSynkronisessa kehityksessä ontologiakehittäjät pystyvät välittömästi näke-mään ontologiassaan muiden tekemät muutokset. Muutosten välitön näke-minen vähentää huomattavasti päällekkäisten muutosten tekemistä. Asynk-ronisessa kehittämisessä taas kehittäjät tekevät itsenäisesti muutoksia on-tologian kopioon ja nämä tehdyt muutokset lopulta yhdistetään. Koska ke-hittäjät eivät voi nähdä toistensa tekemiä muutoksia, voi yhdistelyssä tullapäällekkäisiä tai ristiriitaisia muutoksia. Nämä ristiriidat tulee ratkaista on-tologioiden yhdistelyn aikana.

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 19

    Jatkuva julkaisu vs. ajoittainen arkistointi Jatkuvassa julkaisussa ontologi-an sen hetkinen versio on julkisesti nähtävillä. Täten ontologiasta ei ole erik-seen talletettuja ja nimettyjä versioita. Ajoittaisessa arkistoinnissa ontolo-giasta laitetaan esille ja tallennetaan julkaistava versio. Ero on siis versioin-nissa, ei julkaisutahdissa.

    Kuratoitu vs. kuratoimaton Kuratoidussa ontologiassa ennen ontologian jul-kaisua ontologian kehityksen vastuuhenkilö käy läpi ontologian muutoksetyksitellen joko hyväksyen tai hyläten ne. Kuratointi tapahtuu lähes ainaajoittaisen arkistoinnin ontologioissa ennen seuraavan version julkaisua.

    Valvottu vs. valvomaton Valvotussa ontologiakehityksessä ontologiassa tehdytmuutokset sekä niihin liittyvä mahdollinen metadata tallennetaan. Valvo-mattomassa ontologiakehityksessä taas muutoksia ei tallenneta ollenkaan taine eivät ole hyödynnettävissä muissa työkaluissa.

    Ontologioiden yhteiskehityksessä on tyypillistä, että kehittäjillä on erilaisia roole-ja. Esimerkiksi kaikki kehittäjät eivät välttämättä osallistu ontologian kuratoin-tiin. Varsinkin raskaiden ontologioiden kehityksessä on tyypillistä, että kehityk-sessä on erikseen aihealueen asiantuntijat sekä ontologiakehittäjät. Asiantuntijattietävät millaisia käsitteitä heidän alallaan on, mutta heillä ei ole konkreettista tie-toa ontologian rakentamisesta. Ontologiakehittäjät ilmaisevat ontologiamuodossaasiantuntijoiden mallit alastaan. Samoin tesauruksissa tesauruskehittäjä voi kysyäasiantuntijoilta apua termien määritelmiin ja käsitteiden suhteisiin, mikäli ala onhänen osaamisalueensa ulkopuolella.

    Mikäli ontologiakehittäjillä on omat vastuualansa ontologioiden kehittämisessä, elihe toimivat asiantuntijoina ja ontologiakehittäjinä samanaikaisesti, voidaan roo-lit jakaa käsitteiden aihealueiden mukaan. Yksi kehittäjä voi olla vastuussa esi-merkiksi maatalouteen liittyvistä käsitteistä ja toinen kalan kasvatusta sivuavista.Ontologioiden kehittäminen pienempinä ontologioina ja näistä ontologiapalasistaisomman kokonaisuuden koostaminen helpottaa kehitystä. Yhdellä kehittäjällä onvain tietty aihealue työn alla, jolloin ontologia pysyy hallittavan kokoisena. On-tologioiden jakaminen pienempiin aihealueisiin mahdollistaa sen, että ontologiaatyöstää kyseisen aihealueen asiantuntija, jolloin ontologian sisällöstä tulee eksak-timpi.

    Yleensä useamman kehittäjän ontologiassa tavoite on se, että kaikki kehittäjät pys-tyisivät kehittämään ontologiaa samanaikaisesti ja näkemään toistensa tekemätmuutokset. Valitettavasti yksittäisen ontologian yhteiskehitys ei ole aina mahdol-lista, jolloin organisaatiossa saatetaan haluta lähteä kehittämään omaa ontologiaa.Syitä voivat olla muun muassa:

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 20

    • Ontologian kehittäjäryhmään liittyminen voi olla rajoitettua. Kehittäjäksipääseminen voi vaatia tietyssä organisaatiossa olemista tai mahdollisuudensitoutua ontologian kehitykseen.

    • Ontologiaeditori ei välttämättä tue tiedostomuotoa, yhteiskehitystä tai se onliian kallis kehitysorganisaatioille.

    • Kehittäjien tai -organisaatioiden näkemykset ontologian tavoitteista ja kehi-tystahdista eivät vastaa oman organisaation tavoitteita. Ontologia voidaanhaluta tehdä muutoksia nopealla aikataululla, tehdä hyvin spesifejä muutok-sia tai pitää ontologia oman organisaation sisällä.

    Tilanteessa, jossa ontologiaa ei pystytä kehittämään yhtenä ryhmänä, vaihtoeh-tona on jakaa ontologian vastuualueet erillisiin ontologioihin, jolloin muodostuuyleisontologian ja sen erikoisontologioiden kokonaisuus.

    Linkitettyjen ontologioiden kehittämisen haasteet

    Verrattuna täysin erillään kehitettäviin ontologioihin, linkitetyissä ontologioissahyödynnetään muualla tehtyä työtä linkittämällä erillisiä ontologioita toisiinsa.Linkitettyjen ontologioiden kehityksen haasteena ovatkin nämä yhteydet muihinontologioihin. Luvussa 2.3 esiteltiin kaksi erilaista motiivia ontologioiden linkittä-miseen. Nämä vaikuttavat myös linkityksen ylläpitoon.

    Kun ontologia on linkitetty toiseen ekvivalenssiyhteyksien avulla, on tavoittee-na yleensä toisaalla tehdyn ontologian tai annotoidun aineiston hyödyntäminen.Ekvivalenssiyhteydellä ilmaistaan, että kaksi käsitettä ovat samat, eikä käsitteidenmerkitys useinkaan muutu radikaalisti ontologiaa päivitettäessä. Tämän takia kä-sitteiden välisten linkkien ajantasaisuutta ei tarvitse kriittisesti ylläpitää, sillä lin-kitys vain lisää ylimääräistä tietoa itsenäisesti toimivaan ontologiaan.

    Tilanne on toinen, mikäli käsitteitä on yhdistelty toisiinsa myös hierarkkisilla omi-naisuuksilla. Hierarkkiset ominaisuudet ovat transitiivisia ominaisuuksia vaatienkoko hierarkiaketjun olevan validi. Hierarkkisia suhteita voi hyödyntää päättelyyntai kyselynlaajentamiseen, joten näiden tulisi olla oikein, jotta haut tuottavat ha-luttuja tuloksia. Tällainen tilanne on esimerkiksi erikoisontologioilla, jotka ovatlinkittyneet yleisontologiaan saadakseen täydellisen hierarkian. Hierarkkisesti lin-kittyneessä ontologiassa on tärkeää tietää, mitä muutoksia linkityksen kohdeonto-logiassa on tapahtunut ja voivatko ne rikkoa hierarkian konsistenttiuden tai muu-ten luoda tarvetta lähdeontologian muuttamiseen.

    Luvussa 2.3 mainittiin myös, että riippuen ontologioiden välisen linkityksen säily-tys- ja ylläpitopaikasta, ei linkityksen kohteena oleva ontologia ole välttämättä tie-

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 21

    toinen koko linkityksen olemassaolosta. Jos kohdeontologia ei tiedä linkityksen ole-massaolosta, voidaan kohdeontologian kehityksessä tehdä ratkaisuja, jotka aiheut-taisivat epätoivottuja muutoksia linkityksen lähdeontologiaan. Vaikka linkityksetolisivat tiedossa, voivat ontologian kehittäjät päättää, että ontologiaa kehitetäänhaluttuun suuntaan, ja linkityksen lähdeontologiat joutuvat mukautumaan tämänkohdeontologian muutoksiin. Tällainen tilanne on usein yleisontologioilla, joihin onsitoutunut useita erikoisontologioita. Erikoisontologioiden tulisi siis reagoida yleis-ontologian muutoksiin ja täten varmistaa erikoisontologian konsistenttius. Tätenyleisontologian muutokset aiheuttavat muutospainetta erikoisontologiaan, muttaerikoisontologian muutoksia ei oteta huomioon yleisontologian kehityksessä.

    Mikäli linkittyneiden ontologioiden kehittäjien välinen yhteydenpito ei ole tiivistä,syntyy ontologioihin usein päällekkäisiä käsitteitä. Ontologioita voidaan kehittääsamanaikaisesti, mutta vasta julkaistusta versiosta saatetaan nähdä, että samakäsite on lisätty kumpaankin ontologiaan. Päällekkäisyyteen reagoiminen riippuuerikoisontologian kehitysperiaatteista. Mikäli erikoisontologian tarkoitus on kuva-ta alansa käsitteistö kattavasti, erikoisontologia tyypillisesti sisältää päällekkäisiäkäsitteitä yleisontologiansa kanssa. Tyypillisesti nämä päällekkäiset käsitteet onilmaistu ekvivalenssiyhteydellä, joten tässäkin tapauksessa voidaan lisätä ekviva-lenssi yleisontologian ja erikoisontologian saman käsitteiden välille. Erikoisontolo-gian tavoite voi myös olla listata vain yleisontologiasta löytymättömät erikoisalankäsitteet, ja siten minimoida päivitystyötä. Tällaisessa tilanteessa tulee tarkastellaonko päällekkäinen käsite sama, eli tulisiko erikoisontologian käsite poistaa. Var-sinkin samaan yleisontologiaan linkittyneiden ontologioiden välillä on usein paljonpäällekkäisyyksiä, vaikka alat tuntuisivat intuitiivisesti olevan sanastoltaan kauka-na toisistaan. Esimerkkinä työkalusta erikoisontologioiden päällekkäisyyksien tar-kasteluun on KOAN-työkalu1.

    Ontologian muutosten tunnistaminen ja esittäminen

    Aikaisemmassa tutkimuksessa ei ole eksplisiittisesti määritelty, mitä ontologioidenmuutokset ovat. Tässä työssä ontologian muutoksella tarkoitetaan sitä, että jon-kin URI-resurssin jonkin ominaisuuden arvoon tulee muutos. Käsitteen muutosvoi olla arvon lisäys, poisto tai muuttuminen. Tähän määritelmään mahtuu myöskäsitteiden lisääminen ja poistaminen, sillä käsite lisätään ontologiaan, jos onto-logiaan ilmestyy uusi subjektina toimiva URI-tunniste. Koska RDF-tiedostoissakolmikoiden järjestyksellä ei ole väliä, ei ontologian muutoksia pysty luotettavas-ti tunnistamaan ilman tiedoston lataamista muistiin ja muuttamista verkkomuo-toon. Tässä työssä ei tarkastella syntaktisen tason muutoksia, joita tulee seriali-

    1http://www.seco.tkk.fi/tools/koan/

    http://www.seco.tkk.fi/tools/koan/

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 22

    sointiformaattia vaihdettaessa, eikä tyhjien solmujen (engl. blank node) muutostentunnistamista.

    Ontologioiden tulee reagoida alansa sekä käsitteellistämisen muutoksiin. Tätä kut-sutaan ontologioiden kehittymiseksi (engl. ontology evolution) [14]. Noy ja Klein[48] listaavat kaksi tapaa ontologian kehittymiseen ja muutosten tunnistamiseen.Jäljitettävässä (engl. traced) ontologiakehityksessä muutokset ovat operaatioita janiihin voi reagoida heti muutoksen tapahduttua. Jäljittämättömässä (engl. un-traced) kehityksessä on vain kaksi ontologian versiota, eikä tietoa siitä, mitä ope-raatioita ontologioiden välillä on tehty. Nämä vastaavat valvottua ja valvomaton-ta ontologiakehitystä. Kummallakin muutosten tunnistustavalla on mahdollistalöytää ja listata ontologiaan tehdyt muutokset kahden version välillä.

    Ontologian muutoslokia tai kahta ontologiaversiota hyödyntämällä voidaan tunnis-taa ontologiassa tapahtuneet muutokset. Näitä muutoksia on mahdollista esittääeri muodoissa. Klein ja Noy [34] ovat esitelleet seuraavat muutosten esitysmuodot:

    Muutosloki (engl. change log) listaa ontologian aikaisemman ja myöhemmän ver-sion välillä tehdyt muutokset aikajärjestyksessä [34]. Muutosloki on helpposaada omasta kehitettävästä ontologiasta, mikäli ontologiaeditori tallentaamuutokset, mutta muualla kehitettävistä ontologioista ei välttämättä olemuutoslokia saatavilla. Ontologioiden yhteiskehityksessä tulee lisäksi haas-teita kehittäjien muutoslokien yhdistämisestä [34]. Muutosloki on esitysta-voista ainoa, joka mahdollistaa ajallisen tallentamisen ja täten muutostenkumoamisen tai uudelleen tekemisen.

    Rakennevertailussa (engl. structural diff ) listataan, mitkä käsitteet löytyvätmistäkin ontologiaversiosta sekä onko käsite uudelleennimetty [34]. Moder-neissa ontologioissa käsitteillä on pääsääntöisesti pysyvät URI-tunnisteet,joten rakennevertailutiedostosta ei ole juurikaan hyötyä.

    Käsitteellisillä muutoksilla (engl. set of conceptual changes) esitetään, mitenitse käsitteet ovat muuttuneet muutoksissa [34]. Esimerkiksi, uuden käsitteenlisäyksen myötä alkuperäisen käsitteen merkitys on voinut kaventua.

    Muutosjoukko (engl. transformation set) sisältää operaatiot, joita suorittamal-la ontologian vanhemmasta versiosta saadaan uudempi versio. Muutosjoukkoja muutosloki ovat samankaltaisia, mutta ne eroavat toisistaan muutamal-la tavalla. Ensinnäkin, muutosjoukko sisältää vain muutokset, jolla versionsaa muutettua toikseksi, kun taas muutoslokissa ovat kaikki käyttäjän te-kemät muutokset. Toisekseen, muutosjoukossa operaatioiden järjestykselläei ole väliä, kun taas muutoslokissa muutokset ovat aikajärjestyksessä. Tosinhyödynnettäessä muutosjoukkoa versiosta toiseen siirtymiseen, käsitteiden

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 23

    luominen tulee tehdä ennen muiden muutosten toimeenpanoa. Lopuksi, muu-tosjoukkoja voi olla useita mahdollisia kahden version välillä, kun taas muu-tosloki on yksi toteutettujen muutosoperaatioiden ilmentymä. Mikäli muu-toslokissa ei ole kumoamisoperaatioita, on muutosloki määrityksellisesti muu-tosjoukko.

    Ylläolevista esitysmuodoista vain käsitteellisten muutosten tunnistaminen vaatiiymmärrystä ontologian rakenteesta. Muutosloki, muutosjoukko sekä rakennever-tailu pystytään luomaan ilman ontologian rakenteeseen perehtymistä. Tosin mikälirakennevertailussa halutaan tietoa uudelleennimetyistä resursseista, vaatii tämäsekä tietoa ontologian rakenteesta että heuristista päättelyä määrittämään uudel-leennimeämiset.

    Muutosten välittäminen linkitettyihin ontologioihin

    Edellisessä aliluvussa esiteltiin esitystapoja yksittäisen ontologian muutosten lis-taamiseen. Linkitettyjen ontologioiden tapauksessa ontologian muutosten tunnis-tamisen jälkeen muutokset täytyy välittää muille ontologiaan linkittyneille ontolo-gioille. Ontologioiden muutosten välittämiseen (engl. change propagation) on kaksitapaa: työntävä välittäminen (engl. push-based) sekä vetävä välittäminen (engl.pull-based) [6], jotka vastaavat löyhästi synkronista ja asynkronista ontologiakehi-tystä.

    Vetävässä välittämisessä ontologiankehittäjä pyytää halutessaan muutokset onto-logioista, joihin hänen ontologiansa on linkittynyt. Työntävässä muutosten välit-tämisessä linkittynyt ontologia ei voi itse päättää, milloin ottaa muutoksia vastaan,vaan muutokset välitetään automaattisesti kehittäjän ontologiaan. Välitystiheyksiäon useampia [40]: Jaksottaisessa muutosten välittämisessä (engl. periodic delivery)muutokset työnnetään linkittyneisiin tietyn ajanjakson välein, kun taas vaihtuva-jaksoisessa välittämisessä (engl. ad-hoc delivery) ne työnnetään määrittelemättö-mien ajanjaksojen välein. Välittömässä muutokset työnnetään heti niiden onto-logiaan suorittamisen jälkeen. Työntävä välitön muutostenvälittäminen soveltuutilanteisiin, joissa linkitettyjen ontologioiden konsistenttius on tärkeää, sillä muissavälitysvaihtoehdoissa ontologiat voivat olla keskenään epäkonsistenteissa tiloissa.Hyväksyttäessä ontologioiden väliaikaiset epäkonsistenttiudet, on vetävä välittä-minen parempi vaihtoehto linkitettyyn kehittämiseen.[40]

  • LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 24

    Työkaluja ontologioiden muutosten hallitsemiseen

    Ontologioiden muutosten alalla ei ole syntynyt yhtenäistä muotoa ontologioidenmuutosten esittämiseen tai tallennukseen. Tämän takia on olemassa monia erillisiätyökaluja ontologioiden muutosten tunnistamiseen ja esittämiseen Nämä muutos-työkalut ovat jaettavissa kahteen päätyyppiin: muutoslokiin pohjautuviin ja muu-tosjoukkoon pohjautuviin.

    Muutoslokipohjaisia työkaluja ovat muun muassa Protégé-editorin Change-mana-gement-lisäosa [47] sekä Khattakin ja kumppanien nimetön Protégé-lisäosa [31],joista kumpikin olettaa, että ontologiaa kehitetään kyseisellä editorilla. Kumpikintyökaluista pohjautuu omaan muutosontologiaansa; ensimmäisessä ontologiana onChange and Annotation Ontology (ChAO) ja jälkimmäisessä Change History On-tology (CHO).

    Muutosjoukkopohjaisissa työkaluissa taas ei ole vaatimusta, että ontologiaa täytyisikehittää sillä editorilla, jolle muutostyökalu on ohjelmoitu. Esimerkkeinä tällaisistatyökaluista on ContentCSV-työkalu [28] sekä PROMT-lisäosa Protégé-editoriin[47], joka myöskin perustuu ChAO-ontologiaan muutosten esittämisessä.

    Muutoslokipohjaisten editorien etu muutosjoukkopohjaisiin on se, että saman edi-torin sisällä kehitettäessä muutokset tallennetaan aikajärjestyksessä, minkä lisäksiniihin voi lisätä ylimääräistä tietoa annotoimalla. Luonnollisesti lokipohjainenmuutosten esittäminen vaatii, että ontologian kaikki kehittäjät käyttävät samaaeditoria. Muutosjoukkopohjaisessa muutoksien esittämisessä muutokset voi tun-nistaa ontologiasta sen kahta versiota vertailemalla, jolloin kehittäjät eivät olesidottuja tietyn editorin käyttöön. Haittapuolena tällöin tosin on se, että mah-dollisesti menetetään editorin tuottamat muutostiedot, kuten milloin muutos ontehty ja kuka sen tekijä oli. Myöskään muutostietoja ei välttämättä saada näkyviinkehittäjän omassa editorissa, vaan hän voi joutua käyttämään erillistä ohjelmaamuutoksien tarkasteluun.

  • Luku 4

    Menetelmä

    Tässä luvussa tutustutaan ensin ontologioiden muutosten osa-alueisiin, jotka ovatjääneet vähälle huomiolle aikaisemmissa tutkimuksissa. Tämän jälkeen esittelenmenetelmän auttamaan erikoisontologioiden kehittäjiä yläontologioiden suurtenmuutosmäärien kanssa.

    4.1 Aikaisemmassa tutkimuksessa sivuun jäänei-

    tä aiheita

    Ontologioiden hyödyt tulevat parhaiten esille, kun ontologiaa käyttää ja kehittääsuuri määrä ihmisiä eri organisaatioista. Tämä kuitenkin johtaa erinäisiin haastei-siin ontologioiden kehityksessä. Pinto ja kumppanit [52] ovat huomanneet, että ai-kaisemmat tutkimukset eivät ole ottaneet huomioon, että käytännössä ontologiake-hitys on usein hajautettua, osittain autonomista, iteratiivistä ja sitä tekevät muut-kin kuin ontologiaekspertit. Avaan tarkemmin seuraavaa kolmea vähän käsitellyllähaasteella:

    • Katkonaisesta ontologiakehityksestä johtuvat suuret muutosmäärät.

    • Linkitettyjä ontologioita kehittävien organisaatioiden eroavat teknologisetvalinnat.

    • Ontologiakehittäjien näkökulma ja tarpeet ontologioiden muutoksista tiedot-taessa.

    25

  • LUKU 4. MENETELMÄ 26

    Katkonainen ontologiakehitys

    Kuten Pinto ja kumppanit [52] toivat esiin, ontologiakehitys on harvoin jatkuvaa.Vähäiset ajalliset tai taloudelliset resurssit johtavat siihen, että ontologioiden kehi-tys on usein jaksottaista. Linkitetyillä ontologioilla katkonainen kehitys voi johtaasiihen, että linkityksen kohdeontologiassa on voinut kehitystauon aikana tapahtuasuuri määrä muutoksia. Nämä muutokset tulisi käydä läpi ennen lähdeontologianomien päivitysten tekemistä, jotta ontologia pysyisi ajantasaisena ja konsistentti-na. Vaikka linkityksen lähdeontologiaa kehitettäisiinkin jatkuvasti, on myös mah-dollista, että kohdeontologia ei ole jatkuvan julkaisun mallissa. Tällöin ontologianuusi versio julkaistaan vain tietyn ajanjakson välein, jolloin muutokset tulevat yh-dellä kertaa suurena massana.

    Kummassakin ylläkuvaillussa tapauksessa haasteena on kehittäjälle tuleva suurimäärä muutoksia. Tällaisessa tilanteessa on vaikeaa saada käsitystä ontologian jakäsitteen muutoksista sekä ymmärtää, miten muutoksiin tulisi reagoida linkityksenlähdeontologiassa.

    Suurten muutosmäärien huomioimisesta ei ole ollut puhetta aikaisemmassa tutki-muksessa. Työkalujen arvioinnit on tehty pienillä ontologioilla, kuten tutkimuksis-sa [2, 32], ja kuvankaappauksissa on muutoksia kerrallaan nähtävissä vain muuta-mia, kuten tutkimuksissa [29, 47].

    Linkitetty ontologiakehitys eri organisaatioissa

    Luvussa 3.2 listattiin syitä, miksi erillisiä linkitettyjä ontologioita kehitettäisiinyksittäisen ontologian yhteiskehityksen sijaan. Koska linkitettyjä ontologioita ke-hitetään yleensä eri organisaatioissa, voi toisiinsa linkittyneiden ontologioiden ke-hittämiseen olla käytössä eri ontologiaeditoreita. Lisäksi editorien muutostyöka-luilla ei ole yhteistä muutostentallennusmuotoa, joten editoreiden väliset muutos-muodot ovat keskenään yhteentoimimattomia, eikä muutoksia voi siirtää editoristatoiseen ilman erillistä muunnosta. Ei ole myöskään itsestäänselvyys, että ontolo-gioista ylipäätään julkaistaisiin muutoslistoja julkisesti.

    Aiemmassa tutkimuksessa ei ole otettu huomioon linkitetyn ontologiakehityksenhaasteita eri editorien ja teknologioiden käytössä, vaan on oletettu, että hajautettukehitys tapahtuu samalla editorilla, kuten esimerkiksi Sunagawa ja kumppanit [62]ovat ajatelleet.

  • LUKU 4. MENETELMÄ 27

    Ontologiakehittäjien näkökulma

    Aikaisemmassa tutkimuksessa ollaan keskitytty uusien menetelmien ja työkalujenluomiseen ontologioiden muutosten tunnistamiseen ja välittämiseen. Näissä töissämuutosten esitysmuotojen ja optimaalisten käyttöliittymäratkaisujen tutkiminensekä ontologiakehittäjien tarpeet ovat olleet taka-alalla.

    Muutosten esittämistapoja on esitelty lyhyesti sanallisesti ja muutosten esittämi-sestä on ollut muutamia kuvankaappauksia, kuten [28, 47]. Kuitenkaan keskusteluakäyttöliittymätoteutusten hyvistä ja huonoista puolista ei ole.

    Valitettavan usein työkalujen arvioinneissa testikäyttäjät eivät ole itse ontologia-kehittäjiä, tai itse testit kestävät vain muutamia tunteja. Näillä saadaan kyllä tes-tattua toimiiko työkalu odotetusti, mutta arvokasta lisätietoa ontologiakehittäjientarpeista ja toiveista ei tule kentältä kuultavaksi. Poikkeuksena tälle ovat olleetMillerin ja kumppanien [44] suunnitteluperiaatteet, Noyn ja kumppanien [47] lis-taamat käyttäjätarpeet ontologioiden yhteiskehityksessä sekä Braunin ja kumppa-nien [8] SOBOLEO-editorin käytön arviointi.

    4.2 Menetelmä ontologioiden suurten muutosmää-

    rien esittämiseen

    Tässä luvussa esittelen oman menetelmäni siihen, miten erikoisontologiakehittäjilletulevia yleisontologian suuria muutosmääriä pystyy muuttamaan hallittaviksi jahavainnoitaviksi kokonaisuuksiksi. Alla käytän termejä yleisontologia ja erikoison-tologia selvyyden vuoksi, mutta menetelmä on sovellettavissa mille tahansa linkite-tyille lähde- ja kohdeontologioille. Lisäksi menetelmää voi hyödyntää myös yhteis-kehitettäviin kevytontologioihin, joissa kehittäjillä on vastuullaan tietyt merkitytkäsitteet.

    Menetelmä perustuu neljään pääajatukseen:

    • Yleisontologian muutosten läpikäyntijärjestystä voi priorisoida, koska kaikkiyleisontologian muutokset eivät välttämättä aiheuta muutoksia erikoisonto-logiaan.

    • Erikoisontologiakehittäjä voi hyötyä muistakin tiedoista kuin pelkästä listas-ta yleisontologian muutoksia.

    • Kaikki yleisontologian yhteen käsitteeseen tehdyt muutokset tulee nähdäkerralla.

  • LUKU 4. MENETELMÄ 28

    • Yleisontologian muutostietojen tulee olla editoririippumattomassa muodos-sa.

    Muutosten priorisointi

    Laajojen kevytontologioiden suurten muutosmäärien alla on tärkeää priorisoidamuutosten teon järjestystä. Kevytontologioita käytetään pääasiassa aineiston an-notoinnissa ja hakujärjestelmissä, joten ontologian konsistenttius ei ole niin kriit-tistä kuin päättelyyn käytettävillä raskasontologioilla. Tämän johdosta kevyton-tologioiden muutoksia voi priorisoida siten, että muutosten tarkastelu aloitetaanniistä yleisontologian muutoksista, jotka mitä luultavimmin vaativat muutoksiayleisontologiaan liittyneessä erikoisontologiassa. Tämä vastaa Falconerin ja kump-panien ehdottamaa muutosten suodattamista [12] sekä Braunin ja kumppanienraportoimaa tarvetta käyttäjäkohtaiselle personoinnille [8].

    Muutokset, jotka ovat tapahtuneet lähellä erikois- ja yleisontologian linkityskoh-tia voivat suuremmalla todennäköisyydellä aiheuttaa muutoksia erikoisontologias-sa kuin kauempana yhtymäkohdasta tapahtuneet muutokset. Esimerkiksi jos eri-koisontologia käsittelee kielitiedettä, on foneemi-käsitteen muutos todennäköisestikiinnostavampi kuin kaulahuivit-käsitteen, sillä erikoisontologialla on luultavastiyhteyksiä muihin kielitieteen käsitteisiin, muttei vaatetukseen liittyviin käsitteisiin.Kun tärkeimmät muutokset on käyty läpi, voidaan myös epätodennäköisemmätmuutospaineen aiheuttajat käydä läpi, mikäli resursseja on yhä käytössä.

    Vaikka yleisesti voi sanoa, että muutos on tärkeä ontologioiden linkityskohdanlähellä, vaikuttaa tärkeyteen lisäksi muita seikkoja. Myös tehdyn muutoksen tyyp-pi, ontologioiden väliseen linkitykseen käytetyt ominaisuudet sekä erikoisontolo-giassa käytössä olevat ominaisuudet voivat vaikuttaa siihen, mitkä muutokset ovaterikoisontologiakehittäjälle tärkeitä.

    Muitakin tietoja kuin lista muutoksista

    Yleisontologian muuttuessa voi erikoisontologian kehittäjälle olla hyödyllistä nähdämyös muutoksista johdettuja tietoja, esimerkiksi tieto siitä, mitkä yleisontologiaanlisätyistä käsitteistä jo ovat erikoisontologiassa. Tähän informaation tarvitaan ylei-sontologian muutostiedon yhdistäminen erikoisontologian tietoon vastaavasti kuinStuckenschmidtin ja Kleinin kompleksiset muutokset [60]. Muutosten esittämisenei tulisi välttämättä rajautua pelkkiin muutosten esittelemisiin vaan tarjota sel-laisia listoja ja näkymiä, mitä erikoisontologiakehittäjät tarvitsevat päivityksensätueksi.

  • LUKU 4. MENETELMÄ 29

    Käsitteen muutokset nähtävissä kerralla

    Ontologian käsitteen kaikki muutokset tulee olla kerralla nähtävissä, kuten Prompt-Diff-työkalussa [49]. Tämä mahdollistaa yleiskuvan saamisen käsitteestä, toisinkuin ISO 25964-1 -standardin pelkkä muutostyypeittäin listaaminen.

    Editoririippumattomuus

    Ontologioiden muutosten tunnistamiseen ja esittämiseen ei ole standardeja. Edito-rien tarjoamat muutosten tarkastelujärjestelmät poikkeavat toisistaan ja tuottavaterilaista muutosdataa. Välillä myös ontologiaeditoria voidaan haluta vaihtaa, jol-loin haasteeksi tulee muutostietojen muuttuminen. Lisäksi yleisontologiaa ja senerikoisontologioita ei välttämättä kehitetä samaa editoria käyttäen. Näiden syidentakia on tärkeää, että muutosten esittäminen ei vaadi editorispesifejä ratkaisuja,vaan että muutokset voidaan tunnistaa ja esittää mahdollisimman samankaltai-sesti editorista riippumatta.

  • Luku 5

    MUTU-muutostentunnistustyökalu

    Tässä diplomityössä kehitettiin prototyyppityökalu yleisontologian muutosten tun-nistamiseen ja välittämiseen erikoisontologiakehittäjille. Työkalu sai nimekseenmutu ja sen ominaisuudet perustuvat luvun 4 periaatteille.

    mutu-työkalun kehityksen pohjana olivat yleisimmät ominaisuudet, joita kevyton-tologioissa käytetään. Lisäksi kehityksen alussa keskusteltiin tarpeista ontologiake-hittäjän kanssa, minkä johdosta työkaluun sisällytettiin samannimisten käsitteidentunnistaminen yleis- ja erikoisontologian välillä sekä kehittäjälle turhien ominai-suuksien sivuuttaminen muutoslistoja luodessa. Lisäksi assosiatiivisen ominaisuu-den muutoksille lisättiin erilliset alakategoriat suhteen lisäykselle, poistolle sekäkorvaukselle.

    Tässä luvussa esitellään ensin, miten mutu-työkalua käytetään. Tämän jälkeenperehdytään muutostyyppeihin ja tärkeisiin muutoksiin. Lisäksi esittelen mitenmutu esittää muutokset sekä mitä muita skriptejä mutun käyttämiseen saatetaantarvita.

    5.1 MUTU-työkalun käyttäminen

    Kuvassa 5.1 on kaavio siitä, mitä tiedostoja tarvitaan mutu-muutoslistausten luo-miseen sekä mitkä ovat mutu-ohjelman pääkomponentit ja lopputulostiedostot.mutun itsensä toiminta jakautuu kolmeen osaan: muutosten listaamiseen, erikoi-sontologian muokkaamiseen sekä muutosten esittämiseen.

    30

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 31

    Kuva 5.1: mutun pääkomponentit syöte- ja tulostetiedostoineen

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 32

    Syötetiedostot

    mutu-ohjelma vaatii ajoonsa seuraavat tiedostot:

    • erikois-ja-yleisontologia-tiedostoRDF/XML-muotoinen tiedosto, joka sisältää erikoisontologian ja vanhan ver-sion yleisontologiasta

    • uusi versio yleisontologiastaRDF/XML-muotoinen tiedosto, joka sisältää uusimman version yleisontolo-giasta

    • serialisoidut lemmatyleisontologian etukäteen perusmuotoistetut nimikkeet

    • konfiguraatiotiedostotekstitiedosto, joka sisältää ontologioiden tietoja: ontologioiden käsitteidenkäytössä olevat nimiavaruudet ja erityyppisten ominaisuuksien URI-tunnis-teet. Lisäksi tiedosto sisältää listan ominaisuuksista, joiden muutokset tulisisivuuttaa.

    • lokalisointitiedostotekstitiedosto, joka sisältää muutoslistauksen otsikot ja muut tekstit yhdelläkielellä

    Muutosten listaaminen

    Muutosten listaamisessa edetään siten, että ensin selvitetään mitkä käsitteet onlisätty ja poistettu yleisontologiasta versioiden välillä. Lisätyt käsitteet löytyvätvain uudesta versiosta ja poistetut vain vanhasta versiosta. Kun lisättyjen ja pois-tettujen käsitteiden listat on luotu, tarkastellaan kummassakin ontologian versios-sa olleita käsitteitä.

    Ontologian muutoksien selvittäminen tehdään käsite kerrallaan, verraten mitäominaisuuksia ja niiden arvoja käsitteellä on ollut yleisontologian uudessa ja van-hassa versiossa diff-algoritmin avulla. Diff-algoritmin tuottamien lisäyksiä ja pois-toja yhdistelemällä voidaan esittää myös korvatut arvot, eli ominaisuudet, joille onsekä lisätty että poistettu arvo. Tämän jälkeen muutokset lajitellaan muuttuneenominaisuuden mukaan muutostyyppeihin.

    Samannimisten käsitteiden tunnistaminen perustuu yleis- ja erikoisontologian ni-mikkeiden perusmuotojen vertailuun. Tavoitteena on löytää mahdollisimman pal-jon ehdotuksia samoiksi käsitteiksi, joten vertailuun on sisällytetty sekä oletusni-mikkeet (prefLabel) että vaihtoehtoiset nimikkeet (altLabel). Kun on tunnistettu

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 33

    käsitteet, joilla on samannimisiä nimikkeitä, hylätään näistä käsiteparit, joilla onjo ekvivalenssiyhteys toisiinsa.

    Erikoisontologian muokkaaminen

    On mahdollista, että yleisontologiasta poistuneisiin käsitteisiin on luotu linkkejäerikoisontologiasta. Tämän takia tulee poistaa yhteydet näihin kolmikoihin erikoi-sontologiasta, jotta ontologiassa ei ole viittauksia olemattomiin käsitteisiin. Nämäpoistetut kolmikot listataan erikoisontologiakehittäjälle muutoslistausten yhtey-dessä.

    Muutosten esittäminen

    Muutosten listaamisen ja erikoisontologian konsistenttiuden varmistamisen jälkeenon edessä muutosten visualisointi. Muutostyyppilistojen muutokset käydään tyy-pittäin ja prioriteeteittain läpi ja näiden muutokset ohjataan visualisointiluokilletoteutettaviksi.

    Tulostetiedostot

    mutu-ohjelma tuottaa ajossaan kolme tiedostoa:

    • päivitetty erikois-yleisontologia-tiedostoRDF/XML-muotoinen tiedosto, joka on vastaava kuin syöttötiedoston erikois-ja-yleisontologia-tiedosto. Tämä tiedosto eroaa syötetystä tiedostosta siten,että yhteydet yleisontologiasta poistettuihin käsitteisiin on poistettu.

    • yleisontologia merkityillä muutoksillaRDF/XML-muotoinen tiedosto, joka on vastaava kuin syötetty yleisontologia-tiedosto, mutta ontologian sisältää ylimääräisiä ryhmiä listaamaan ja ryh-mittelemään muuttuneet käsitteet. Yksittäisen käsitteen tietää muuttuneensiitä, että sillä on subClassOf-suhde johonkin näistä ryhmistä.

    • muutoslistausHTML-verkkosivu, joka listaa muutostyypeittäin ja prioriteeteittäin muuttu-neet käsitteet sekä näyttää, miten käsitteet ovat muuttuneet. Sisältää myöslistan erikois-ja-yleisontologiasta poistetuista kolmikoista.

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 34

    5.2 Muutostyypit ja muutosten tärkeys

    mutu pyrkii helpottamaan erikoisontologiakehittäjien päivitystyötä luokittelemal-la yleisontologian muutokset sekä muutostavan että muutoksen tärkeyden mukaan.Muutostavan mukaan erotellessa on tavoitteena ryhmitellä yhteen samalla tavoinmuuttuneet käsitteet, sillä ne mitä luultavimmin aiheuttavat samankaltaisia muu-toksia erikoisontologiaan. Muutosten tärkeyden perusteella lajittelu mahdollistaasen, että ontologiakehittäjät kohdistavat mahdollisesti rajalliset kehitysresurssitensin sellaisiin muutoksiin, joilla on suurin todennäköisyys aiheuttaa muutoksiaerikoisontologiaan.

    Muutosten prioriteeteilla on kaksi arvoa: tärkeä tai muu. Tärkeät muutokset ovatsellaisia, jotka tulisi käydä läpi ennen muita muutoksia. Tärkeät muutokset onkuvattu alla muutostyyppien kohdalla ja muut muutokset ovat sellaisia, jotka eivätsovi tärkeiden muutosten määritelmään.

    mutussa on kaksi päämuutostyyppiä: muutokset käsitejoukossa sekä yksittäisenkäsitteen muutokset. Kuten alta muutostyyppilistasta voi huomata, jo päämuutos-tyypit eroavat toisistaan huomattavasti. Tämän takia ei ole mahdollista määrittääyhtä tiettyä testiä tai mittaa tärkeydelle, vaan se on määritettävä muutostyy-peittäin.

    Seuraavaksi esittelen kaikki mutussa olevat muutostyypit sekä listaan, millai-set muutokset ovat kyseisessä muutostyypissä korkeammalla prioriteetillä. Ennenmutu-ajoa on voitu määrittää, minkä ominaisuuksien muutokset eivät milloin-kaan kiinnosta erikoisontologian kehittäjää, joten nämä muutokset eivät edes il-mesty muutoslistauksiin.

    mutun muutostyypit ovat:

    • käsitejoukon muutokset

    – lisätyt käsitteet

    – poistetut käsitteet

    – samannimiset käsitteet

    • yksittäisen käsitteen muutokset

    – hierarkiamuutokset

    – nimikemuutokset

    – assosiatiivisuusmuutokset

    – osa-kokonaissuhdemuutokset

    – muut muutokset

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 35

    Käsitejoukon muutokset

    Käsitejoukon muutokset sisältävät kokonaisten käsitteiden lisäykset tai poistotsekä näihin liittyvät muut listaukset.

    Lisätyt käsitteetMuutos: Käsitteet, jotka on lisätty yleisontologiaan sen vanhan ja uudenversion välillä. Käsite löytyy uudesta versiosta, muttei vanhasta.

    Tärkeitä: Lisätyt käsitteet, joiden välillisellä tai välittömällä alakäsitteelläon yhteys erikoisontologian käsitteeseen. Erikoisontologian kehittäjän tuleetarkastella, onko koko hierarkiaketju linkitetystä erikoisontologiakäsitteestäontologian juureen yhä oikein.

    Poistetut käsitteetMuutos: Käsitteet, jotka on poistettu yleisontologiasta vanhan ja uuden ver-sion välillä, eli käsite löytyy vanhasta versiosta, muttei uudesta.

    Tärkeitä: Kaikki poistuneet käsitteet ovat tärkeitä, sillä käsitteet tulisi hau-data tai arkistoida ontologiasta poistamisen sijaan. Täten kaikki poistetutkäsitteet tulisi tarkistaa.

    Samannimiset käsitteetMuutos: Ei varsinainen muutos, vaan käsitteet, joilla on samoja nimikkeitä.Kaikkia nimikkeitä verrataan keskenään riippumatta nimikkeen ominaisuu-desta. Täten jos toisessa käsitteessä nimike ”home”on prefLabel-ominaisuu-dessa ja toisessa altLabel-ominaisuudessa, ehdotetaan näitä kahta käsitettäsamoiksi käsitteiksi. Lisäksi nimikkeet muunnetaan tarkastelua varten pe-rusmuotoon ja nimikkeitä verrataan vain kielittäin.

    Tärkeitä: Yleisontologiaan käsitteet, joilla on sama nimikkeen perusmuotokuin joillakin erikoisontologian käsitteellä, mutta näiden välillä ei ole ekviva-lenssiyhteyttä. Nämä käsitteet voivat olla sama käsite, jolloin näiden välilletulisi joko lisätä ekvivalenssiyhteys tai poistaa päällekkäinen käsite erikoi-sontologiasta.

    Käsitteiden muutokset

    Käsitteiden muutokset ovat ominaisuuksien arvojen lisäämisiä, poistoja tai kor-vauksia käsitteillä, jotka esiintyvät sekä yleisontologian vanhassa että uudessa ver-siossa.

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 36

    HierarkiamuutoksetMuutos: Käsitteen yläkäsite on lisätty, poistettu tai korvattu toisella käsit-teellä.

    Tärkeitä: Muutos käsitteessä, jonka välillisellä tai välittömällä alakäsitteelläon hierarkkinen yhteys erikoisontologian käsitteeseen. Tällaisessa tapaukses-sa on syytä tarkistaa onko hierarkiaketju vielä hyväksyttävä erikoisontolo-gian puolella.

    NimikemuutoksetMuutos: Käsitteeseen on lisätty, poistettu tai korvattu oletusnimike (prefLa-bel) tai vaihtoehtoehtoisia nimikkeitä (altLabel). Muutoksia vertaillaan kie-littäin.

    Tärkeitä: Oletusnimike (prefLabel) korvattu käsitteessä, jolla on ekvivalens-siyhteys johonkin erikoisontologian käsitteeseen. Tässä tapauksessa hyvä tar-kistaa, tarvitseeko myös erikoisontologian käsitteen nimikettä päivittää.

    AssosiatiivisuusmuutoksetMuutos: Käsitteeseen on lisätty, poistettu tai korvattu assosiatiivinen suhdetoiseen käsitteeseen.

    Tärkeitä: Muutos käsitteessä, jolla on ekvivalenssiyhteys johonkin erikoison-tologian käsitteeseen. On hyvä tarkistaa tarvitseeko myös erikoisontologiankäsitteen assosiatiivisia suhteita päivittää.

    Osa-kokonaissuhdemuutoksetVastaava kuin hierarkiamuutos, mutta partOf-ominaisuudelle.

    Muut muutoksetMuut muutokset ovat muutoksia muissa kuin yllä kuvatuissa ominaisuuksis-sa. Näitä ei ole lajiteltu prioriteetin mukaan.

    Yhteenvetona tärkeydestä voidaan tiivistää, että on tärkeää tarkistaa transitiivis-ten ominaisuusketjujen paikkansapitävyys lisätyillä käsitteillä, sekä hierarkia- jaosa-kokonaisuussuhteiden osalta. Muissa tapauksissa ekvivalenssikäsitteiden muu-tosten tarkastelu on riittävää.

    5.3 Muutosten visualisointitavat

    mutu-työkalulla lajitellut muutokset visualisoidaan erikoisontologiakehittäjille kah-della eri tavalla: verkkosivulla esitettävinä muutoslistoina sekä yleisontologiaan

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 37

    merkittyinä käsitteinä, jotka sisältävät rdfs:subClassOf-suhteen johonkin muutos-ryhmään.

    Muutoslistaus

    Muutoslistauksen perusajatuksena on listata aliluvussa 5.2 esitellyt muutokset.Kuvakaappauksia muutoslistauksesta löytyy kuvista 5.3-5.6. Muutoslistojen tuot-tohetkellä tärkeitä muutoksia kutsuttiin vielä ”kiinnostaviksi muutoksiksi”.

    Muutoslistauksen tavoite on esittää erikoisontologiakehittäjälle selkeästi ja ymmär-rettävästi yleisontologian muutokset muutostyypeittäin ja prioriteeteittäin. Muu-tokset esitetään verkkosivuna, josta voi avata ja sulkea muutoslistoja tarpeen mu-kaan (kuva 5.2). Listan nimen vieressä on suluissa numero, joka kuvaa kuinkamonta käsitettä on muuttunut kyseisellä tavalla. Tämän otsikkorivin alla on vieläkuvaus siitä, millaisia kyseiset muutokset ovat ja tärkeissä muutoksissa vielä sa-nallinen kuvaus siitä, millaiset muutokset ovat luokiteltu tärkeiksi.

    Käsitteistä esitetään aina vähintään oletusnimike ja sen perässä suluissa käsitteenURI-tunniste lyhennetyssä muodossa. URI-tunnisteet toimivat linkkeinä ja ne oh-jaavat ontologiaselaimeen, josta pääsee tarkastelemaan käsitteen tietoja.

    Seuraavaksi esittelen sanallisesti, miten eri muutostyypit on verkkosivulla esitettysekä missä kuvakaappauksessa ominaisuus on esillä.

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 38

    Lisätyt käsitteet Esitellään itse lisätyn käsitteen lisäksi ne lisätynkäsitteeseen lähimmät välilliset tai välittömätalakäsitteet, joilla on yhteys erikoisontologiaan.(Kuva 5.3)

    Poistetut käsitteet Jokaisen poistetun käsitteen vierestä pystyy laa-jentamaan näkyville kolmikot, jotka on poistettuontologian konsistenttiuden takaamiseksi. (Kuva5.4)

    Samannimiset käsitteet Löydettyjen käsitteiden listassa on ensin listattunimikkeen perusmuoto, jonka perusteella käsitteeton tunnistettu samoiksi. (Kuva 5.5)

    Yksittäisen käsitteen muutokset Käsitteen kohdalla on aina listattu käsitteen kaik-ki muutokset, mutta kyseisen muutostyypin muu-tokset on korostettu. Tämä mahdollistaa yleisku-van saamisen käsitteen muutoksista, sillä käsitteeneri ominaisuuksien muutokset vaikuttavat toisiin-sa. (Kuva 5.6)

    Nimikemuutokset Muutokset on eroteltu kielen mukaan. Tämänlisäksi erikoisontologian kehittäjän työtä onpyritty helpottamaan siten, että kielet onjärjestetty prioriteettijärjestykseen erikoisontolo-giassa käytettyjen kielten mukaan. Koska erikoi-sontologiakehittäjä korjaa yleensä koko käsitteenkerralla, olisi turhaa näyttää sama muutos moneenkertaan alempien prioriteettisten kielten listoissa.Täten listojen sisältävät muutokset ovat aina sel-laisia, joita ei ole aikaisemmissa kielissä esitelty.(Kuva 5.6)

    Assosiatiiviset muutokset Muista muutostyypeistä poiketen, assosiatiivisetmuutokset on jaoteltu edelleen lisäyksiin, poistoi-hin ja korvauksiin. Ontologiakehittäjien toive olipitää assosiatiiviset ominaisuudet erillään, sillä neovat ylimääräistä tietoa. (Muutokset on esitettyvastaavasti kuin kuvassa 5.5)

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 39

    Kuva 5.2: Kuvakaappaus mutu-työkalun tuottamasta muutoslistauksesta. Lisätytkäsitteet -kategoria on avattu, jotta nähdään tärkeiden (kuvassa ”Kiinnostavat”)ja muiden muutosten määrät.

    Kuva 5.3: Kuvakaappaus tärkeiksi luokitelluista lisätyistä muutoksista. En-simmäisellä rivillä on lisätty käsite ja sen alla on listattu sen lähimmät alakäsitteet,joilla on yhteys erikoisontologiaan.

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 40

    Kuva 5.4: Kuvakaappaus yleisontologiasta poistuneista käsitteistä. ”arvopa-pereidenvälittäjät”-käsitteen alla on avattu käsitteen poiston takia yleis-ja-erikoisontologiatiedostosta poistetut kolmikot.

    Kuva 5.5: Kuvakaappaus samannimisiksi tunnistetuista käsitteistä. Ensimmäisellärivillä on perusmuoto, jonka perusteella käsitteet on luokiteltu samaksi käsitteeksi.Tämän alla ovat käsitteiden oletusnimikkeet sekä URI-tunnisteet.

    Kuva 5.6: Tärkeiksi luokiteltuja nimikemuutoksia esimerkkinä käsitteen muutok-sien esittämisestä. Kyseisen muutosluokan ominaisuus on korostettu.

  • LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 41

    Ontologiaan merkityt muutokset

    Erikoisontologian kehitystiedostoon lisättävät muutokset on tarkoitettu tukemaanmuutoslistauksen käyttöä. Ontologiaan luotiin ylimääräisiä käsitteitä edustamaaneri muutostyyppejä ja näiden tärkeyksiä. Yleisontologian muuttuneet käsitteet lin-kitettiin sitten näihin eri muutostyyppeihin subClassOf-ominaisuuden avulla. Aja-tuksena oli, että erikoisontologiakehittäjä voisi ontologiaa muokatessaan nähdämyös ontologiaeditorissa muuttuneen käsitteen muutostyypin sekä listan muut-tuneista käsitteistä muutostyypeittäin. Tätä muutostyyppilistaa voisi hyödyntääpäivityksen edistymisen seuraamiseen. Nämä muutostyyppilistat voisi toteuttaamyös ontologiaeditorissa tehtävillä SPARQL-kyselyillä, mutta kaikkissa ontolo-giaeditoreissa ei ole tuke SPARQL-kyselykielelle. Tämän takia muutostyypit pitilisätä fyysisesti ontologiatiedostoon, eikä niitä voinut tuottaa ja päivit