18
Романова Романова Дина Дина Институт Систем Информатики СО РАН Институт Систем Информатики СО РАН Новосибирск Новосибирск

романова дина иерархическая система тегирования

Embed Size (px)

Citation preview

Page 1: романова дина иерархическая система тегирования

Романова Романова ДинаДина

Институт Систем Информатики СО РАНИнститут Систем Информатики СО РАННовосибирскНовосибирск

Page 2: романова дина иерархическая система тегирования

Способы структуризации информацииТаксономия Фолксономия

Page 3: романова дина иерархическая система тегирования

Тег – это метка, ключевое слово, идентификатор для категоризации, описания, поиска данных и задания внутренней структуры

Понятие тега

Облако тегов – это визуальное представление тегов, в котором размер шрифта тем больше, чем больше встречаемость тега

Page 4: романова дина иерархическая система тегирования

Статистика использования доменов первого уровня в виде облака тегов

Page 5: романова дина иерархическая система тегирования

Системы тегированияСервисы в сети Интернет:FlickrDelicousTechnorati

Программы, работающие в файловой системе:Tag2FindTaggToolTaggedFrogQuicksilver

Поиск с динамически изменяющимся облаком тегов:QuinturaSearch Cloudlet

Page 6: романова дина иерархическая система тегирования

Иерархическое тегирование

многопользовательская системаобщая структура ++ личное пространствовозможность ведения параллельных классификацийтегирование на основе онтологии

Таксономия (иерархия) ++ Фолксономия (теги)

Иерархическая система тегирования

Page 7: романова дина иерархическая система тегирования

Схема системы тегирования

БД

Impo

rt

Онтология

Файловаясистема

Иерархическая система

тегирования

У каждого пользовател

я есть личное

пространство

Page 8: романова дина иерархическая система тегирования
Page 9: романова дина иерархическая система тегирования

ТегированиеПосле загрузки документа пользователь

описывает его, используя форматкласс -> подкласс -> элемент : свойство1 = значение & свойство2

Любой тег может быть помечен как личный

:competitions -> Olympic Games: year = 2010 & city = Vancouver

Система тегирован

ия

Page 10: романова дина иерархическая система тегирования

Многообразие тегов

Использование свойств уменьшает количество неструктурированных тегов

В систему автоматически вносятся параметры документа (тип, размер, дата добавления, автор) => все документы доступны

При задании тега пользователю предлагаются близкие существующие теги=> уменьшается количество одинаковых слов

Page 11: романова дина иерархическая система тегирования

Анализ введенных данныхСтепень похожести тегов определяется как величина, обратно пропорциональная масштабированному расстоянию между словами, и измеряется в процентах.

Два тега считаются похожими, если нашлось слово A, принадлежащее первому тегу и слово B, принадлежащее второму тегу, такие что для них выполняется условие:

Page 12: романова дина иерархическая система тегирования

OWL

БД

parser

Система

тегирования

классы экземпляры классов

свойства классов

Система позволяет импортировать элементы онтологии и использовать их в качестве тегов

Структура тегов по онтологии

Page 13: романова дина иерархическая система тегирования

Структура тегов по онтологии

Ограничения на импорт онтологии:Онтология должна быть в формате OWL с синтаксисом

RDF/XMLИзвлекаются только классы, экземпляры классов и

datatype-свойстваСвойства импортируются без учета иерархии и

характеристикАксиомы и ограничения на классы и свойства при

импорте не учитываются

Page 14: романова дина иерархическая система тегирования

<?xml version= “1.0” ?><rdf:RDF><owl:Ontology rdf:about= “”><rdfs:comment>Онтология фигурного катания</rdfs:comment></owl:Ontology><owl:Class rdf:ID= “Elements”><rdfs:subClassOf rdf:resource= “http://www.w3.org/2002/07/owl#Thing” /><rdfs:label xml:lang=“ru”>Элементы</rdfs:label></owl:Class><owl:Class rdf:ID= “Jumps”> <owl:disjointWith> <owl:Class rdf:ID="#Spins"/> </owl:disjointWith>

<rdfs:subClassOf rdf:resource = “#Elements” /><rdfs:label xml:lang=“ru”>Прыжки</rdfs:label>

</owl:Class><owl:Class rdf:about= “Spins”>

<rdfs:subClassOf rdf:resource = “#Elements” /><rdfs:label xml:lang=“ru”>Вращения</rdfs:label>

</owl:Class><Jumps rdf:ID = “Axel” /><Jumps rdf:ID = “Lutz” /><Spins rdf:ID = “Layback” /><Spins rdf:ID = “SitSpin” /><owl:DatatypeProperty rdf:ID = “level”>

<rdfs:domain rdf:resource = “#Jumps” /><rdfs:range rdf:resource = “http://www.w3.org/2001/XMLSchema#float” /></owl:DatatypeProperty></rdf:RDF>

Elements Jumps

Axel Lutz

Spins Layback SitSpin

Page 15: романова дина иерархическая система тегирования

Навигация и поискОсновное преимущество иерархической системы

тегирования – быстрый доступ к документам по ключевым словам

Возможности поиска в иерархической системе тегирования:

Навигация по дереву теговРасширенный поиск, включающий в себя

поиск по названию документа, по тегам, по свойствам, по параметрам документа (тип, размер, дата добавления, автор)

Page 16: романова дина иерархическая система тегирования

Навигация и поиск

Page 17: романова дина иерархическая система тегирования

РезультатыПредложено:

новый подход к систематизации документов новый формат ввода тегов модель отображения онтологии в систему

тегирования

Реализовано: хранилище документов с авторизованным доступом многопользовательская иерархическая система

тегирования модуль, извлекающий классы, экземпляры,

свойства из документа OWL

Page 18: романова дина иерархическая система тегирования