Upload
yury-katkov
View
288
Download
0
Embed Size (px)
Citation preview
Романова Романова ДинаДина
Институт Систем Информатики СО РАНИнститут Систем Информатики СО РАННовосибирскНовосибирск
Способы структуризации информацииТаксономия Фолксономия
Тег – это метка, ключевое слово, идентификатор для категоризации, описания, поиска данных и задания внутренней структуры
Понятие тега
Облако тегов – это визуальное представление тегов, в котором размер шрифта тем больше, чем больше встречаемость тега
Статистика использования доменов первого уровня в виде облака тегов
Системы тегированияСервисы в сети Интернет:FlickrDelicousTechnorati
Программы, работающие в файловой системе:Tag2FindTaggToolTaggedFrogQuicksilver
Поиск с динамически изменяющимся облаком тегов:QuinturaSearch Cloudlet
Иерархическое тегирование
многопользовательская системаобщая структура ++ личное пространствовозможность ведения параллельных классификацийтегирование на основе онтологии
Таксономия (иерархия) ++ Фолксономия (теги)
Иерархическая система тегирования
Схема системы тегирования
БД
Impo
rt
Онтология
Файловаясистема
Иерархическая система
тегирования
У каждого пользовател
я есть личное
пространство
ТегированиеПосле загрузки документа пользователь
описывает его, используя форматкласс -> подкласс -> элемент : свойство1 = значение & свойство2
Любой тег может быть помечен как личный
:competitions -> Olympic Games: year = 2010 & city = Vancouver
Система тегирован
ия
Многообразие тегов
Использование свойств уменьшает количество неструктурированных тегов
В систему автоматически вносятся параметры документа (тип, размер, дата добавления, автор) => все документы доступны
При задании тега пользователю предлагаются близкие существующие теги=> уменьшается количество одинаковых слов
Анализ введенных данныхСтепень похожести тегов определяется как величина, обратно пропорциональная масштабированному расстоянию между словами, и измеряется в процентах.
Два тега считаются похожими, если нашлось слово A, принадлежащее первому тегу и слово B, принадлежащее второму тегу, такие что для них выполняется условие:
OWL
БД
parser
Система
тегирования
классы экземпляры классов
свойства классов
Система позволяет импортировать элементы онтологии и использовать их в качестве тегов
Структура тегов по онтологии
Структура тегов по онтологии
Ограничения на импорт онтологии:Онтология должна быть в формате OWL с синтаксисом
RDF/XMLИзвлекаются только классы, экземпляры классов и
datatype-свойстваСвойства импортируются без учета иерархии и
характеристикАксиомы и ограничения на классы и свойства при
импорте не учитываются
<?xml version= “1.0” ?><rdf:RDF><owl:Ontology rdf:about= “”><rdfs:comment>Онтология фигурного катания</rdfs:comment></owl:Ontology><owl:Class rdf:ID= “Elements”><rdfs:subClassOf rdf:resource= “http://www.w3.org/2002/07/owl#Thing” /><rdfs:label xml:lang=“ru”>Элементы</rdfs:label></owl:Class><owl:Class rdf:ID= “Jumps”> <owl:disjointWith> <owl:Class rdf:ID="#Spins"/> </owl:disjointWith>
<rdfs:subClassOf rdf:resource = “#Elements” /><rdfs:label xml:lang=“ru”>Прыжки</rdfs:label>
</owl:Class><owl:Class rdf:about= “Spins”>
<rdfs:subClassOf rdf:resource = “#Elements” /><rdfs:label xml:lang=“ru”>Вращения</rdfs:label>
</owl:Class><Jumps rdf:ID = “Axel” /><Jumps rdf:ID = “Lutz” /><Spins rdf:ID = “Layback” /><Spins rdf:ID = “SitSpin” /><owl:DatatypeProperty rdf:ID = “level”>
<rdfs:domain rdf:resource = “#Jumps” /><rdfs:range rdf:resource = “http://www.w3.org/2001/XMLSchema#float” /></owl:DatatypeProperty></rdf:RDF>
Elements Jumps
Axel Lutz
Spins Layback SitSpin
Навигация и поискОсновное преимущество иерархической системы
тегирования – быстрый доступ к документам по ключевым словам
Возможности поиска в иерархической системе тегирования:
Навигация по дереву теговРасширенный поиск, включающий в себя
поиск по названию документа, по тегам, по свойствам, по параметрам документа (тип, размер, дата добавления, автор)
Навигация и поиск
РезультатыПредложено:
новый подход к систематизации документов новый формат ввода тегов модель отображения онтологии в систему
тегирования
Реализовано: хранилище документов с авторизованным доступом многопользовательская иерархическая система
тегирования модуль, извлекающий классы, экземпляры,
свойства из документа OWL