78
RDF:为什么被认为是 一种可以表示知识的关键技术方法 张智雄 中国科学院文献情报中心

RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

  • Upload
    others

  • View
    19

  • Download
    0

Embed Size (px)

Citation preview

Page 1: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

RDF:为什么被认为是一种可以表示知识的关键技术方法

张智雄

中国科学院文献情报中心

Page 2: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

提纲

什么是知识

知识的表示

基于RDF的知识表示

RDF表示知识的优势和不足

Page 3: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

提纲

什么是知识

知识的表示

基于RDF的知识表示

RDF表示知识的优势和不足

Page 4: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1.什么是知识

史忠植

知识是人通过实践认识到的客观世界的规律性的东西,知识是经过加工的信息,它包括事实、信念和启发式规则

知识工程和知识管理

知识是“一种特殊类型的信息,叫做‘关于信息的信息’,知识告诉我们关于特定信息的事情”

数据(data)、信息(information)、知识(knowledge)关系?

Page 5: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1、什么是知识

知识与数据、信息的区别

术语 特征 例子

数据 数据是信息的载体,是未被加工解释过的、不能回答特定问题的最原始的记录

…---…

信息 信息是数据的关联,赋予数据特定的含义,回答了某个特定问题

SOS

知识 知识是信息的关联,是具有一定目的性的信息,能够产生一定的行动,包括事实、信念和启发式规则

紧急警报

开始营救行动

Page 6: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1、什么是知识

DIKW体系

Page 7: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1.什么是知识

知识紧密依赖于语境(Context)

一个人的知识可能是另一个人的数据

桥牌

月球传回数据——照片

……

Page 8: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1、什么是知识

欧洲数字图书馆 Europeana

Knowledge = Information in Context 知识=语境关联(上下文相关) 的信息

Semantic Contextualisation 语义环境关联化

从信息到知识的转换过程 将隐性的语义内容(知识对象)揭示出来,

组织到一个上下文相关的语义环境之中。

Page 9: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1、什么是知识

Knowledge = Information in Context

Page 10: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1、什么是知识

知识分类

知识类别 具体含义

陈述性知识

(领域知识)

一个领域中有关其中的概念、类型、事实以及它们之间相关关系、约束规则的描述

过程性知识

(推理知识)

推理知识是描述使用领域知识进行推理和问题求解

的步骤、规则和过程。控制性知识

(任务知识)

任务知识描述一个应用所要达到的目标是什么以及如何通过将任务分解成子任务和推理来实现这些目标。

任务知识包含有任务目标、任务结构、控制策略。

Page 11: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

1、什么是知识

任务知识

任务目标,任务结构 医疗诊断

控制策略 (任务)

推理知识

推理步骤,推理规则 假设 检验

推理过程 (推理) (推理)

领域知识

概念、类型、事实 症状 疾病 检验结果

相关关系、 约束规则 (事实) (类型)(事实)

Page 12: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

提纲

什么是知识

知识的表示

基于RDF的知识表示

RDF表示知识的优势和不足

Page 13: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示

人类语言是最好的知识载体

读书长知识

但是人类语言

太灵活

二意性,没有明确的语境定义

不容易被计算处理

因此需要形式化的表示方法

Page 14: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示

知识表示的定义知识表示,把人类知识形式化成为机器能够处理的数据结构,是一组对知识的描述和约定

知识表示实际上是对知识的一种描述,或者说一种约定,一种计算机可以接受的用于描述知识的数据结构。

知识表示的过程就是把知识编码成某种数据结构的过程。

Page 15: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示

知识表示的要求 表示能力:能否正确、有效地表示问题。包括:

表示范围的广泛性

领域知识表示的高效性

对非确定性知识表示的支持程度

可利用性:可利用这些知识进行有效推理。包括:

对推理的适应性:推理是根据已知事实利用知识导出结果的过程

对高效算法的支持程度:知识表示要有较高的处理效率

Page 16: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示

知识表示的要求 便于知识的组织、维护和管理:包括:

要便于计算机直接对其进行处理

可以按某种方式把知识组织成某种知识结构

便于对知识的增、删、改等操作

便于理解和实现:包括:

符合人们的日常习惯

知识应易读、易懂、易获取等

Page 17: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示

知识表示的方法

谓词逻辑表示法

产生式表示法

框架表示法

语义网络表示法

......

Page 18: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——谓词逻辑

一阶谓词逻辑根据对象和对象上的谓词(即对象的属性和对象之间的关系),使用连接词和量词来表示世界。

谓词逻辑中,有句子,但也有项,以表示对象

项:利用常量符号,变量和函数符号表示

句子:利用量词和谓词进行构造

Page 19: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——谓词逻辑

例:

一元谓词father (Wang) 可以表示:Wang的父亲

二元谓词less (x, y)可以表示:x比y小

Page 20: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——谓词逻辑

逻辑连接词 否定┑

合取∧

析取∨

蕴涵→

等价↔

量词 (∀x):对每一个x

(∃x):存在着一个x

通过逻辑连接词和量词可以构造复杂的符号表达式(谓词逻辑公式)。

Page 21: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——谓词逻辑

利用谓词逻辑表示的例子:

张三是一名计算机系的学生,他喜欢编程序。

利用谓词公式表示如下: Computer(张三)∧Like(张三, Programming)

其中 谓词Computer(x)表示x是计算机系的学生

谓词Like(x,y)表示x喜欢y

Page 22: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——谓词逻辑

谓词逻辑适合表示 事物的状态、属性、概念等事实性知识,

事物间因果关系的规则知识

事实性知识 可以由合取或析取符号连接起来的谓词公式表示

规则性知识 用蕴涵符号连接起来的谓词公式表示

例如:如果x,则y 可表示为 x →y

Page 23: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——谓词逻辑

谓词逻辑表示的几个步骤:

定义谓词及个体,确定每一个谓词及个体的确切含义;

根据所要表达的事物或概念,为每一个谓词中的变元赋予特定的值;

根据所要表达的知识的语义,用户适当的连接符号将各个谓词连接起来,形成谓词公式

Page 24: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示

目前已经建成的专家系统中知识表示的主要手段

在产生式系统中,推理和行为的过程用产生式规则表示,又称为基于规则的系统

Page 25: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示

事实的表示

单个事实表示方式

<特征—对象—取值>

<attribute-object-value>

<Age ZhaoLin 43>

加可信度

<Age ZhaoLin 43 0.8>

Page 26: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示

规则的表示

一个规则由前项和后项两部分组成,前项表示前提条件,后项表示当前提条件为真时,应当采取的行为或所得的结论。

产生式系统中每一条规则是由一个“条件->动作”或“条件->结论”的产生式。其简单形式为: IF <前提> THEN <结论>

<rule> =(If <> Then <action>(ELSE <action>))

Page 27: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示 例子:动物识别系统的规则库

Page 28: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示 例子:动物识别系统的规则库

Page 29: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示

虎及长颈鹿的推理过程

Page 30: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——产生式表示

比较适合表示非结构化的知识

在专家系统中得到了大量的应用

但以生产式系统表示复杂的知识结构比较困难

发展了结构化的表示方法

框架

语义网络

Page 31: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——语义网络

语义网络由节点和连接节点的弧组成,其中节点表示领域中的物体、概念或势态,弧表示它们之间的关系。

节点和弧都可以拥有标号

A BRAB

Page 32: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——语义网络

表示事物特性的语义网络

Personel Faculty

ISA

Teacher

ISA

Teacher-1

ISA

HIGH 30M zhanglinN

AGEEDU SEX Name

Page 33: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——语义网络

常用的语义联系 类属关系:分类关系\成员关系\实例关系

ISA:IS A(表示一个事物是另一个事物的一个实例),有时也用AKO(A Kind of), AIO(A Instance OF)

包含关系:指“部分与整体”之间的关系 Part-Of, Member-Of

相似关系 Similar-To

Page 34: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——语义网络

常用的语义联系 推论关系。从一个概念推出另一个概念的语义关系。 Reasoning-To:推出

因果关系:由于某一事件的发生而导致另一事件的发生 Causality:

占有关系:事件或属性之间的“具有”关系 Have

Page 35: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——语义网络

常用的语义联系

组成关系:表示某一事物由其它事物组成。

Composed-Of

时空关系:Where, When

Page 36: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——语义网络

语义网络表示的优点:

结构性好、具有联想性和自然性

缺点

过于简单

节点的真正含义是什么没有表示

逻辑上的充分表示还有缺陷

Page 37: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

框架(Frame):显式组织的数据结构,它的顶层是固定的,表示某个固定的概念、对象或事件,其下层由一些称为槽(Slot)的结构组成。

每一个槽可以按实际的情况被一类型的实例或数据所填充(赋值),所填写的内容被称为槽值。

每个槽值一般都预先规定赋值的条件,如规定其值是人物、符合一定条件的事物、指向某类子框架的指针等

框架下层的槽可以看成是一种子框架,槽下还可设几个侧面

Page 38: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

FRAME<框架名>

槽名1:侧面11 值11

侧面12 值12

……

侧面1m 值1m

槽名2:侧面21 值21

……

侧面2m 值2m

……

槽名n:侧面n1 值n1

……

侧面nm 值nm

约束:约束条件1

约束条件2

……

约束条件1

Page 39: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

槽和侧面的取值可以是 逻辑值(真或假)

实数值

文字

定义域

子程序

IF-ADDED程序附件:在填槽过程中需做什么?

IF-NEEDED程序附件:填槽时应如何计算

Page 40: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

教职工的框架

FRAME FACULTY

AGE: INTEGER[18 60]

HEALTH: ONE OF (E G N P) (DEFAULT=N)

RETIRE: IF-NEEDED

(COND((OR(AND(EQ(SLOT-VAL x’ SEX)MALE)

(GREATERP(SLOT-VAL x’AGE)60))

(AND(EQ(SLOT-VAL x’ SEX)FEMALE)

(GREATERP(SLOT-VAL x’AGE)55)))

(REMOVE x))

Page 41: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

教师的框架FRAME FACULTY-TEACHER

ISA: FACULTY

AGE: IF-NEEDED

(COND ((SLOT-VAL x’YEAR)(PLUS (SLOT-VAL x’YEAR) 23))(T23))

EDU:H

LAN: RANGE A SUBSET OF(E J F G R)

DEFAULT E

LEVEL ONE OF(E G F P)

ADDRESS: AN ADDRESS (DEFAULT=BUILDING-3)

Page 42: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

具体教师的框架FRAME TEACHER-1

ISA: FACULTY-TEACHER

NAME: ZHAO-LING

SEX: MALE

AGE: NIL

YEAR:20

EDU:NIL

LAN: RANGE E

LEVEL G

WORK:TEACHING

ADDRESS:BUILDING-4

RELATION:FACULTY-CADRE

Page 43: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示——框架表示

框架是一种经组织起来的一种结构化的知识表示形式,适于表示固定的、典型的概念、事件和行为

框架之间可以形成层次的、以及复杂的相互关系,组成框架网,代表整块的知识结构,可以表示更为复杂的知识内容

根据已知的信息寻找部分匹配的框架,如同从观察的事实中形成合理的假设。有了预选的框架,又可根据其中各槽所规定的取值要求,对未知的事件进行预测和联想

Page 44: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

2、知识的表示

知识表示的重点在于事实的表示和规则的表示

有那么多知识的表示方法,

为什么RDF被认为是知识表示的关键技术?

Page 45: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

提纲

什么是知识

知识的表示

基于RDF的知识表示

RDF表示知识的优势和不足

Page 46: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

什么是RDF Resource Description Framework(RDF)是W3C推荐的资源描述框架

它的功能是利用当前存在着的多种元数据标准来描述各种网络资源,形成人机可读的、可以由计算机自动处理的文件。

RDF是采用XML语法格式处理元数据的应用,为描述图像、文档和它们之间的相互关系定义了一个简单数据模型。

简而言之,RDF用于进行资源描述,但它并不直接用来描述资源,而是定义了描述资源的规则。

Page 47: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

RDF 针对Syntactic Web而出现

[Hendler & Miller 02]

Page 48: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

HTML标记:

呈现

链接

语义的内容可以被人看到,但不能被计算机看到

Page 49: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

人们看到的信息…WWW2002

The eleventh international world wide web conference

Sheraton waikiki hotel

Honolulu, hawaii, USA

7-11 may 2002

1 location 5 days learn interact

Registered participants coming from

australia, canada, chile denmark, france, germany, ghana, hong kong, india, ireland, italy, japan, malta, new zealand, the netherlands, norway, singapore, switzerland, the united kingdom, the united states, vietnam, zaire

Register now

On the 7th May Honolulu will provide the backdrop of the eleventh international world wide web conference. This prestigious event …

Speakers confirmed

Tim berners-lee

Tim is the well known inventor of the Web, …

Ian Foster

Ian is the pioneer of the Grid, the next generation internet …

Page 50: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

计算机看到的信息WWW2002

The eleveth iteratioal world wide web

coferece

Sherato waikiki hotel

Hoolulu, hawaii, USA

7-11 may 2002

1 locatio 5 days lear iteract

Registered participats comig from

australia, caada, chile demark,

frace, germay, ghaa, hog kog,

idia, irelad, italy, japa, malta,

ew zealad, the etherlads, orway,

sigapore, switzerlad, the uited

kigdom, the uited states, vietam,

zaire

Register ow

O the 7th

May Hoolulu will provide the

backdrop of the eleveth iteratioal

world wide web coferece. This

prestigious evet …

Speakers cofirmed

Tim berers-lee

Tim is the well kow ivetor of the

Web, …

Ia Foster

Ia is the pioeer of the Grid, the ext

geeratio iteret …

Page 51: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

XML标记为提供有语义的标记?

<name>WWW2002

The eleveth iteratioal world wide

webco</name>

<location>Sherato waikiki hotel

Hoolulu, hawaii, USA</location>

<date>7-11 may 2002</date>

<slogan>1 locatio 5 days lear iteract</slogan>

<participants>Registered participats comig from

australia, caada, chile demark,

frace, germay, ghaa, hog kog,

idia, irelad, italy, japa, malta,

ew zealad, the etherlads, orway,

sigapore, switzerlad, the uited

kigdom, the uited states, vietam,

zaire</participants>

<introduction>Register ow

O the 7th

May Hoolulu will provide the

backdrop of the eleveth iteratioal

world wide web coferece. This

prestigious evet …

Speakers cofirmed</introduction>

<speaker>Tim berers-lee</speaker>

<bio>Tim is the well kow ivetor of the

Page 52: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

但如果标记的名称换了...

<conf>WWW2002

The eleveth iteratioal world wide

webco</conf>

<place>Sherato waikiki hotel

Hoolulu, hawaii, USA</place>

<date>7-11 may 2002</date>

<slogan>1 locatio 5 days lear iteract</slogan>

<participants>Registered participats comig from

australia, caada, chile demark,

frace, germay, ghaa, hog kog,

idia, irelad, italy, japa, malta,

ew zealad, the etherlads, orway,

sigapore, switzerlad, the uited

kigdom, the uited states, vietam,

zaire</participants>

<introduction>Register ow

O the 7th

May Hoolulu will provide the

backdrop of the eleveth iteratioal

world wide web coferece. This

prestigious evet …

Speakers cofirmed</introduction>

<speaker>Tim berers-lee</speaker>

Page 53: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

计算机可能什么都看不到…

<ame>WWW2002

The eleveth iteratioal world wide webc</ame>

<locatio>Sherato waikiki hotel

Hoolulu, hawaii, USA</locatio>

<date>7-11 may 2002</date>

<sloga>1 locatio 5 days lear iteract</sloga>

<participats>Registered participats comig fromaustralia, caada, chile demark, frace,

germay, ghaa, hog kog, idia, irelad,

italy, japa, malta, ew zealad, the

etherlads, orway, sigapore, switzerlad,

the uited kigdom, the uited states,

vietam, zaire</participats>

<itroductio>Register owO the 7

thMay Hoolulu will provide the

backdrop of the eleveth iteratioal world

wide web coferece. This prestigious evet …

Speakers cofirmed</itroductio>

<speaker>Tim berers-lee</speaker>

<bio>Tim is the well kow ivetor of the W</bio>

<speaker>Ia Foster</speaker>

<bio>Ia is the pioeer of the Grid, the e</bio>

Page 54: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

缺少的是什么?

缺少标签的义上下文环境(Context)

对标签的明确语义定义

标签的唯一性表示(能够产生二意性)

规范单一的编码格式

Page 55: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

如何增加语义

有两种明确不同的方法:

形成一个共同认可的语义标签集 如 Dublin core

问题 不灵活 只能表示有限范围的事件知识

利用一种联机的本体来指定标签的语义 通过一个本体定义一个术语体系 通过现有的术语来形成新的术语 这些术语的含义(语义)是正式指定的 可以在多个术语体系中指定术语之间的关系

RDF走的是第二条路线

Page 56: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

RDF 数据模型 Statements are <subject, predicate, object> triples:

<Ian,hasColleague,Uli>

Can be represented as a graph:

Ia

nUl

i

hasColleague

Statements describe properties of resources

A resource is any object that can be pointed to by a URI:

a document, a picture, a paragraph on the Web;

http://www.cs.man.ac.uk/index.html

a book in the library, a real person (?)

isbn://5031-4444-3333

Properties themselves are also resources (URIs)

Page 57: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

通过三元组,表示事实知识

通过URI,链接到背景知识(Context)

URI是被唯一定义的,可以被共用,最重要的,可以被关联。

将新的数据(或信息)关联在已有的知识体系之上。

Page 58: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

不妨再回头看一看,什么是知识?

欧洲数字图书馆 Europeana

Knowledge = Information in Context 知识=语境关联(上下文相关) 的信息

Semantic Contextualisation 语义环境关联化

从信息到知识的转换过程 将隐性的语义内容(知识对象)揭示出来,

组织到一个上下文相关的语义环境之中。

Page 59: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 假设有一个人,由"http://www.w3.org/People/EM/contact#me"标识,他的名

字是"Eric Miller",他的电子邮件是"[email protected]",他的头衔是"Dr".

可以看出:个体、事物的种类、事物的属性、属性的值都是用URIs来标识

Page 60: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

RDF的知识表示 :

假设有一关于书籍的信息集合Book_A:

ID Author Title Publisher YearISBN 0-00-6511409-X id_xyz The Glass Palace id_qpr 2000

ID Name Homepageid_xyz Ghosh, Amitav http://www.amitavghosh.com

ID Publisher’s name Cityid_qpr Harper Collins London

Page 61: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 RDF的知识表示 -Book_A:

Page 62: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

A B C D1 ID Titre Traducteur Original2 ISBN 2020286682 Le Palais des Miroirs $A12$ ISBN 0-00-6511409-X

4

5 ID Auteur6 ISBN 0-00-6511409-X $A11$

7

8 Nom9 Ghosh, Amitav10 Besse, Christianne

3、基于RDF的知识表示 RDF的知识表示 :假设有一关于书籍的信息集合Book_F

Page 63: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 RDF的知识表示 -Book_F:

Page 64: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 RDF的知识表示 :语境关联。通过相同的URI,能够将新的知识加入到我的背

景知识(context)中去

Page 65: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 RDF的知识表示 :语境关联

Page 66: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

假设对Book_F进行查询操作:

“give me the title of the original”

well, … 《The Glass Palace 》

这个信息不在Book_F…

…但是这个信息在Book_A!

3、基于RDF的知识表示

Page 67: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

我们可能意识到“a:author and f:auteur”是相同的..

但是这个自动语境关联过程我们自己都不知道!

假设有一些语境关联信息:

a:author same as f:auteur

both identify a “Person”

a term that a community may have already defined:

a “Person” is uniquely identified by his/her name and, say, homepage

it can be used as a “category” for certain type of resources

3、基于RDF的知识表示

Page 68: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 RDF的知识表示 :语境关联

Page 69: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

现在,集合Book_F能够查询:

give me the home page of the original’s ‘auteur’

这个信息不在Book_F or Book_A中…

…但是,信息可被获得:

Book_F和Book_A融合后

增加第三方的描述后...

Page 70: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

RDF表示的信息同其他数据源Wikipedia融合:

Page 71: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

RDF表示的信息同其他数据源Wikipedia融合:

Page 72: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示

RDF表示的信息同其他数据源Wikipedia语境关联:

Page 73: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

3、基于RDF的知识表示 RDF进行知识表示和语境关联似乎很复杂,但事实并非如此:

用户在进行查询时,这些信息会自动语境关联!

对于一些复杂的工作,用户可以借助一些成熟的工具

例如:Jena、Sesame ...

Page 74: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

提纲

什么是知识

知识的表示

基于RDF的知识表示

RDF表示知识的优势和不足

Page 75: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

4、RDF表示知识的优势和不足

RDF表示知识的优势: 能够融合不同的数据源,包括:

不同位置上的网络资源 不同格式的资源(数据库、Excel...) 不同名称的资源

能够融合URIs相同的数据,例如:ISBN、Doi...

Page 76: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

4、RDF表示知识的优势和不足

RDF表示知识的优势: 能够增加一些被广泛认可的术语信息,结果:

新的关系可能被发现

新的检索可能被实现

能够增加一些额外的知识到融合后的数据源,包括:

增加新的本体信息

增加一些额外的规则

总之,RDF易控制、易扩展、包容性、可交换性、易综合...、

Page 77: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

4、RDF表示知识的优势和不足 RDF表示知识的不足:

属性间关系的描述能力有限,包括: 不能表达属性间的传递性

例如:Person_a比Person_b高,Person_b比Person_c高。显然,Person_a比Person_b高,但RDF中无法表达这种传递性。

只能以层次关系来组织概念,仅包括: subPropertyOf、subClassOf

不能完全表达概念间错综复杂的关系

另外,RDF没有定义推理机制、没有版本控制......、

Page 78: RDF:为什么被认为是 一种可以表示知识的关键技术 …spec.nstl.gov.cn/specification/images/meeting_1/20150714/...提纲 什么是知识 知识的表示 基于RDF的知识表示

谢谢!

欢迎批评指正!

张智雄

[email protected]