90
22/6/9 高高高高高高 高高高 1 高高高高高高 高高高高 高高高 高高高高高高高高高高高高 高高高高高 Web Intelligence

高级人工智能 第十六章

  • Upload
    randi

  • View
    89

  • Download
    8

Embed Size (px)

DESCRIPTION

高级人工智能 第十六章. 互联网智能 Web Intelligence. 史忠植 中国科学院计算技术研究所. 内容提要. 16.1 概述 16.2 语义WEB 16.3 本体知识管理 16.4 WEB挖掘 16.5 搜索引擎 16.6 WEB技术的演化 16.7 集体智能 16.8 人工生命. Web 语言层次. Attribution. Explanation. Rules & Inference. Ontologies. Metadata annotations. Standard Syntax. Identity. - PowerPoint PPT Presentation

Citation preview

Page 1: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 1

高级人工智能第十六章

史忠植 中国科学院计算技术研究所

互联网智能 Web Intelligence

Page 2: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 2

内容提要

16.1 概述

16.2 语义WEB

16.3 本体知识管理

16.4 WEB挖掘

16.5 搜索引擎

16.6 WEB技术的演化

16.7 集体智能

16.8 人工生命

Page 3: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 3

Web 语言层次

Identity

Standard Syntax

Metadata annotations

Ontologies

Rules & Inference

Explanation

Attribution

Page 4: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 4

KMSphere Layers

Email Document File Image Video Web

Ontology Acquisition

Knowledge organization

Knowledge Distribution

KnowledgeApplication

Page 5: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 5

KMSphere Architecture

Page 6: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 6

KMSphere Workflow

Agent Grid

Resource Spaces

Semantic Spaces

Knowledge Spaces

Delivery Engine Query Engine

OntoSphere

O2OMR

O2DMR

User Interface

Page 7: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 7

KMSphere Demo

Create ontology by

hand

Page 8: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 8

KMSphere Demo

Ontology acquisition

from databases

Page 9: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 9

KMSphere Demo

Ontology acquisition from text

Page 10: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 10

KMSphere DemoEdit

ontology

Page 11: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 11

KMSphere Demo

Ontology consistency

check

Page 12: 高级人工智能 第十六章

04/21/23 Zhongzhi Shi: Semantic Web Services 12

KMSphere Demo

RDQL (RDF Data

Query Languag

e)

Page 13: 高级人工智能 第十六章

Web 挖掘分类

Web挖掘

Web结构挖掘

Web使用挖掘

Web内容挖掘

文本挖掘

多媒体挖掘

内、外部结构挖掘

URL挖掘

个性化访问模式追踪

一般访问模式追踪

Page 14: 高级人工智能 第十六章

Web 挖掘类项目

Web 内容挖掘 Web 结构挖掘 Web 日志挖掘

处理数据类型

IR 方法:无结构数据、半结构数据 Web 结构数据 用户访问 Web 数据

主要数据 自由化文本、 HTML 标记的超文本 Web 文档内及文档间的超链

Serverlog,

Proxy serverlog,

Client log

表示方法 词集、段落、概念、 IR 的三种经典模型 图 关系表、图

处理方法 统计、机器学习、自然语言理解 机器学习、专有算法

统计、机器学习、关联规则

主要应用 分类、聚类、模式发现页面权重分类聚类模式发现

Web 站点重建,商业决策

Page 15: 高级人工智能 第十六章

Web 内容挖掘

基于网页内容或其描述中抽取知识的过程。

Web 内容挖掘主要包括文本挖掘和多媒体挖掘两类,其挖掘对象包括文本、图像、音频、视频和其他各种类型的数据。

Page 16: 高级人工智能 第十六章

日志的预处理

IP Address Time/Date Method/URI Referrer Agent

202.120.224.4 15:30:01/2-Jan-01 GET Index.htm http://ok.edu/link.htm Mozilla/4.0(IE5.0W98)

202.120.224.4 15:30:01/2-Jan-01 GET 1.htm http://ex.edu/index.htm Mozilla/4.0(IE5.0W98)

202.120.224.4 15:30:01/2-Jan-01 GET A.htm http://ex.edu/index.htm Mozilla/4.0(IE5.0W98)

202.120.224.4 15:37:09/2-Jan-01 GET E.htm http://ex.edu/C.htm Mozilla/4.0(IE5.0W98)

202.120.224.4 15:33:04/2-Jan-01 GET Index.htm http://ok.edu/res.php Mozilla/4.0(IE4.0NT)

202.120.224.4 15:33:04/2-Jan-01 GET 1.htm http://ex.edu/index.htm Mozilla/4.0(IE4.0NT)

202.120.224.4 15:33:04/2-Jan-01 GET A.htm http://ex.edu/index.htm Mozilla/4.0(IE4.0NT)

202.120.224.4 15:35:11/2-Jan-01 GET B.htm http://ex.edu/A.htm Mozilla/4.0(IE4.0NT)

202.120.224.4 15:35:11/2-Jan-01 GET C.htm http://ok.edu/A.htm Mozilla/4.0(IE5.0W98)

Page 17: 高级人工智能 第十六章

Web 文本挖掘

Web 文本挖掘针对包括 Web 页面内容、页面结构和用户访问信息等在内的各种 Web 数据,应用数据挖掘方法发现有用的知识帮助人们从大量 Web 文档集中发现隐藏的模式。

Web文本Internet 采集 特征库提取 结果挖掘 输出评价

Page 18: 高级人工智能 第十六章

Web 文本挖掘的方法

文本概括:从文本(集)中抽取关键信息,用简洁的形式总结文本(集)的主题内容。例如搜索引擎在向用户返回查询结果时,通常需要给出文本摘要。

文本分类 :把一些被标记的文本作为训练集,找到文本属性和文本类别之间的关系模型,然后利用这种关系模型判断新文本的类别。召回率和精度。

文本聚类:根据文本的不同特征划分为不同的类。 从大量文档中发现一对词语出现模式的关联分析以及特定数据在

未来的情况预测。

Page 19: 高级人工智能 第十六章

Web 文本挖掘的应用

搜索引擎领域:利用 Web 文本挖掘可以更合理地组织搜索结果:按照页面之间的相似程度分为若干簇。

自然语言理解领域:结合自然语言处理技术和 Web 文本挖掘技术。

Page 20: 高级人工智能 第十六章

文本挖掘在垃圾邮件过滤中的应用

训练email

邮件预处理 自动分词

分类向量库

词典

参考

待分类email

初级过滤

初级分类库

自动分词基于内容的二次过滤

用户

参考

训练模块

初级分类模块

基于内容的二次过滤模块

Page 21: 高级人工智能 第十六章

Web 结构挖掘

有用的知识不仅存在于 Web 页面间的链接结构和 Web页面内部结构,而且也存在于 URL 中的目录路径结构(页面之间的目录结构关系)。

Web 结构挖掘是指挖掘 Web 链接结构模式,即通过分析页面链接的数量和对象,从而建立 Web 的链接结构模式。

Page 22: 高级人工智能 第十六章

Web 结构挖掘主要方法 HITS 算法 PageRank 算法

Web

Log

Index

SE

Spider

Spam

Freshness

Quality results

20M queries/day

Browser

800M pages?

24x7

SE

SE

Page 23: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

23

HITS - Kleinberg’s Algorithm

HITS – Hypertext Induced Topic Selection For each vertex v in a subgraph of interest:

a(v) - the authority of v h(v) - the hubness of v

A site is very authoritative if it receives many citations. Citation from important sites weight more than citations from less-important sites

Hubness shows the importance of a site. A good hub is a site that links to many authoritative sites

Page 24: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

24

Authority and Hubness

2

3

4

1 1

5

6

7

a(1) = h(2) + h(3) + h(4) h(1) = a(5) + a(6) + a(7)

权威等级 中心等级

Page 25: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

25

Convergence of Authority and Hubness

• Recursive dependency:

a(v) Σ h(w)

h(v) Σ a(w)

• Using Linear Algebra, we can prove:

w pa[v]

w ch[v]

a(v) and h(v) converge

Page 26: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

26

HITS Example

• {1, 2, 3, 4} - nodes relevant to the topic

• Expand the root set R to include all the children and a fixed number of parents of nodes in R

A new set S (base subgraph)

• Start with a root set R {1, 2, 3, 4}

Find a base subgraph:

Page 27: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

27

HITS Example

HubsAuthorities(G)1 1 [1,…,1] R 2 a h 13 t 14 repeat5 for each v in V6 do a (v) Σ h

(w)

7 h (v) Σ a (w)

8 a a / || a ||9 h h / || h ||10 t t + 111 until || a – a || + || h – h || < ε12 return (a , h )

Hubs and authorities: two n-dimensional a and h

0 0

t

t

t

t

t

t

t

t

t

t

tt

t -1

t -1

t -1

t -1

w pa[v]

w pa[v]

|V|

Page 28: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

28

HITS Example ResultsAuthorityHubness

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Authority and hubness weights

Page 29: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

29

Matrix Denotion of HITS

It is clear that the authority and hubness values calculated by the aforementioned algorithm is the left and right singular vector of the adjacency matrix of the base sub graph.

Page 30: 高级人工智能 第十六章

PageRank

j j

ji d

k

PRdPR )1(

PRi : the PageRank value of page iPRj : the PageRank value of page jkj : number of the pages j refer tod: a parameter ranging [0,1].

•Introduced by Page et al (1998)The page rank is proportional to its parents’ rank, but inversely proportional to its parents’ outdegree

Page 31: 高级人工智能 第十六章

PageRank: Formula

Given page A, and pages T1 through T

n linking

to A, PageRank is defined as:

PR(A) = (1-d) + d (PR(T1)/C(T

1) + ... +

PR(Tn)/C(T

n))

C(P) is the cardinality (out-degree) of page Pd is the damping (“random URL”) factor

Page 32: 高级人工智能 第十六章

PageRank: Intuition

Calculation is iterative: PRi+1

is based on PRi

Each page distributes its PRi to all pages it

links to. Linkees add up their awarded rank fragments to find their PR

i+1 d is a tunable parameter (usually = 0.85)

encapsulating the “random jump factor”

PR(A) = (1-d) + d (PR(T1)/C(T

1) + ... + PR(T

n)/C(T

n))

Page 33: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

33

PageRank v.s. HITS - Algorithm

Page 34: 高级人工智能 第十六章

Web 结构挖掘的应用 信息检索 社区识别 网站优化

Page 35: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

35

Ranking for the Search Results

Today’s search engines may return millions of pages for a certain query

It is definitely not possible for the user to preview all these results

An appropriate ranking will be very helpful. Ranking on relevance Ranking on importance

Page 36: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

36

传统信息检索排序 A ranking purely on relevance

Term frequency (tf) Inverse Document Frequency (idf) Okapi … Many other aspects that Dr. Shuming Shi will

mention in the next course.

Page 37: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

37

Limitations of Traditional IR

Text-based ranking function www.harvard.edu can hardly be recognized as

one of the most authoritative pages for the query “harvard”, since many other web pages contain “harvard” more often.

The number of pages with the same relevance is still too large for the users to preview.

Pages are not sufficiently self-descriptive Usually the term “search engine” doesn't appear

on the web pages of search engines.

Page 38: 高级人工智能 第十六章

2005-11-4 "Web Search and Mining" Course @ USTC, 2005

38

What’s More for Web Search In order to solve these problems

We must leverage other information on the Web We must distinguish those pages with the same amount of

relevance Link Analysis

The web is not just a collection of pure-text documents the hyperlinks are also very important!

A link from page A to page B may indicate: A is related to B, or A is recommending, citing, voting for or endorsing B

Links effect the ranking of web pages and thus have commercial value.

Page 39: 高级人工智能 第十六章

39

搜索引擎系统结构Typical Search Engine Architecture

搜索器

用户检索

索引库检索器结果显示

Page 40: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 40

用户接口

信息定制 文本信息检索 基于内容的图像检索 数据表格检索

URL数据库

信息收集Spi der

文本数据库 图像数据库

倒排文件索引

表格数据库库

全文检索

目录检索

概念语义

检索

文本目录索引

语义索引

专题检索

专题索引

网页内容解析

切词倒排

文本聚类

文本分类

信息抽取

概念空间

共现分析

图像分类

专题索引

文本摘要数据库

文本摘要

图像标注

图像索引

目录检索

图像语义

检索

网址解析

URL管理器

表格分类

表格索引

图像语义

分析

图像语义索引

Internet

词库 语料库

用户导航

网络日志OLAP信息检索管理

检索请求

检索结果

智能搜索引擎 GHunt

智能搜索引擎 GHunt是网络信息智能获取与处理系统,支持分布式的网络信息并行搜索与内容过滤;采用文本挖掘自动建立概念语义空间和事件来龙去脉,提供高效的基于语义的文本信息检索、基于内容的图像检索,以及个性化的专题信息推送服务。

Zhongzhi Shi, Qing He, Ziyan Jia and Jiayou Li. Intelligence Chinese Document Semantic Indexing System. International Journal of Information Technology and Decision Making, Vol.2, No.3, 2003: 407-424.

Page 41: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 41

Web Spider 提出了一种基于智能主体的大规模、分布式

智能信息并行搜索的 Spider ,搜集因特网上各种文档信息,实现相关的网络信息过滤与网址解析,并将搜集的信息返回给服务器。

DONG Mingkai, SHI Zhongzhi. Distributed Web Spider Based on Intelligent Agent. World Wide Web Technologies in China: Research, Development, and Applications, 2002, pp. 148-162

史忠植 董明楷 蒋运承 张海俊 . 语义 Web 的逻辑基础 . 中国科学 E 辑 信息科学 2004, 34(10): 1123-1138

Facilitator

InternetInternet

Spider1 Spider2 Spidern

Database

Page 42: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 42

Web Spider用户可以对信息进行多方面个性化定制,

例如:1. IP 范围: 202.96.*.* ;或

202.96.100.0-202.98.255.255

2. 网站类型:例如, .com, .edu, 或要求 URL 中包含 sports ,或peopledaily 等特征字;

3. 关键词:过滤方式有“包含关键词”和“不包含关键词”两种;

4. 模式:简单模式、标准模式和网站模式;

5. 个数: Spider 并行运行的个数;6. 时间: Spider 运行的起始时间和

终止时间;7. 周期: Spider 更新运行的周期

Page 43: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 43

概念语义空间 通过建立概念语义索引,对网络文本与图像信息进行自组

织,实现了文本和图像基于概念语义的检索。检索结果不仅提供与查询概念直接相关的文档,还提供这些文档所在的类别,可进一步择类进行类内检索,提高了检索的准确率。另一方面提供与查询概念语义相关的概念,从而克服由于用户检索用词与相关内容文本中使用的概念表述不一致的问题,实现了基于概念语义的互动式检索,提高了查全率。

Zhongzhi Shi, Qing He, Ziyan Jia and Jiayou Li. Intelligence Chinese Document Semantic Indexing System. International Journal of Information Technology and Decision Making, Vol.2, No.3, 2003: 407-424.

Page 44: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 44

概念语义空间生成

Page 45: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 45

概念语义检索结果

Page 46: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 46

事件查询参数选择

Page 47: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 47

伊朗地震事件来龙去脉检索

Page 48: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 48

伊朗地震专题相关图片报道

Page 49: 高级人工智能 第十六章

23/4/21 史忠植 智能获取 49

神州五号专题相关图片报道

Page 50: 高级人工智能 第十六章

基于复杂网络的搜索

Page 51: 高级人工智能 第十六章

基于视频分析的搜索

Page 52: 高级人工智能 第十六章

23/4/21 史忠植 智能科学研究进展 52

Yebol (耶宝)搜索引擎

Page 53: 高级人工智能 第十六章

23/4/21 史忠植 智能科学研究进展 53

互联网发展路线图

Spivack 2008

Page 54: 高级人工智能 第十六章

23/4/21 史忠植 智能科学研究进展 54

Web 发展路线图

Spivack 2008

Page 55: 高级人工智能 第十六章

Web1.0

Page 56: 高级人工智能 第十六章

Web2.0

Page 57: 高级人工智能 第十六章

Tim O’Reilly - Web 2.0

Page 58: 高级人工智能 第十六章

Web3.0

Page 59: 高级人工智能 第十六章

Web1.0 – Web2.0 – Web3.0• 文件网

Web1.0: Web of documents

• 人际 / 社会网 Web2.0: Web of persons

• 数据网 Web3.0: Web of data (semantics)

Page 60: 高级人工智能 第十六章

LOD2010

Page 61: 高级人工智能 第十六章

集体智能案例 Wikipedia

Wikipedia is an encyclopedia written collaboratively by many of its readers. It uses a special type of website, called a wiki, that makes collaboration easy.

Lots of people are constantly improving Wikipedia, making thousands of changes an hour, all of which are recorded on article histories and recent changes. Inappropriate changes are usually removed quickly.

23/4/21 61史忠植 智能科学研究进展

Page 62: 高级人工智能 第十六章

“Cloud computing” Created in 4 Sept. 2007

23/4/21 62史忠植 智能科学研究进展

Page 63: 高级人工智能 第十六章

Version in 4 Sept. 2008

23/4/21 63史忠植 智能科学研究进展

Page 64: 高级人工智能 第十六章

Version in 14 Sept. 2009

23/4/21 64史忠植 智能科学研究进展

Page 65: 高级人工智能 第十六章

Wiki Project

维基百科

维基资源维基新闻

维基教科书

23/4/21 65史忠植 智能科学研究进展

Page 66: 高级人工智能 第十六章

23/4/21 史忠植 智能科学研究进展 66

全球心智模型 WWM

Page 67: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 67

人工生命

定义 1

研究具有自然生命系统行为的人造系统。

Page 68: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 68

人工生命 人工生命是指用计算机和精密机械等生成或构造表现自然生命系统行为特点的仿真系统或模型系统。自然生命系统的行为特点表现为自组织、自修复、自复制的基本性质,以及形成这些性质的混沌动力学、环境适应和进化。

在现实世界中,普遍地存在着各类复杂系统,一般认为,非线性、不稳定性、不确定性是造成复杂性的根源。复杂事物只能照它复杂的面貌来理解。

Page 69: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 69

人工生命第一次会议 “人工生命——关于生命系统合成与模拟的跨学科研讨会”。本次会议于 1987年 9月在美国新墨西哥的罗斯阿拉莫斯举行。本次会议的论文集共收录了 24篇论文,内容主要分布在:人工生命研究的理论、生命现象的仿真、细胞自动机(简称 CA )、遗传算法、进化仿真等 5 个方面,兰顿发表了题为“人工生命”的开拓性论文,他在文中提出了人工生命的概念,并讨论了它作为一门新兴的研究领域或学科存在的意义。兰顿被公认为人工生命研究的创立者。这次会议标志着人工生命研究领域的诞生。

Page 70: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 70

AI vs. AL

1. Complex human functions

2. Top-down3. Global Control4. Complex Rules5. Preprogrammed

behavior6. Knowledge-

Representation

1. Basic natural behavior2. Bottom-up3. Local Control4. Simple Rules5. Emergent behavior6. Avoid Knowledge-

Representation & Planning

Page 71: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 71

研究人工生命的原因 人工生命的研究可使我们更好地理解突发

特征,个体在低级组织中的集合,通过我们的相互作用,常可产生特征。

人工生命将会成为研究生物的一个特别有用的工具。

对于发展新技术及增强我们控制自然的能力,人工生命系统是很有潜力的。

人工生命的另一显著应用是遗传工程。

Page 72: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 72

人工生命的探索 20世纪初,逻辑在算术机械运算中的运用,导致过程

的抽象形式化。 40年代末, 50年代初,冯 .诺伊曼提出了机器自增长

的可能性理论。以计算机为工具,迎来了信息科学的发展。

70年代以来,科拉德 (Conrad) 和他的同事研究人工仿生系统中的自适应、进化和群体动力学,提出了不断完善的“人工世界”模型。

80年代,人工神经网络又兴起,出现了许多神经网络模型和学习算法。与此同时,人工生命的研究也逐渐兴起。 1987年召开了第一届国际人工生命会议。

Page 73: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 73

人工生命的模型

1. 计算机病毒2. 计算机的进程3. 生物统计学和个体胎生学4. 机器人5. 自催化 (autocatalytic) 网络6. 细胞自动机7. 人工核苷酸

Page 74: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 74

人工生命的研究方法和战略

按照人工生命的组织机构,人工生命的内容大致可以分成两类:

1) 构成生物体的内部系统,包括脑、神经系统、内分泌系统、免疫系统、遗传系统、酶系统、代谢系统等。

2) 在生物体及其群体中表现的外部系统。生物群体中环境适应系统和遗传进化系统等。

Page 75: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 75

1) 模型法。• 根据内部和外部系统所表现的生命行为,

建造信息模型。2) 工作原理法。

• 生命行为所显示的自律分散和非线性的行为,它的工作原理是混沌和分形,据此研究它的机理。

人工生命研究的方法

Page 76: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 76

1) 采用以计算机等信息处理机器为中心的硬件生成生命行为。 • 一种是采用已有的信息处理机器和执行装置,实现具有人工生命

行为的系统。• 另一种是用生物器件构造生命系统。这些都通称为生物计算机,

是一种向人工生命接近的方法。2) 用计算机仿真,研究开发显示生命体特征行为的模型软件。简单地说,神经网络系统和遗传算法等,都是采用信息数学模型,模拟人工生命的生成。

3) 基于工作原理,利用计算机仿真生成生命体。生命现象的基础是随物理熵的增大而杂乱无章。生成这种现象的原理是混沌的分形、耗散结构、协同反应等,采用这些产生生命现象。

4) 通过计算机仿真,分析生命特有的行为生成,建立新的理论。利用上面 3个策略,得到生命行为共同的一般性质,通过概括,建立生命的基本理论。这种策略形成自组织、超并行处理等理论。

人工生命研究的策略

Page 77: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 77

细胞自动机 (CA) 是另一种对结构递归应用简单规则组的例子。在细胞自动机中,被改变的结构是整个有限自动机格阵。在这种情况下,局部规则组是传递函数,在格阵中的每个自动机是同构的。所考虑修改的局部上下文是当时邻近的自动机的状态。

自动机的传递函数构造一种简单的、离散的空间 /时间范围的局部物理成分。要修改的范围里采用局部物理成分对其结构的“细胞”重复修改。这样,尽管物理结构本身每次并不发展,但是状态在变化。

细胞自动机

Page 78: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 78

细胞自动机

元胞自动机—产生和发展 . 四个阶段 : 1940s 诞生: Von Neumann 自我复制机 . 1960-70s 起步: JH.Conway 生命游戏 . 1980s 理论研究: S.Wolfram CA 分类 . 1980-90s 应用: HPP-FHP格子气自动机 . C.Langton N.Packard 人工生命

Page 79: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 79

记 V 为细胞状态集, V 中有一元素 v0 为静止状态,定义 f 是

V*V*…*V→V 的函数 , 且满足 f(v0,v0,…,v0)=v0,

则 (V,v0,f)称为是 m个邻居的细胞自动机, f 称为该细胞自动机的变换函数。

二维空间中的细胞自动机

Page 80: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 80

信号传播的过程

2 2 2 2 2 2

1 1 0 s 1 1

2 2 2 2 2 2

2 2 2 2 2 2

1 1 1 0 s 1

2 2 2 2 2 2

Page 81: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 81

信号复制

2 2 2 2 2 2

1 0 s 1 1 1

2 2 1 2 2 2

* 2 1 2 * *

* 2 1 2 * *

2 2 2 2 2 2

1 1 0 s 1 1

2 2 s 2 2 2

* 2 1 2 * *

* 2 1 2 * *

2 2 2 2 2 2

1 1 1 0 s 1

2 2 0 2 2 2

* 2 s 2 * *

* 2 1 2 * *

时刻 T 时刻 T+1 时刻 T+2

Page 82: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 82

数据路径扩张

2 2 2 2 2 2 2 2

1 1 0 6 1 1 1 1

2 2 2 2 6 2 2 2

* * * 2 0 2 * *

* * * 2 1 2 * *

* * * 2 1 2 * *

2 2 2 2 2 2 2 2

1 1 1 0 7 1 1 1

2 2 2 2 0 2 2 2

* * * 2 1 2 * *

* * * 2 1 2 * *

* * * 2 1 2 * *

Page 83: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 83

f(0,1,2,7,6)=1 f(7,0,0,0,2)=3 f(2,0,0,2,3)=7 f(1,0,2,3,2)=6

f(0,1,2,3,2)=1 f(3,0,2,2,1)=0 f(7,0,2,1,2)=0 f(1,0,7,2,2)=3

f(4,0,2,0,2)=2 f(2,0,0,2,4)=0 f(2,0,2,6,2)=4 f(2,0,0,1,4)=2

f(4,0,2,6,2)=2 f(2,0,4,6,2)=4 f(1,2,4,2,6)=4 f(4,1,2,2,2)=0

f(2,0,0,4,2)=0 f(2,0,2,4,2)=0 f(2,0,1,2,4)=2 f(6,0,2,4,2)=4

f(7,0,0,2,1)=0 f(0,1,2,7,2)=4

变换规则表

Page 84: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 84

首先我们有一细胞空间,它组成了 N维欧几里德空间,以及定义于该细胞空间的邻居关系。对于每个细胞空间,由于邻居关系,必有有限个细胞作为它的邻居。一个细胞自动机系统 ( 简称“细胞系统” ) 是这样定义的:该系统对每个细胞给定有限个状态和一个区分状态 (叫“空状态” ) ,及一条规则。该规则给出每个细胞在时刻 T+1 时的状态,且该规则是在时间 t 时该细胞自身的状态及它的邻居的状态的函数。我们把一个细胞的所有可能状态连同管理该细胞的状态变换的规则一起称为一个变换函数。所以一个细胞自动机系统是由一个细胞空间和定义于该空间上的变换函数所组成。细胞自动机状态由有限个细胞连同赋于每个细胞的状态所指定,可理解为其它的细胞都处于空的状态。

细胞自动机的概念可由以下方式建立

Page 85: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 85

典型的形态形成理论是 1968年 Lindenmayer提出的 L- 系统。 L- 系统由一组符号串的重写规则组成,它与乔姆斯基 (Chomsky) 形式语法有密切关系。在下面“ X→Y”表示结构中当出现 X 时用字符串 Y代替。因为字符 X 可以出现在规则的右边和左边,这组规则可以被递归地应用来重写新的结构。

形态形成理论

Page 86: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 86

形态形成理论

规则采用上下文无关,即在特定部分改变时不考虑上下文中的关系。例如一组规则:

(1) A CB (2) B A (3) C DA (4) D C

Page 87: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 87

当把这组规则用于初始种子结构“ A” ,就可以得到下面的序列:

次数 结构 应用规则

0 A 初始种子 1 C B 规则 1, CB 代替 A 2 D A A 规则 3, DA代替 C; 规则 2, A代替 B

3 C C B C B 规则 4,C代替 D; 规则 1 用两次 ,CB代替 A

4 … 继续进行

例子 1

Page 88: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 88

规则: (1) A →C[B]D

(2) B →A

(3) C → C

(4) D → C(E)A

(5) E → D当把这组规则用于初始种子结构“ A” ,就可以得到下面的序列:

次数 结构 应用规则

0 A 开始种子 1 C[B]D 规则 1. 2 C[A]C(E)A 规则 3, 2, 4. 3 C[C[B]D]C(D)C[B]D 规则 3, 1, 3, 5, 1. 4 C[C[A]C(E)A]C(C(E)A)C(E)A 规则 3, 3, 2, 4, 3, 4, 3, 2,3.

例子 2

Page 89: 高级人工智能 第十六章

23/4/21 高级人工智能 史忠植 89

规则: (1) [{C} → C 在字符串左端的“ C”保持“ C” (2) C{C} → C “C” 和它左端的“ C”保持“ C” (3) *{C} → * “C” 和它左端的“ *”变成“ *” (4) {*}C → C “*” 和右端的“ C”变成“ C” (5) {*}] → * 在字符串右端的“ *”保持“ *”在这些规则下,初始结构“ *CCCCCCC” 将产生向右传播:次数 结构

0 *CCCCCCC 1 C*CCCCCC 2 CC*CCCCC 3 CCC*CCCC 4 CCCC*CCC 5 CCCCC*CC 6 CCCCCC*C 7 CCCCCCC*

例子 3

Page 90: 高级人工智能 第十六章

23/4/21 史忠植 高级人工智能 90

www.intsci.ac.cn/shizz/

Questions?Questions?!!

Thank You!