20
© Frontier Technologies in Computer Science 计计计计计计计计计 Frontier Technologies in Computer Science 计计计计http://en.tjcities.com/ index.php/works 计计计计[email protected] 计计http://weibo.com/willtongji 计计计计计计 http://en.tjcities.com/ index.php/works

计算机科学前沿技术 Frontier Technologies in Computer Science

Embed Size (px)

DESCRIPTION

通识卓越课程 http://en.tjcities.com/index.php/works. 计算机科学前沿技术 Frontier Technologies in Computer Science. 课程网站: http://en.tjcities.com/index.php/works 联系方式: [email protected] 微博: http://weibo.com/willtongji. 课程内容. 第 9 章 人工智能前沿 第 10 章 机器学习的研究 第 11 章 搜索引擎技术 第 12 章 集体智慧与 Web 2.0 第 13 章 云计算 - PowerPoint PPT Presentation

Citation preview

Page 1: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

计算机科学前沿技术Frontier Technologies in Computer Science

课程网站: http://en.tjcities.com/index.php/works

联系方式: [email protected]

微博: http://weibo.com/willtongji

通识卓越课程http://en.tjcities.com/index.php/works

Page 2: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

课程内容• 第 1 章 概述• 第 2 章 计算机硬件的发展

• 第 3 章 高性能计算• 第 4 章 现代操作系统• 第 5 章 计算机网络新技术• 第 6 章 可信系统和可信软件• 第 7 章 数据库技术的发展• 第 8 章 数据挖掘及其应用

• 第 9 章 人工智能前沿• 第 10 章 机器学习的研究• 第 11 章 搜索引擎技术• 第 12 章 集体智慧与 Web 2.0

• 第 13 章 云计算• 第 14 章 物联网技术• 第 15 章 服务科学与服务计算• 第 16 章 智慧地球

Page 3: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

第 10 章 机器学习的研究

Page 4: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

We believe machine learning will lead to appropriate, partial automation of every element of scientific method, from hypothesis generation to model construction to decisive experimentation. Thus, machine learning has the potential to amplify every aspect of a working scientist’s progress to understanding. It will also, for better or worse, endow intelligent computer systems with some of the general analytic power of scientific thinking.

——Science, 14 September, 2001

Page 5: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

5

本章内容

• 机器学习的发展

• 机器学习的主要范式– 监督学习与非监督学习– 半监督学习– 主动学习– 统计机器学习

• 机器学习的应用和未来发展

Page 6: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

6

什么是机器学习?

• 学习是人类具有的一种重要智能行为,但究竟什么是学习,长期以来却众说纷纭。社会学家、逻辑学家和心理学家都各有其不同的看法。至今,还没有统一的“机器学习”定义,而且也很难给出一个公认的和准确的定义。

• 可以认为, 机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。

Page 7: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

7

机器学习与数据挖掘的关系

数据挖掘和机器学习

机器学习 数据库

数据挖掘

数据分析技术 数据管理技术

传统的机器学习研究并不把海量数据作为处理对象,很多技术是为处理中小规模数据设计的,如果直接把这些技术用于海量数据,效果可能很差,甚至可能用不起来。因此,数据挖掘界必须对这些技术进行专门的、非简单的改造。

Page 8: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

8

机器学习的发展史

连接主义学习模型 感知机 线性适应元

统计学习模型 “ 核方法”机器学习

Page 9: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

9

典型的机器学习范式( Paradigm ):

监督、非监督、半监督是三个对等的机器学习的算法类别;

分类、回归、排序学习是三个对等的机器学习问题;

统计学习则归为机器学习的理论范畴。

Page 10: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

10

集成学习

• 集成学习的主要思想是利用多个分类器来解决同一个问题,目的是更有效地提高学习系统的泛化能力。

• 集成学习通常分为两个步骤:首先,采用单个学习算法对样本分别进行训练;然后,对单个网络的输出按某种方法进行集成,得到最后的结果。集成网络常用的方法包括 Bagging 和 Boosting 等。

集成学习

Page 11: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

11

流行学习

• 流形学习旨在发现高维数据集分布的内在规律性,其基本思想是:高维观测空间中的点由少数独立变量的共同作用在观测空间张成一个流形,如果能有效地展开观测空间卷曲的流形或发现内在的主要变量,就可以对该数据集进行降维。

Page 12: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

12

机器学习的广泛应用

• 1 .日常生活中的机器学习• 2 .网络安全中的机器学习• 3 .生物信息学中的机器学习• 4 .航空航天中的机器学习• 5 .智能交通中的机器学习• 6 .搜索引擎中的机器学习

Page 13: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

13

日常生活中的机器学习

Kinnect 感应系统 Goggles 图片搜索 IBM 的 Watson

在我们的工作与生活中,这种例子曾出不穷。互联网搜索、在线广告、机器翻译、手写识别、垃圾邮件过滤等等都是以机器学习为核心技术的。

Page 14: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

14

网络安全中的机器学习

• 网络安全是计算机的一个热门研究领域,特别是入侵检测方向,不仅有很多理论成果,还出现了不少实用系统。

Page 15: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

15

生物信息学中的机器学习

在生物信息学这个新兴的交叉学科中,试图利用信息科学技术来研究从DNA到基因、基因表达、蛋白质、基因电路、细胞、生理表现等一系列环节上的现象和规律。

Page 16: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

16

航空航天中的机器学习

“勇气”号火星机器人

Page 17: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

17

智能交通中的机器学习

Stanford 大学研发的自动驾驶赛车

Page 18: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

18

机器学习的未来发展

• 美国国防部高级研究计划局还说,“ CALO 的名字源于拉丁文 Calonis,含义是‘战士的助手’”,而且美国先美国国防部高级研究计划局曾在其网站上放置了如图 10.23 所示的一幅军官与虚拟参谋人员讨论战局的画面。因此可以预料,该计划的(部分)成果会直接用于军方。从上述情况来看,美国已经把对机器学习的研究上升到国家安全的角度来考虑。

Page 19: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

19

推荐阅读

[1] Eric Mjolsness, Dennis DeCoste. Machine Learning for Science: State of the Art and Future Prospects. Science, 2001, 293(5537): 2051-2055.[2] 王珏 周志华等 . 机器学习及其应用 . 清华大学出版社 , 2006.[3] Tom Mitchell. Machine Learning (英文版 ). 机械工业出版社 , 2003. 问题与讨论•结合自己的背景,说说机器学习在现实生活中的应用。•查看 NIPS 、 ICML 和 COLT 最新的会议信息,列举出各研究领域中的热门方向。•分析不同机器学习范式的特点和应用场景。

Page 20: 计算机科学前沿技术 Frontier Technologies in Computer Science

©

Fro

nti

er T

ech

no

log

ies

in C

om

pu

ter

Sci

ence

Thanks!

通识卓越课程http://en.tjcities.com/index.php/works