11
3 PERSPECTIVE 论坛 e-Science 科研信息化技术与应用 第2卷第4期 20117可视化研究前沿及展望 本文概述了可视化的基本含义及其发展过程。可视化可以分为三个主要方 向:科学可视化、信息可视化和可视分析。本文对各个方向的研究领域以及 前沿成果进行了详细介绍,并结合作者的实际研究工作举例和剖析。通过对 大气模拟数据、地震目录数据、交通轨迹数据等复杂高维数据开展可视分析 的多个案例的展示,阐述对由测量或计算所产生的海量高维数据进行分析和 诠释的新途径,探讨高维时空数据分析的通用途径和理论。 可视化;信息可视化;科学可视化;可视分析 要: 关键词: Visualization Research Frontier and Prospect In this article we survey the basic concepts of visualization and its historical development. More details are given on the introduction of each sub-domain of visualization research: scientific visualization, information visualization and visual analytics respectively. Examples are given to illustrate the new development in this area. The case studies include the visualization and visual analytics on atmosphere simulation data, earthquake catalog data, and traffic trajectory data. Through exploration on these cases, we illustrated new approaches of analyzing and interoperating the massive amount of high dimensional data produced by measurement or computation. General strategies of visualizing such kind of data are discussed. Visualization; Scientific visualization; Information visualization; Visual analytics Abstract: Keywords: 袁晓如,张昕,肖何,郭翰琦 北京大学信息科学技术学院,机器感知与智能教育部重点实验室,北京 100871 Yuan Xiaoru, Zhang Xin, Xiao He, Guo Hanqi School of EECS and Key Laboratory of Machine Perception (MOE), Peking University, Beijing 100871, China 基金项目:自然科学基金 60903062。

可视化研究前沿及展望 - escj.cnic.cnescj.cnic.cn/fileup/PDF/ES20110401.pdf过图形的表现形式,进行信息传递、表达的过程。虽 然我们今天谈到可视化一般是指利用计算机图形学和

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

3

PERSPECTIVE 论坛e-Science科研信息化技术与应用 第2卷第4期 2011年7月

可视化研究前沿及展望

本文概述了可视化的基本含义及其发展过程。可视化可以分为三个主要方

向:科学可视化、信息可视化和可视分析。本文对各个方向的研究领域以及

前沿成果进行了详细介绍,并结合作者的实际研究工作举例和剖析。通过对

大气模拟数据、地震目录数据、交通轨迹数据等复杂高维数据开展可视分析

的多个案例的展示,阐述对由测量或计算所产生的海量高维数据进行分析和

诠释的新途径,探讨高维时空数据分析的通用途径和理论。

可视化;信息可视化;科学可视化;可视分析

摘 要:

关键词:

Visualization Research Frontier and Prospect

In this article we survey the basic concepts of visualization and its historical development. More details are given on the introduction of each sub-domain of visualization research: scientific visualization, information visualization and visual analytics respectively. Examples are given to illustrate the new development in this area. The case studies include the visualization and visual analytics on atmosphere simulation data, earthquake catalog data, and traffic trajectory data. Through exploration on these cases, we illustrated new approaches of analyzing and interoperating the massive amount of high dimensional data produced by measurement or computation. General strategies of visualizing such kind of data are discussed.

Visualization; Scientific visualization; Information visualization; Visual analytics

Abstract:

Keywords:

袁晓如,张昕,肖何,郭翰琦北京大学信息科学技术学院,机器感知与智能教育部重点实验室,北京 100871

Yuan Xiaoru, Zhang Xin, Xiao He, Guo HanqiSchool of EECS and Key Laboratory of Machine Perception (MOE), Peking University, Beijing 100871, China

基金项目:自然科学基金 60903062。

4

PERSPECTIVEe-Science 论坛 科研信息化技术与应用 第2卷第4期 2011年7月

1. 引言

可视化(Visualization)可以粗略地被定义为通

过图形的表现形式,进行信息传递、表达的过程。虽

然我们今天谈到可视化一般是指利用计算机图形学和

图像处理分析技术,将各种数据依据其特点转换为相

应的图形图像,并提供界面实现人机交互的工作,但

早在计算机发明之前,可视化就已为人类广泛应用。

从医学教科书中人们用素描刻画复杂的人体器官的形

状和相互之间的空间关系,到科学家用各类曲线总结

表示大量实验的结果并归纳出其内在规律,到现代

传染病学研究萌芽时期John Snow使用地图作图分析

1854年伦敦霍乱的传播,无不是可视化的具体案例。

Charles J. Minard的地图1,通过线条的大小、颜色

等表现1812年拿破仑入侵俄国这一宏大的历史事件,

更是早期可视化的经典之作。随着计算机的发明和

计算技术的快速发展,特别是计算机图形学的创立

和繁荣,人们可以用前所未有的手段以图形化的形

式表现和刻画我们的世界,探索未知的领域,获得

新的知识。

现代意义上的可视化源自于计算机技术的发展,

由于超级计算机的发展和数据获得技术的进步,数量

日益庞大的数据使得人们不得不寻求新的更为精密复

杂的可视化算法和工具。1986年10月,美国国家自然

基金会主办了一次名为Graphics, Image Processing

and Workstations的专题讨论会议,正式提出科学

计算可视化的名词(Visualization in Scientific

Computing),将其列为一项独立的重大计算机技术。

Bruce McCormick等在其后的报告中指出可视化对培

育和促进主要科学突破的重要潜力和作用[1]。1990年

在美国加州旧金山举行的首届IEEE可视化会议(IEEE

Visualization Conference)初次组建了一个由各学

科专家组成的学术群体,标志了可视化作为独立学

科的成型。作为可视化的另一个分支,信息可视化

(Information Visualization) 稍晚兴起于二十世纪

九十年代。源自于统计、人机交互等方面的进展,信

息可视化一词由其时在Xerox PARC工作的Stuart K.

Card, Jock D. Mackinlay和George G. Robertson于

1989年提出。首届IEEE Information Visualization

会议1995年举办于美国亚特兰大。可视分析(Visual

Analytics)则是近年来新兴的通过交互可视界面来进

行分析、推理和决策的交叉学科,是科学可视化和信

息可视化的新发展。可视分析目前发展迅速,自2006

年起有了独立的会议(IEEE Symposium on Visual

Analytics Science and Technology)。需要注意的

是由于可视化发展的传统,以上几个方向的IEEE年会

每年都在一起举行,合称IEEE VisWeek。

2. 可视化的三个方向

可视化的三个方向——科学可视化、信息可视

化、可视分析密切相关,同时又各有特点,有其研究

内涵与外延。

2.1 科学可视化

科学可视化处理的对象包括医学、气象环境学、

化学工程、生命科学、考古学、机械等领域的具有空

间几何特征数据的时空现象,对测量、实验、模拟等

获得的数据进行绘制,并提供交互分析手段。研究重

点包括对表面、体的绘制和对复杂数据中信息的选

取、表达等。由于这些科学和工程领域中数据的空间

特性和高度复杂性,可视化成为了理解这些现象的基

础。可视化方法能够迅速、有效地简化和提炼数据,

使科学家能够可视直观地筛选大量的数据,理解数据

的内涵。科学可视化本身已经成为一门独立的学科,

研究如何更好地对科学数据进行表现和分析,同时科

学可视化也已经成为了其他众多科学领域研究的重要

支柱之一[2]。

科学可视化方法涉及计算机图形学、图像处理、

人机交互等众多学科。按照数据的种类划分,科学可

视化可以分为体可视化、流场可视化、医学数据可视

化等。面向不同的研究对象,科学可视化也发展出了

一系列的理论和方法。随着超级计算机和并行计算技

术的发展以及海量数据可视化的需求,大规模数据可1 http://en.wikipedia.org/wiki/Charles_Joseph_Minard

5

PERSPECTIVE 论坛e-Science科研信息化技术与应用 第2卷第4期 2011年7月

视化是科学可视化的重要课题之一。

体可视化(Volume Visualization)是科学可视

化领域中最重要的课题之一。体数据,即三维采样数

据,是各类科学工程领域以及医学领域中常见的数

据类型。体可视化技术包括从三维体中提取表面(例

如广为大家所知的Marching Cubes算法[3])、直接体

绘制(Direct Volume Rendering)等。通过直接体绘

制,研究者可以通过屏幕直观地考察三维体内部的信

息,而不需要逐层观察切片。如图1所示,体绘制可

以很好地揭示不同对象内部信息。体可视化领域的研

究主要着眼于如何更好地渲染和传达三维数据内部信

息、怎样自动挖掘和利用信息、怎样更精确快速的渲

染和更好的交互、以及更好地运用计算能力等。具体

而言,包括体绘制本身的算法、传递函数的设计、时

变以及大规模数据的处理等。随着数值模拟和传感器

技术的发展和普及,有越来越多的体数据需要处理,

数据的规模、时空精度也有飞速的提高。体可视化方

法也在提供着更强的渲染和信息传达能力,对众多科

学、工程以及医学领域提供强大的支持。

传递函数(Transfer Function)设计是体可视

化的核心问题之一,它实现了从数据到视觉特征的

转换[4]。传递函数将三维体数据中每个采样点的属性

映射为颜色以及不透明度值,以隐藏或凸显用户所需

要的特征,进而产生含义丰富的体可视化结果。然而

对用户而言,传递函数的设计并非易事。直接通过原

始体数据的密度值定义传递函数往往无法区分具有类

似密度范围的不同对象。梯度、曲率幅值以及空间

统计信息等被引入用于设计更加有效的传递函数。

用户需要在体数据的特征空间(Feature Space)中寻

找有意义的特征,并不断尝试,才能取得良好的效

果。例如,对单值的体数据引入梯度大小以辅助分

类,可增强体数据中的表面信息[4]。类似地,还可以

引入曲率[5]、特征的相对大小[6]、以及环境遮挡[7]等

维度,完成在低维特征空间中难以做到的分类效果。

对于多变量(Multi-variate)的体数据,可以采用高

斯传递函数进行设计[8]。

流场可视化是科学可视化的重要分支,对流体

研究有着巨大的意义。它运用计算机图形学和图像处

理技术,将流场数据转换为二维或三维图形、图像或

动画进行呈现,并对其模式和相互关系进行分析,是

计算流体力学研究与工程实践中不可缺少的手段。流

场可视化方法在汽车、航空和航海动力学、生物、医

学医疗等众多领域都已有着重要而广泛的应用。常见

的流场可视化有基于几何、基于纹理的方法等。这些

方法使用基本的图形元素,包括粒子、标志、场线、

表面、纹理等反映流场形态,组合并构建虚拟风洞系

统,辅之以交互分析手段,为相关领域专家提供有力

工具。

流场可视化中的一个经典研究问题是流线放置

(Streamline Placement)问题(图2a)。受屏幕空间及

用户感知能力所限,流线图只能由有限数目的流线组

成。如何有效地在空间中选择恰当的流线,需要考虑

(a) (b) (c)

图1 体绘制结果示例:(a) 湍流模拟数据2;(b) 医学CT扫描数据3;(c) 石油地震反演体数据。以上结果均使用PKU Volume Visualization Toolkit绘制。(http://vis.pku.edu.cn/software)

2 数据来源:NSF ITR project, http://www.cs.ucdavis.edu/~ma/ITR/tvdr.html3 数据来源:Viatronix Inc., USA., http://www.viatronix.com

6

PERSPECTIVEe-Science 论坛 科研信息化技术与应用 第2卷第4期 2011年7月

很多因素,例如流场中临界点(Critical Points)的

位置和种类、用户的视角、三维流线的绘制等。目前

这些问题仍是研究热点。

随着计算机数据处理能力的增强和GPU技术的发

展,Streak Surface作为一种时变三维流场数据可视

化的手段日渐流行[9](图2b)。它可以展示从任意曲线

连续释放的粒子所形成的曲面,类似于真实的流场实

验中所观察到的场景。

大规模数据可视化是将海量数据进行可视化

的技术,其研究重点在于如何高效地处理大量的数

据。随着现代超级计算技术的发展,科学家可以利

用大规模计算机集群(例如我国自主研制的天河一

号超级计算机),对各类自然现象进行模拟,包括

气候变化,宇宙起源等等。虽然计算速度得到了日

新月异的发展,但是对于计算产生的大规模海量数

据却缺乏有效手段进行存储、传输及可视化,进而

理解分析其中的信息。大规模数据可视化的最大的

瓶颈在于硬件可同时处理数据的能力以及硬件数据

读取的带宽。在有些应用中,数据的规模往往达到

了TB、PB量级,甚至有向EB量级发展的趋势,使得

现有方法难以处理。并行可视化,正是利用了并行

计算以及并行IO等技术,克服这些瓶颈,实现大规

模数据可视化。并行可视化的算法的效率、可伸缩

性(Scalability)以及可靠性等课题都是研究的重点

问题。特别地,近年来提出的现场可视化(In-Situ

Visualization)[10],即在数值模拟的同时,利用一

部分计算能力对数据可视化,成为了可视化领域的

焦点。

2.2 信息可视化

信息可视化是一门研究非空间数据的视觉呈现

方法和技术的学科,通过提供非空间复杂数据的视觉

呈现,帮助人们理解大量数据中蕴含的信息[11]。信

息可视化作为一个跨学科研究领域,综合地使用计算

机图形学、视觉设计、人机交互、心理学等学科中

的技术和理论,也与统计学、数据挖掘、机器学习

等有着相辅相成之处。信息可视化的思路和方法已

经成为了自然科学、社会科学、商业、管理、传媒

等众多领域不可或缺的一部分。信息时代正带给人

们前所未有的复杂海量信息,而人处理和理解信息

的能力是非常有限的。信息可视化正是一种帮助人

们理解信息和获取知识的方式:信息可视化的视觉

呈现方法将数据映射为视觉符号[12],利用人类视觉

系统的高带宽,帮助人们快速地获取信息;信息可视

化中的交互方法允许用户与数据的快速交互,更好地

验证假设和发现内在联系。信息可视化为人们提供了

理解高维度、多层次、时空、动态、关系等复杂数据

的窗口。

多维数据可视化(Multi-Dimensional Data

Visualization)是信息可视化中的重要组成部分,

它已经成为越来越受欢迎的显示和探索复杂多维数据

的方法。现实应用中,实验数据、模拟数据和统计数

据等大多以多维形式存在。如何将超过人类理解能力

的三维以上的数据,转化为人类能视觉直观理解的

可视化结果,是多维数据可视化所研究的课题。多

维数据有多种传统的可视化方法、包括平行坐标、

散点图矩阵和维度降维法。其中平行坐标(Parallel

(a) (b)

图2 流场可视化例子:(a) 二维流线 (Streamlines);(b) Streak Surface (图片来自于[9])

7

PERSPECTIVE 论坛e-Science科研信息化技术与应用 第2卷第4期 2011年7月

Coordinates)[13]是最为广泛使用和研究的方法。它的

主要原理是将高维数据的各变量维度用一系列相互平

行的坐标轴来表示,每个变量对应一条轴,变量值对

应轴上的位置,每个高维数据条目对应于平行坐标中

的一条折线。平行坐标可以将几维至几十维变量的数

据同时直观地呈现在一张图中,支持对高维数据的快

速查看和分析。

图(Graphs)是一种表示对象之间关联信息的数

据抽象,真实世界中各种有关联的个体都可用图来表

示。节点链接图(Node-Link Graph)是信息可视化中

表现图结构数据最古老也最重要的方法之一[14]。它

采用空间中的二维或三维节点代表对象,用节点之间

的连线代表对象之间的关联信息,通过布局算法将大

量的节点及连线有组织地呈现出来。图可视化方法能

够快速呈现关系数据中的大量信息:节点和连线的视

觉设计可以传达关于对象及对象间的关联信息,整个

图的布局则能够揭示大量对象之间的内在关系和结

构,相应的交互方法能够帮助用户对数据进行深入地

挖掘。图可视化方法在物理网络、生物网络、社会网

络、信息网络等领域都有着重要的应用。

图3是用节点链接图的方式来表现某国家重点实

验室在一段时间内所发表论文的作者之间的合作关

系。每个点代表一个作者,点的大小与其发表文章的

数量成正比,如果两个点有边相连,则说明他们共同

合作过一篇文章。借助这种方式,我们可以很直观的

看到该国家重点实验室有两个大的学术团队,每个团

队都有自己的带头人。团队内部合作越密切,这个团

队的点就会越密集。而这两个团队之间有很多边相

连,说明这两个团队的研究方向有交叉,他们之间也

有比较密切的合作关系。

层次数据(Hierarchical Data,或树型结构)也

是物理世界和信息世界中常见的数据形式之一,磁盘

文件系统、地理行政划分、公司人员结构等,都是常

见的层次数据。近年来产生了大量以内隐关系呈现层

次化数据的方法[15]。内隐式层次数据可视化方法使

用包含、遮挡、相邻等空间关系表示数据中的逻辑关

系,更高效地表现复杂海量的层次数据,提供快速对

数据全貌的理解。相比于传统的节点链接表示,内隐

式表示方法能够最大限度地利用所有显示空间,提供

更好的数据呈现效果和交互体验。树图(Treemaps)可

视化作为层次数据可视化中为最成功的代表[16],已被

广泛地应用于文件和软件系统、股市、新闻、商品等

大量数据的表示。

信息可视化与科学可视化不是截然分开的。前面

提到科学可视化传递函数研究的一个重要挑战是数据

的维度。受屏幕空间的限制,用户很难在高维空间中

定义有意义的特征。基于我们在信息可视化方面的工

作[17],结合平行坐标(Parallel Coordinates)和多维

尺度降维分析(Multi-Dimensional Scaling, MDS),

我们提出了新的多维传递函数设计方法[18],用于科学

与工程模拟中产生的高维体数据。平行坐标将高维数

据的每一点映射为平面空间的折线,在结果中完整地

保留了每一个维度的信息,但利用平行坐标设计传递

函数需要在每个维度上进行调整,比较繁琐;多维尺

度分析将高维空间中的聚类信息投影到平面空间,使

得聚类更加容易被识别和选择,但降维方法丢失了原

有数据在每个维度上的信息。我们设计了新的用户界

面用于多维传递函数设计,结合了平行坐标和散点图

的优势,取长补短,便于用户以多种方式设计多维传

递函数(见图6)。图3 某实验室合作关系图

8

PERSPECTIVEe-Science 论坛 科研信息化技术与应用 第2卷第4期 2011年7月

2.3 可视分析

可视分析(Visual Analytics)作为信息可视化

与科学可视化领域最新发展的产物,主要包含四部分

核心内容:分析推理技术(Analytic Reasoning),

视觉呈现和交互技术(Visual Representation

and Interactions),数据表示和转换技术(Data

Representations and Transformations)和支持

产生、表达和传播分析结果的技术(Production,

Presentation and Dissemination)[19]。可视分析技

术致力于通过交互可视界面来进行分析、推理和决

策。人们通过使用可视分析技术和工具,从海量、动

态、不确定甚至包含相互冲突的数据中整合信息,获

取对复杂情景的更深层的理解。可视分析技术允许人

们对已有预测进行检验,对未知信息进行探索,提供

快速、可检验和易理解的评估,以及提供更有效的交

流手段。

可视分析领域整合了不同领域的理论、方法和

工具,提供先进的分析手段、交互技术和可视表达,

允许人与海量复杂信息之间的快速交流。基于感知和

认知理论的工具设计,应用领域的理论、方法和需

求,计算机图形学和人机交互领域的呈现技术,使

可视分析具有了巨大的能力和价值,将在物理、天

文、气象、生物等科学领域,和应急事件分析处理

决策、国防安全保障、社会关系分析等社会领域发

挥重要作用[20]。

3. 高维数据可视化案例分析

可视化是一个与应用研究领域紧密结合的学科,

下面我们结合我们近期开展的可视化研究,特别讨论

和高维数据相关的可视化案例。这里我们探讨如何利

用以平行坐标为代表的可视化技术,对复杂高维时空

数据开展可视分析,通过提供统计或交互式视觉表现

来帮助人们探索和解释高维数据,对由测量或计算所

产生的海量数据进行分析和诠释。我们通过可视化大

气模拟数据、地震目录数据、交通轨迹数据等案例,

探讨高维时空数据分析的通用途径和理论。

高维数据可视化方法能够对包含数十乃至数百维

的复杂数据进行快速直观的探索,因而受到各种高维

数据分析需求的青睐。例如图4呈现的是通过平行坐

标对汽车数据的可视化,数据包括耗油量、汽缸数、

加速度等8个维度,共392种车型。利用我们的散点图

结合平行坐标的工具,将汽缸数加速度,定型年份和

产地四个维度投影在散点图平面上。可以看到数据集

有明显的多个聚类,用户选择了并赋予了一个聚类并

赋予其红色,其他为蓝色,平行坐标的维度坐标同时

展现了这个聚类在其他维度的属性分布。从图中可以

看出,红色聚类是产自美国的轻型汽车,具有汽缸数

目不多、车重量较轻、加速性能中等等特征。

科学研究中的高维数据也常需要可视化方法作

为理解和分析的基础,例如生物学中的DNA微阵列数

图4 利用平行坐标对汽车数据进行可视化[17]

mpg-8.24

-47.76 60.26 36.2 1542.46 2.9 7.664

model_year rigin

69.76 0.96MDS

233.8displacementhorsepower462.74

weight5210.54

cylinders8.1

acceleration25.136

model_year82.24

origir3.04

9

PERSPECTIVE 论坛e-Science科研信息化技术与应用 第2卷第4期 2011年7月

据,是具有数百个维度的复杂数据。图5呈现的是高

维数据可视化方法对DNA微阵列数据的分析,目的是

在癌症诊断中找出在癌细胞中哪些基因的表达发生了

变化。数据集包含了来自20位病人的肠胃癌组织,癌

细胞附近组织以及5位普通人对照组的21,329种微阵

列芯片的结果。绿色表示正常人的基因表达,蓝色和

红色分别代表癌细胞组织和靠近癌细胞组织的基因表

达。图中显示了数据中的一百个基因表达维度。利用

我们的平行坐标工具,用户可以快速的找出好的基因

表达维度组合用于区分癌组织,即近癌组织和正常组

织。图中用户选择了一些候选维度进行投影,成功的

区分了三种不同的组织,得到了很好的结果。

相应的可视化方法还可以用于研究更为复杂的

问题和现象。近年来,全球气候变化日益引起人们的

关注。气候变化带来的各种自然灾害,给人们的生命

财产带来了巨大威胁,如2004年袭击东南亚的印度洋

海啸、2005年袭击美国的卡特里娜飓风等。理解、预

测、防范重大气候灾害,受到了研究者的极大关注,

近年来并行计算、科学模拟和大规模数据可视化等技

术的发展,也为这些自然现象的理解带来了前所未有

的机遇。但对于复杂的地球系统,目前人类还难以完

全理解其机理。特别地,对于大量由观测和数值模拟

得到的数据,由于其维度和模态很多,目前还缺乏有

效的分析手段。

台风作为沿海地区常见的自然灾害,是气象学家

研究的热点之一。根据物理原理计算模拟获得的台风

演化数据,由于其高维、时变和海量的特点,难以获

得深入的理解。通过结合最新的高维传递函数设计方

法,我们提供了对台风模拟数据的直观快速呈现和分

析的方法。

图6和图7展示了使用我们设计的高维传递函数设

计方法应用于台风模拟数据4的一个例子。我们使用

数据中5个维度设计传递函数,它们分别是压强、温

度、风速、水蒸汽含量、云水分。信息可视化方法中

的平行坐标和MDS图以不同的方式、从不同的角度展

示了高维数据的分布及聚类情况,并通过一定的方式

整合为一体。用户可以通过多种交互手段选择感兴趣

的特征,以设计传递函数。从该可视化结果中,我们

可以快速解读数据中的信息,例如红色所表示的风眼

区域,压强、温度和水蒸汽含量较低,但风速较高;

外围的黄色区域与风眼相比,温度、压强和水蒸汽相

对较高(见图7)。通过该可视化工具,气象学家可以

更快捷方便地对气象数据进行分析、验证和推理,帮

助对气候现象的理解。

与对台风的大量研究相比,人们对地震的了解则

少得多,而地震的破坏力和对人类生活的影响却大得

多。因而研究地震发生的机制,和这些重大事件对人

类社会的影响,也是可视化技术应用的重要场合。对

于地震这样复杂的现象,往往与很多因素相关联。然

而,目前还缺少有效的手段综合分析各类因素对地震

活动的影响。在我们的工作中,我们结合了卫星遥感

数据和地震目录数据,为地震研究人员设计了可视分

析系统。

图8展示了地震目录数据(Earthquake Catalog

图5 利用平行坐标对DNA微阵列数据进行可视化

Intestinal Gastric Cancer Tissue

Adjacent Cancer TissueNormal Gastric Tissue

4 数据来源:IEEE Visualization Contest 2004,Hurricane Isabel, http://vis.computer.org/vis2004contest/data.html

10

PERSPECTIVEe-Science 论坛 科研信息化技术与应用 第2卷第4期 2011年7月

Data)的可视化及可视分析[21]。该数据涵盖了几十年

内中国及周边地区地震发生的时间、地点、震级等信

息。用户可以通过多尺度的时间轴以及地震统计图,

迅速找到显著的地震活动。在时空视图(Spatial-

Temporal View)中,地震事件用不同颜色的点表示,

并按照发生时间沿垂直地表的方向排列。在图8中,

我们可以清楚地看到唐山大地震及其余震发生的特点

及其模式,并可以同其它地震做比较。进一步,我们

还可以将地震信息和遥感数据相结合,帮助地震领域

科学家分析不同变量间的关系,促进地震领域方面的

研究[21],或将地震记录和其它事件记录数据相结合,

帮助研究地震对人类社会生活的影响,催生更合理的

重大事件应对机制等。

除了对重大自然和社会现象的呈现和分析,可

视化在日常生活事件的理解和分析上,也能发挥重

要作用。例如,呈现和分析城市道路的局部结构和

交通状况,是理解各种复杂交通事件,进而理解整

个城市交通状况发展变化的基础。在TripVista[22]

可视分析系统中(图9),我们使用多种可视化方

法综合分析一个路口的交通状况,其中数据的主

要形式为通过路口的行人、自行车以及机动车的

轨迹。通过在平行坐标系显示的高维信息中筛选

出突出的特征,在ThemeRiver和散点图中观察事

件发生的时间点,并结合直观的交通轨迹视图进

行综合比较,我们可以从复杂的交通轨迹数据中

挖掘出有价值的信息。例如对危险事件的发现,

用户可以在平行坐标中选择角度变化较大的轨

迹,即可在路口中发现一些异常轨迹。进而通过

对时间轴的筛选,便可以在海量数据中发现一个

(a)

(a)

(c)

(b)

(d)

Pressure3225.43

QCLOUD0.00332

Temperature31.5158

Speed100

QVAPOR0.02368

-547186 -83.004 Presaue Temperature Speed Pressure Temperature Speed DVAPCrt OCLOUD0 00

(b)

图6 多维传递函数设计,用于飓风模拟数据:(a)基于平行坐标和投影图的传递函数设计;(b)对应的体渲染结果。(图片

来自于[18])

图7 飓风模拟数据各成分渲染结果。(图片来自于[18])

图8 地震目录数据的可视化及可视分析(图片来自于[21])

11

PERSPECTIVE 论坛e-Science科研信息化技术与应用 第2卷第4期 2011年7月

由于自行车违章穿越路口险些碰撞到行驶的机动车

的危险事件(图9 (b))。

通过上文的案例分析可以看到,很多具有重大

现实意义的可视化研究和成果,都需要多种可视化方

法、交互技术和领域知识的有机结合,而高维数据可

视化在其中都扮演着重要的作用。例如台风数据可视

化中,高维数据可视化方法被用来帮助科学可视化中

的传递函数设计和体渲染。地震目录数据的研究中,

地理空间信息、时变信息、地震记录、高维遥感数据

等,都通过整合的可视化系统快速有机的呈现了出

来。而交通信息可视化案例中,我们的系统更是从时

域、空域和高维数据域同时重现交通现场的状况,提

供了更快速全面的分析能力。

随着科技和社会进步,人们需要理解的科学和社

会现象日趋复杂,也对可视化系统的呈现和分析能力

提出了更高的要求,单一的可视化方法已不能满足需

要。正如前文案例所示,越来越多的可视化系统通过

结合不同的科学和信息可视化方法,提供一致的多视

角和连贯的交互手段,使可视化系统能够提供日益复

杂的数据所需的分析能力。

4. 结论与展望

可视化作为一个新兴的研究领域,通过将各种复

杂的数据转换为直观的图形图像,帮助使用者经由视

觉这一最有效的感知手段了解数据的内在规律,从而

(a) (b)

图9 交通轨迹数据的可视分析(图片来自于[22]):(a) 可视分析系统TripVista界面;(b) 在海量轨迹信息中找到的机动车危险事件

取得新的发现。可视化将人的智能认知和计算机系统

的强大计算能力有机结合,相互补充。我国可视化的

研究起步较早,开始于九十年代初,早期主要关注于

体可视化以及医学可视化。随着我国在科技和经济各

方面的飞速发展,迫切需要先进的可视化研究提供对

数据可视分析和诠释的工具。

在大规模计算方面,我国的超级计算技术这几年

发展迅猛。最新的天河一号已经位列世界超级计算机

Top500前列。与此相应,适应超级计算产生的海量数

据的可视化技术(例如In-Situ Visualization)急

迫需要发展。

可视化研究是一门与应用领域紧密结合的学科。

需要在领域科学家和可视化专家之间建立更加紧密的

联系。例如近年来,我国正在大飞机等复杂系统开展

研究开发工作,涉及到复杂湍流系统等的计算和可视

分析;地质勘探油气资源、理解地震机理以及全球气

候变化等地球物理相关研究,也需要有面向具体应用

的可视化方法和工具。从e-Science角度看,可视化

是科学研究信息化的重要的一环。面对解决复杂的科

学问题,可视化是对相应科学数据分析、发现、预测

的重要手段。通过可视化,还将改变科学家们之间信

息交流的方式,促进信息的共享,是科学协同研究不

可或缺的方式。同时由于可视化的直观性,是向公众

传递科技信息的关键手段。

除了科研和工程,社会生活的发展也产生了大

量复杂的数据和现象,需要更有效的可视化工具。

13

PERSPECTIVE 论坛e-Science科研信息化技术与应用 第2卷第4期 2011年7月

收稿时间:2011年1月3日

作者信息

袁晓如

北京大学信息科学技术学院,机器感知与智能教育部重点实验室,研究员,博士生导

师。研究方向为科学可视化,信息可视化,可视分析,人机交互。

Dimension Projection Embedded in Parallel Coordinates

[C]. In Proceedings of IEEE Pacific Visualization

Symposium (PacificVis 2011), Hong Kong, March 1-4,

2011.

[19] James J. Thomas, and Kristin A. Cook, Illuminating the

Path - The Research and Development Agenda for Visual

Analytics. National Visualization and Analytic Center,

2005.

[20] Daniel Keim, Jorn Kohlhammer, Geoffrey Ellis, and

Florian Mansmann, Mastering the Information Age -

Solving Problems with Visual Analytics. Eurographics

Association, 2010.

[21] Xiaoru Yuan, He Xiao, Hanqi Guo, Peihong Guo, Wesley

Kendall, Jian Huang, and Yongxian Zhang, Scalable

Multi-variate Analytics of Seismic and Satellite-

based Observational Data [J], IEEE Transactions on

Visualization and Computer Graphics, 16(3):1413-1420,

2010.

[22] Hanqi Guo, Zuchao Wang, Bowen Yu, Huijing Zhao,

and Xiaoru Yuan. TripVista: Triple Perspective Visual

Trajectory Analytics and Its Application on Microscopic

Traffic Data at a Road Intersection [C]. In Proceedings of

IEEE Pacific Visualization Symposium (PacificVis 2011),

Hong Kong, March 1-4, 2011.

张 昕

北京大学信息科学技术学院,硕士研究生。研究方向为信息可视化。他的研究兴趣主要

包括信息可视化中的图可视化和层次数据可视化,信息可视化中的用户交互,及可视化

中的感知和心理因素。

肖 何

北京大学信息科学技术学院,博士研究生。研究方向为高维数据信息可视化,可视

分析。

郭翰琦

北京大学信息科学技术学院,博士研究生。研究方向为科学可视化,可视分析。