38
1 AI 如何创造社会价值? 2018 百度社会价值报告 报告撰写: 中国社会科学院社会学研究所 报告负责人:吕鹏 报告研究员:何晓斌、贾舞阳、王源、刘金龙、郭盛杰 2018 年 11 月

AI如何创造社会价值? 2018百度社会价值报告csr.baidu.com/Uploads/Picture/2018/12/10/u5c0e2ff8e8f7f.pdf · 2 今天,我们再次迎来了一个历史性交汇期,科学技术从来没有像今天这样深刻影响着国家前途命运,

  • Upload
    others

  • View
    35

  • Download
    0

Embed Size (px)

Citation preview

1

AI 如何创造社会价值?

2018 百度社会价值报告

报告撰写: 中国社会科学院社会学研究所

报告负责人:吕鹏

报告研究员:何晓斌、贾舞阳、王源、刘金龙、郭盛杰

2018 年 11 月

2

今天,我们再次迎来了一个历史性交汇期,科学技术从来没有像今天这样深刻影响着国家前途命运,

从来没有像今天这样深刻影响着人民生活福祉;我们也比历史上任何时期都更接近中华民族伟大复兴的目

标。

当前,新一轮科技革命和产业变革引发了全球经济结构的重塑,科学技术与实体经济深度融合,经济

发展的质量越来越取决于其中的科技含量。可以说,没有高质量科技供给,就没有高质量经济发展。

提供高质量科技供给,着力支撑现代化经济体系建设,是我国产业迈向全球价值链中高端的必由之路,

也是我国科技工作者的重要职责和使命。

——习总书记出席两院院士大会发表的讲话精神

人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓

住新一轮科技革命和产业变革机遇的战略问题。要深刻认识加快发展新一代人工智能的重大意义,加强领

导,做好规划,明确任务,夯实基础,促进其同经济社会发展深度融合,推动我国新一代人工智能健康发

展。

——习总书记主持中共中央政治局就人工智能发

展现状和趋势举行第九次集体学习时的讲话精神

3

目 录

一、改革开放与百度发展历程 4

二、从“能”到“赋”:AI 资产的社会价值 5

三、主要观点和结论 8

四、数据:集合与平权的力量 11

五、算力:从智能商业到智能社会的发展引擎 18

六、算法:技术迭代满足社会需求 24

七、百度 CEO 的社会价值观 34

4

一、改革开放与百度发展历程

今年是改革开放 40 周年。百度成立 18 年。

当百度呱呱坠地的时候,改革开放已经实行了 22 年。那时候的中国,就像一个锐意进取的青年。在

互联网经济春天萌动的季节里,百度于 2000 年 1 月在北京中关村创立,百度在改革开放青春的脉搏下成

长。2005 年 8 月 5 日,百度在美国纳斯达克成功上市。目前,百度已经是全球 大的中文搜索引擎,也

是全球 大的中文网站。

今天的中国,更加成熟和稳健。而百度也经历了三次重要转变。百度的第一步从搜索引擎开始,实现

了“让人们 平等便捷地获取信息,找到所求”的企业使命。第二步,在移动互联网时代,百度“连接 3600

行”,推动金融、医疗、教育、汽车、生活服务等传统行业与互联网的深度融合发展。今天,百度走上了

第三个发展阶段:百度在人工智能领域不断探索新的未来,以“百度大脑”为依托,以“Everyone can AI”

的理念,持续开发新技术、新产品,助力各行各业的创新升级,创造全新的发展机遇。

百度对经济增长做出了杰出的贡献。百度正通过遍布全国的服务网络,为近百万家企业提供搜索营销

服务,不仅涵盖农业、工业、服务业三大产业,而且遍及全国 31 个省市。搜索引擎推广使用门槛低,对

中小企业的销售拉动能力强。 据中国信息通信研究院的相关研究结果表明,合作企业在百度搜索引擎在线

推广服务中的投入产出比高达 1:431。

除了产生巨大的经济效益,从创立至今,百度始终将自身的发展与社会的发展紧密地联系在一起。然

而百度的科技力量所引发和可能引发的社会影响,却一直没有得到系统地梳理和展望。为了弥补这个缺憾,

发现百度的另一面,百度公司聘请来自中国社会科学院社会学研究所、清华大学社会学系、中国人民大学

社会学系的专家团队,对百度科技资产的社会价值做一次系统的第三方评估。

今天的百度,确立了“夯实移动基础、决胜 AI 时代”的战略。AI 已经成为百度的代名词。因此,这

次评估以人工智能生长动力的算法、算力、数据为重点。百度是改革开放的受益者,也是中国经济奇迹的

参与者。希望百度创造社会价值的理念、做法和潜能,能够给市场和公众以启迪,可以吸引到更多的科技

力量,共同投入到推动中国经济高质量发展和习近平总书记提出的“伟大的社会革命”的事业中去!

1 中国信息通信研究院政策与经济研究院《搜索引擎的社会和经济影响(2014)》

5

二、从“能”到“赋”:AI 资产的社会价值

(一)考量社会价值的方法

社会价值包括了方方面面。我们参考经典的企业社会责任理论、IRIS、GRIs 等模型,针对科技企业的特

点,开发了一个叫做“科技雷达”的指标体系,设计了五个维度来考察产品及公司的广义“社会价值”:

(1)经济责任;(2)规则-法律效应;(3)社群-环境效应;(4)科技-文化效应;(5)个人福祉。我

们从这五个维度来分别“勘察”百度的广义社会价值。比如,如果 AI 的开发是在遵循上述的伦理,考虑到

百度的体量和行业影响力,那实际上就不仅仅只会对百度一家公司产生影响,而是会影响到所有与百度有

关的生态伙伴,甚至扩散到其他利益相关者。这就不仅符合我们所说的“科技和文化价值”里面的“对道

德和伦理的尊重与遵循”、“解决新伦理争议的措施”,而且符合“规则和法律效应”里的“有效参与新

规则、标准的制订”甚至“带来规则的系统性变革”。

当我们做“社会影响评估”(social impact assessment)的时候,大多数的范式都是聚焦于测量实

际的影响。影响包括两个基本的层面:Output 和 Outcome。前者指的是短期内,某种产品或者服务所产

生的直接的观测值;Outcome 指的是中长期内可以观察或测量到的变化。这提示我们注意到,企业或产

品的社会影响力,应该在一个动态的过程中评估。社会影响力取决于产品乃至企业所处的发展阶段,也取

决于企业所嵌入到的那个社会所处的发展阶段。产品的发展理论上需要经历起步、探索、突破、盈利、扩

张这五个阶段,不同阶段的社会影响力也应该有所侧重。通过梳理百度不同时期的发展历程和特点,我们

发现,百度早年的社会价值主要通过移动搜索业务来体现的。但近些年来,AI 产品的发展为百度更好地参

与到推动社会进步的伟大事业中,提供了更多的想象空间。所以,发现和评估百度的社会价值,既要回答

6

百度做了什么,也要预测百度将来可能带来什么

(二)百度推动社会发展的优势

尽管各种科幻片里科技可能造成的灾难后果让人印象深刻,但我们今天确实无时无刻不在享受着科技

革命带来的红利。大多数人会认可李彦宏的那番表述:“我们觉得技术可以推动社会的发展,可以为人类

造福。”但问题的关键,是怎样推动社会发展、为人类造福。

百度公司首先是一家科技公司,百度 为核心的资产也是“科技资产”。市场对于百度价值的判断,

首先是基于对于百度掌握的科技的价值的判断。

我们要揭开的另一面,是这些“科技资产”的社会价值,是这些社会价值所传递的改变人类命运的温

度,是百度将“能”赋予千千万万的社会群体和伙伴的这个过程和结果。只有“能”的企业只是一家科技

公司,只有迈开了“赋”的双腿,“能”才能落地,才能成为一家科技价值与社会价值相得益彰的“赋能”

企业。

百度的科技资产体现在方方面面,这篇报告无法一一涉及。我们选择了数据、算力、算法这三个核心

领域。

选择这三个领域,首先是出于对于我们这个时代“大趋势”的判断。越来越多的人们认同,一个以数

字经济和“数字文明”为基础的“智能时代”正在来临。换句话说,人工智能时代,是开发者调动数据、

算力、算法创造奇迹的时代。事实上,在过去的两年里,机器学习和人工智能可谓呈指数迅速增长,越来

越多的资本把目光转向了这一新兴领域。

其次,更重要的原因是,百度在数据、算力、算法三个领域积累了大量的领先优势。百度有了十八年

的搜索业务的领跑,积累了社会行为的海量数据;在决战 AI 时代,这些数据成为百度形成自己在算力和算

法方面领导者的基础。

我们这份报告要强调的是,以数据、算力、算法为代表的百度核心科技资产的价值,不仅在于技术本

身(比如技术创新),更在于技术所能带来的社会影响。当然,技术的社会影响可能是正面的,也可能是

负面的。当百度致力于通过科技创新,来回应社会需求的时候,就是在让科技资产创造正向的社会价值。

更重要的是,技术资产与社会资产、文化资产、经济资产具有强关联性,通过相互作用,从而创造出更为

广阔的影响和价值。

今天的政府、市场、公众可能已经越来越重视科技本身的价值,但有一些人对于科技资产的社会价值

的认识依然是不足的,对百度需要有一个再认识的过程。

7

(三)百度推动社会发展的方式

科技公司发挥社会影响力,有三种方式。第一种是自然而然的影响。比如设计和生产出一种产品,这

种产品就会发生影响。生产出这种产品的公司,并不需要去担心产品是被好人还是坏人使用,因为“科技

是价值中立”的。这与自由主义的企业社会责任观大体是一致的(比如认为企业 大的社会责任就是做好

自己的产品)。第二种是企业社会回应,一般指的是被动地回应公众对企业的诉求。第三种是主动干预。

这种思维下的科技公司,会去更多地主动考虑产品的社会、文化和伦理影响,会主动地设定科技应用的规

则和边界。这三种偏好的背后,是三种不同的思维方式和企业社会责任战略。

我们今天已经习惯了遇到问题就“百度一下”,似乎已经对此习以为常,忘记了百度起家的搜索引擎,

本身就在一直创造和维护社会价值:平等地获取信息、打破信息鸿沟。此外,百度有许多产品直接就自带

浓烈的社会价值。比如百度学术、百度地图、百度百科、百度教育等等。

然而,仅有这样是不够的。技术的发展和普及也在改变我们的期待,塑造新的社会行为、产生新的社

会问题。公众对于百度这样的科技巨头公司有了更高的要求。在一段时间里,百度相信科技自身的力量,

因此得到迅猛发展,也因此跌过跟头。百度针对公众和其他利益攸关者的质疑,究竟有没有做过反思?有

没有采取措施真正地回应那些“痛点”?我们的报告有一部分将专门对此做出考察。

除了“企业社会回应”,更重要的是主动地设置社会议程。我们发现,进入 AI 开发时代之后,我们越

来越多地听到百度对于“设立什么样的规则”的反思。在今年 9 月的上海世界人工智能大会开幕式上,百

度 CEO 李彦宏的“三维一体论”就让人耳目一新。李彦宏说,一个真正的“AI 化公司”是三维一体的。

“它首先要具备 AI 思维,其次要拥有 AI 能力,第三还要遵循 AI 方面的伦理。”其中,关于伦理,李彦宏

认为,“公司的发展必须遵循 AI 伦理的四个原则——第一个原则,AI 的 高原则是安全可控;第二个原

则,AI 的创新愿景是促进人类更加平等地获得技术能力;第三个原则,AI 存在的价值是教人学习,让人

成长,而不是取代人、超越人;第四个原则,AI 的终极理想是为人类带来更多的自由和可能。这是因为

AI 的目标是为了让世界变得更加美好,是为了把人类从既有的认知局限中解放出来;另外一方面,数据的

广泛可连接和应用,有可能导致隐私方面的问题也会日益凸显,因此我们的企业必须要牢记初衷,把安全、

把伦理以及广泛的社会关怀,融入到公司的血液当中。”

今天,我们注意到:百度正在越来越多地以一种主动的姿态,通过它的赋能行动,与它的生态伙伴一

起,将它所掌握的基础科技力量落地为改变你我他的应用和场景。换句话说,基础科技就像是火种,通过

在各种场景中的应用,形成改变人类社会的燎原之势。这些主动的措施,有很多是对之前暴露的短板和问

题的回应,比如针对医疗搜索的一系列举措,更多的则是百度在“用科技创新回应社会需求”这个主线下

的主动探索。

8

三、主要观点和结论

(一)观点

作为一家科技公司,“科技资产”是百度 为核心的资产。市场对于百度价值的判断,首先是基于对

于百度掌握的科技的价值的判断。

“科技资产”的社会价值应该得到更多的重视。以数据、算力、算法为代表的百度核心科技资产的价

值,不仅在于技术本身,更在于技术所能带来的正向社会影响。

技术资产与社会资产、文化资产、经济资产是具有强关联性的,通过相互作用,从而创造出更为广阔

的影响和价值。

Ø 观点 1:

百度搜索是中国互联网数据平权的先驱,也是中国人工智能产业发展的奠基者。百度搜索作为改变

供需对接的平台,是加速数据红利向智能红利落地的推手,是从“集合数据”到“共享数据”的汇

聚点和释放器,也是推动中国经济发展的重要动力之一。

Ø 观点 2:

百度 AI 赋能社会与产业,普及 AI 文化,参与建构 AI 规则与伦理,为“智能文明”提供基础动力,

将有可能改变社会的生产力结构、显著提升人民生活的幸福感。

Ø 观点 3:

李彦宏不仅是第一个在科技力量上全面进军人工智能的中国企业家,而且是第一个在中国全面阐述

和实践人工智能社会价值的企业家。

(二)评价

经济责任:

Ø 百度搜索打破“数据鸿沟”和“数字孤岛”,帮助社会各阶层平等地获取信息,节约信息获取成本,

实现了“数据平权”。

Ø 百度通过技术创新,改变了供需对接的方式,加速“数据红利”到“智能红利”的落地;从而助力

中小企业成长、增加就业岗位。

Ø 百度的开源政策缩小“智能鸿沟”。降低 AI 技术门槛,为众多企业和产业提供了在未来的人工智能

时代可持续发展的基础。

9

Ø 百度的科技创新把人从危险、低效的劳动中解放出来,同时也催生新的就业和劳动关系,可能改变

社会结构。

Ø 人工智能与数据结合,减少虚假数据,提高数据质量,打通数据互通的障碍,为高质量发展提供基

础。

Ø 百度的 AI 赋能战略打破了 AI 壁垒,无限扩大了经济可能性。

个人福祉:

Ø 应用 AI 提高人们的生活幸福感,更广泛地影响社会大众、家庭成员的情感和社交互动的模式。

Ø 百度助力打造一个更安全、更透明、更智能、更人性的“全实名社会”。

Ø 百度正在积极助建中国 大的诚信医疗服务平台为愿景,推动医疗广告行业“良币驱逐劣币”的机

制。

规则-法律效应:

Ø 百度参与和开发的一系列“风控”技术、产品和机制,是我们所处的“风险社会”的保险阀之一。

Ø 百度为智能时代制定与时俱进的“数据隐私治理框架”提供基础。从伦理、价值观、组织、制度、

流程,多角度构筑隐私保护实现数据合规。

Ø 主动设置社会议程,参与塑造互联网社会和人工智能社会的规则,为人工智能时代的法律法规、伦

理准则提供基础支持。

科技-文化效应:

Ø AI 赋能打破公众对人工智能和大数据的恐惧,普及 AI 文化,与社会力量共同建构 AI 伦理。

Ø 百度让公众有更多的机会成为信息和知识的主人,自己去发现和解释数据而不只是被动提供数据,

在数字社会中更好地“了解自己”。

Ø 百度参与塑造了新的去中心化、开放共享的科技力量、科技生态和科技文化。

Ø 百度集合全球数据,大大提高了中文在互联网世界的地位。

Ø 中国人可以用自己的母语找到自己想要的信息,提升了民族的文化自信。

Ø 百度的众多产品为存续与发展人类的知识、文化,保护地球生态提供了有效的手段。

社群-环境效应:

Ø 百度 AI 正在构建全新的身份体系,人们“身份认同”的方式将发生巨大变化,社会团结的方式将发

生变革。

Ø 给合作伙伴在“人工智能锦标赛”中装上新马达,积极参与社会治理合作,从机器、设施的智能化

到社会生活的智能化,推动智慧城市建设。

10

Ø 百度催生了一个新的社群和劳动力市场。培养了近 55 万名人工智能相关人才,相当于建立了 10 所

专门的人工智能大学。

Ø 百度地图通过技术手段实现绿色出行,开发特色地图回应社会痛点。

(三)结论

通过这些社会价值的展示,我们可以得出几个结论:

1.百度是一家“全面社会价值”公司。科技企业的社会价值大体可以分为两类,一是通过基础科技,

实现基础性社会价值;二是通过应用型科技,发挥应用性社会价值。百度两者皆备:既成为互联网

社会和智能社会的重要底层开发者之一,也回应社会痛点推出了众多有着重要社会价值的应用产品。

2.百度社会价值的初心一直没有改变。百度是“数据平权”的先锋,百度始终相信科技可以造福人类

社会,始终相信这种造福的方式应该通过赋能、开放、平等、创新来实现。

3.百度实现社会价值的方式越来越多样化,越来越主动。尤其当百度打通了数据、算法和算力之后,

可以更容易地实现“复合优势”。百度的很多产品之所以能有效回应社会关切,也是如此。百度也

越来越主动地参与社会议题,参与社会、治理、伦理规则的形成。

4.百度是一家“赋能型”科技公司。只有“能”的企业只是一家科技公司,只有迈开了“赋”的双腿,

“能”才能落地,才能成为一家科技价值与社会价值相得益彰的“赋能”企业。通过打通从“能”

到“赋”的各个环节,百度成为中心化(权威)和去中心化(创变)之间的一个会聚点和释放器,

经历从“集合数据”到“共享数据”的转变,从“开发智能”到“智能燎原”的迭代。

5.百度实现社会价值具有可持续的优势。百度不仅在过去 18 年里推出了众多可以直接观察和感知的

社会服务,而且通过数据、算力、算法相互之间的共同升级迭代,为未来中长期内可持续地带动社

会变迁、参与制定社会规则提供了动力。

6.百度的社会价值被低估了。百度在移动搜索时代的社会价值大多数已经为公众承认;百度在人工智

能时代的社会价值刚刚崭露头角,还没有被公众所熟知。·

11

四、数据:集合与平权的力量

原来我们说的是“让人们 平等便捷地获取信息,找到所求”;今天,我们觉得科技的发展实际上给

我们带来了更多的可能性,所以我们说要“用科技让复杂的世界更简单”。这就是百度人的新使命。

——李彦宏在 2017 年百度联盟峰会演讲

数据是滋养智能社会的土壤。我们在互联网上的一举一动,一言一行,鼠标的每一下点击,都会变成

数据,他们像矿石一样沉淀在互联网上。随着数据的增多,这个空间在不断的膨胀。

在互联网之初,人类对于数据价值的认识,就像 500 年前南美的原住民对于黄金的认识是一样的,极

少数认为数据有价值。数据的价值就像基因一样,一条数据一个基因,它的价值非常小。但是无数个基因

累积到一起,一个人全身的基因累计到一起,它的价值就是非常巨大的。

百度的数据有多大?百度拥有 EB 级别的超大数据存储和管理规模,数据处理达到 100GB/s 的毫秒级

响应速度,并达到 100PB/天的数据计算能力。目前百度搜索日均响应搜索次数 60 亿+次,相当于每个中

国人每日搜索 4.3 次,日均信息流推荐量达到 150 亿;地图每天响应 900 亿次定位服务请求。

百度数据的社会价值,至少有两面。A 面是,百度集合了海量的数据,创造了众多的社会价值。但只

有 A 面是不完整的。包括百度在内的互联网公司,很多时候免费搜集和使用了这些数据,创造了互联网时

代的“数据红利”。今天,包括百度在内的互联网公司,应该在分享这种红利、创造“智能红利”的道路

上迈出更大的步伐。百度在创立之初,就抱有“数据平权”的初心;百度在赋能、共享的道路上做出了值

得肯定的努力;越来越多的个人,成为数据的主体、更好地认识了自己、塑造了新的身份和阶层。百度和

用户“分享数权”,共同发展,这就是百度数据社会价值的 B 面。

经济责任:

1.打破“数据鸿沟”和“数字孤岛”,帮助社会各阶层平等地获取信息,节约信息获取成本,实现了

“数据平权”。

百度希望通过更优质的内容,更丰富的形式、更多元的载体,满足用户的搜索需求。百度的首条搜索

结果满足了超过 40%的搜索查询,百度 APP 9 月平均日活跃用户数量(DAU)达到 1.51 亿,好看视频的

日活跃用户量突破 1200 万2 。

实际上,这也正是为人们提供了平等获取信息的渠道。智能搜索面前,人人平等,没有特权信息,也

2 本报告百度相关的案例和数据均由百度提供

12

不会漏掉信息。“无论你是达官显贵、大学教授,还是边城小镇的农民,残障人士,通过百度,大家获取

信息的权利是平等的。搜索引擎出现之前,人们从未想过可以如此方便地获取信息。”李彦宏在获颁“2005

CCTV 中国年度经济人物”时的这一番话,今天读来依然可以成立。

2.百度打造平台改变了供需对接的方式,加速“数据红利”到“智能红利”的落地。从而助力中小企

业成长、增加就业岗位。

打破数字鸿沟和数字孤岛,除了个人,还助力了无数小微企业的成长和壮大。百度搜索推广凭借自身

海量流量,以及行业针对性强,入门门槛低,客户精准触达等优势,为各类中小企业获得更多优质客户、

实现商业目标提供了有益助力。

百度借助超过 70%的中国搜索引擎市场份额和近百万家联盟网站,打造了链接亿万网民和企业的供需

平台,让有需求的人 便捷地找到适合自己的产品和服务,也让企业用少量投入就可以获得大量潜在客户、

有效提升企业品牌影响力——用科技让营销更简单。

图表 1:2018 年 7 月中国搜索引擎市场份额3

百度正通过遍布全国的服务网络,为近百万家企业提供搜索营销服务,不仅涵盖农业、工业、服务业

三大产业,而且遍及全国 31 个省市。搜索引擎推广使用门槛低,对中小企业的销售拉动能力强。中国信

息通信研究院的相关研究结果表明,合作企业在百度搜索引擎在线推广服务中的投入产出比高达 1:434。

百度推广如何帮助本地小微企业?

3 StatCounter Global Stats – Search Engine Market Share 4 中国信息通信研究院政策与经济研究院《搜索引擎的社会和经济影响(2014)》

13

很多本地小微企业,如:上门开锁、鲜花店、钟表维修、售后服务等,他们本身的消费低频且小众,

但又不可或缺。只是因为竞争激烈,获客渠道有限,这些企业经营并不容易,百度推广在这时便有效地帮

助了他们。比如,由于开锁公司行业相对混乱,不明所以的老百姓经常轻信“小广告”开锁,低劣的服务

乃至生命财产危险,经常让正规开锁公司躺枪,这让宁波“甬创开锁”的老板刘新政焦虑不已,甚至已经

决定关店转行。而在接触到百度本地直通车之后,宣传迅速见到了成效,2017 年从 3 月 1 日到 6 月 28 日,

在 初仅仅投入 233 块钱的基础上,百度本地直通车就为甬创开锁带来了 174 个商家,平均只投入 1.3 元

就可以获得一个商机,帮助“甬创开锁”在经营上稳了脚跟,品牌效应逐渐打响,行业规范度逐渐提高。

我们还发现,百度搜索、信息流等传播模式能让信息流转速度和覆盖人群大幅提升,这些信息不仅包

括乡村农户的产品,也可以包括非物质文化遗产在内的传统文化。

百度推广如何帮助农民致富?

四川成都天府区有一个老农叫裴忠富,20 多年前就开始学习和研究农产品种植,带领全村乡亲一起种

枇杷,但早年销量一般,发展比较慢。后来百度跟他们接触上,经过针对性营销之道,从第二个季度到第

三个季度,成交量便上涨了 30%,同时还创办果业服务网站,为各地果农搭建便捷的果业交易平台,得到

了百度的官方认证,借助百度的力量,裴忠富的产品口碑平台逐渐传向了全国。现在他们优质水果除了销

往重庆、贵阳、昆明、北京等大中城市外,还远销越南、泰国等国际市场,村子里百万富翁诞生了一大堆,

裴忠富本人也被评为了 2015 年全国劳动模范。

规则和法律效应:

3.百度参与和开发的一系列基于海量数据的“风控”技术、产品和机制,是我们所处的“风险社会”

的保险阀之一。

如果我们能够意识到我们生活在一个危机重重的“风险社会”的话,也许就能更好地理解百度风控的

价值:对科学的自省正是抵御风险的内在要求。当我们在搜索框里搜索信息的时候,百度如何保护我们的

隐私?当我们在客厅里摆上一个百度智能音箱的时候,百度如何保护我们的隐私不被泄露?当我们的孩子

使用百度 APP 的时候,百度如何保证内容的健康纯净?

我们看到,百度在很多方面做了严格的风控管理。例如,百度内容安全中心已掌握三种“核心技术”

对抗各类违法有害信息。这包括了基础技术,即利用现有成熟的主动巡查、自主清理等通用管控手段处置

海量线上违法有害信息;“杀手锏”技术,百度借助千亿级数据优势建立针对文字、图片、视频等各类展

14

现形式的管控策略,确保全网信息拥有定制性、国家级的高强度网络保护;颠覆性技术,百度内容安全中

心已将语言识别处理、图像甄别能力、数据增量研究等多类 AI 安全技术运用至日常工作中。

图表 2:百度打击有害信息量(单位:亿条)

通过“三管齐下”,在 2018 年上半年对有害信息的自主巡查量达 145.2 亿余条(详见图表 3),其

中淫秽色情为重点打击对象,占比 47.21%,赌博类位居第二,占比 18.67%。

图表 3:2018 年上半年百度主动巡查——拦截有害信息分布情况

百度如何协助警方,识别和追踪网络空间犯罪?

2017 年 11 月,用户“萝莉”发帖称,自己的百度账号绑定了银行卡但是仍然被盗,盗号者还将账号

以一万元的价格公开售卖。对此,百度公司配合江苏警方抓获盗号、卖号嫌疑人 5 名,并深挖上游提供账

号信息的黑客团伙。

分析发现,将百度账号与密保手机号对应,是盗号成功的关键环节。黑产掌握手机号后,能够通过各

15

种渠道获得更多公民个人信息,进而实施针对个人的犯罪。

数据显示,不法分子利用账户找回短信验证规则,编写非法软件,对特定手机号段逐个进行账号找回,

获取手机号对应的账户名。收集“账户+密保手机号”组合后,再将数据批量卖给各种黑产团伙,用于盗

号卖号、网络人肉、敲诈勒索等犯罪活动。

此案中,百度和公安反复研讨, 终从信息本身的重要程度、需要结合的其他信息的程度、嫌疑人主

观目的三个方面综合评价,认定仅窃取“账号+密保手机号”属于刑法规定的“侵犯公民个人信息罪”,

在合理范围内拓宽了该罪名的内涵,推动了司法实践的进步。

4.百度从价值观、组织、制度、流程,多角度构筑隐私保护实现数据合规,为智能时代制定与时俱进

的数据治理框架提供基础。

数据包含了很大价值,另一方面在数据应用和存储过程中,也蕴含着很多和用户隐私相关的信息。为

了确保数据应用的透明度和安全性,为用户创造价值,更有效的控制数据安全和隐私风险,百度通过规定

价值观、大原则,清晰的方法论和组织要求形成了一套完备的数据治理框架。组织结构方面,百度建立了

自上而下的隐私保护体系, 顶层有数据隐私保护委员会,确保数据保护纳入公司战略。数据隐私保护委

员会在数据隐私方面坚持 3C 原则: Communication,以用户易读、易懂的方式向用户阐释收集、使用

其个人信息的目的、规则、范围等; Consent,要充分尊重用户,收集用户信息一定要取得用户的同意;

Control,要赋能用户,提升用户的参与度,在产品设计上增加隐私保护功能,给予用户对其个人信息利用

充分控制权。

在流程机制及技术上,法务、安全、技术、产品、交互等不同的角色根据职能承担不同的隐私保护的

任务。百度根据数据的敏感程度,对所有数据进行分级。在数据本身使用的场景上会经过法务和安全等方

面的严格审批。

可以这样说,百度的数据隐私保护工作为未来的人工智能社会建立什么样的数据治理框架提供了基础。

因为未来有很多新的场景,与用户过去对隐私的理解和感知不一样,百度也要做工作让用户一起认知这个

新时代,让用户放心。

科技-文化效应:

5.百度集合全球数据,大大提高了中文在互联网世界的地位。

百度的数据有多大?百度拥有 EB 级别的超大数据存储和管理规模,数据处理达到 100GB/s 的毫秒级

响应速度,并达到 100PB/天的数据计算能力。目前百度搜索日均响应搜索次数 60 亿+次,相当于每个中

16

国人每日搜索 4.3 次,日均信息流推荐量达到 150 亿;地图每天响应 900 亿次定位服务请求。在百度推出

的以百度推广、百度学术、百度搜索、百度地图等为代表的线上搜索产品中产生了宝贵的数据资源,这些

数据资源对社会的经济、法律、文化、教育等方面都产生了深刻影响。

作为全球 大中文搜索引擎,百度拥有 9.8 亿用户5。百度的数据资源大大提高了中文在互联网世界的

地位。百度收录了大量的中文内容,保存和传播了中文信息和中华文化。今天,中文在全球互联网上的比

例占的越来越高。中国人可以用自己的母语找到自己想要找的信息,这具有重大的社会意义,提升了民族

的文化信心。

6.百度让公众有更多的机会成为信息与知识的主人,自己去发现和解释数据而不是被动提供数据,在

知识社会中更好地认识自己。

百度旗下拥有百度百科、百度学术等知识平台,不但为公众提供海量的信息与知识,更重要的是为用

户创造更多与知识互动的机会。

百度百科是全球 大的中文网络百科全书平台,它集合了中国数量 多、规模 大的网民群体的集体

智慧,词条涵盖了几乎所有已知的知识领域。百度百科每日的被检索次数超过 4 亿次,相当于每天回应了

三分之一的中国人的提问。目前百度百科拥有超过 1580 万个词条,有 660 万人进行了超过 1.4 亿次编辑。

在这个过程中,用户不是在被动的接受权威的知识,而是和知识进行互动,可以有机会成为知识的主人,

在编辑过程中更好地认识自己,发现自己。

百度百科打造权威医学科普传播网络平台

在国家卫健委、科技部、中国科协、国家中医药管理局的指导下,百度百科打造权威医学科普传播网

络平台。400 余位临床专家参与共建,产出近 7 万条权威认证词条,内容涵盖西医疾病、症状、解剖、检

验、影像、中医病症、针灸穴位、中草药、汤剂丸剂等十余种细分垂类,日均阅读量高达 250 万次。

对于普通网友而言,很多专业的医疗信息生涩难懂,为了让更多网友看懂复杂的医学词条,百度百科

加入了科普文章、科普视频,让医疗词条更加“接地气儿”。比如在搜索“宫颈癌疫苗”这个词条时候,

就可以看到由同济大学医学院副教授安毛毛认证的词条,并提供《什么是宫颈癌疫苗》等多支科普视频,

让网友更容易明白疫苗的原理、种类等。

百度学术收录了包括知网、维普、万方、Elsevier、Springer、Wiley、NCBI 等的 120 多万个国内外

学术站点,索引了超过 12 亿学术资源页面,建设了包括学术期刊、会议论文、学位论文、专利、图书等

5 QuestMobile 中国移动互联网 2018 年秋季大报告

17

类型在内的 4 亿多篇学术文献,成为全球文献覆盖量 大的学术平台。在此基础上,构建了包含 400 多万

个中国学者主页,这些学者主页允许学者自己编辑,是互联网上 大的中文学者库。百度学术还为近 400

家高校图书馆输出百度大数据和人工智能技术,为其提供免费的图书馆个性化知识发现系统。

18

五、算力:从智能商业到智能社会的发展引擎

我们希望把移动互联网这个生态圈建的更加健康,我们希望搭出一个好的平台来,能够让越来越多有

产品梦想、有技术梦想的人能够做出一些改变世界的产品,比如我们做的云存储,各种各样新的应用可以

不用再去租服务器,我提供各种各样的环境,让开发者来开发他们想要做的东西。

——李彦宏 2013 年在极客公园创新大会的发言

人工智能技术近年来的发展不仅仰仗于大数据,更是计算机芯片算力不断增强的结果,因为深度学习

是极其消耗计算资源的,而通过云计算就可以以低成本获取大规模的算力。由于计算能力的大幅提高,使

得很多的人工智能变得更实际,更可用。人工智能时代,超大数据量处理需求、实时高强度计算都与云计

算紧密联系。未来,云计算就像现在的电能一样,成为人工智能时代 基础的能源和动力。这不仅是云计

算的根本价值,也是云计算对人类 大的贡献。

百度算力资源的使用,是两个逻辑的混合体:一面是“众智”,另一面是“释能”。“众智”是将算

力集中起来,这大大降低了使用算力的成本。由于建立超算设备的巨额投入与后期高额运营成本,降低算

力的门槛对 AI 发展具有重要的意义。“释能”是将百度的算力应用到各个领域。百度云作为云计算领域后

起之秀,凭借企业长期发展的技术积淀与庞大的数据储备,百度智能云打通商业到社会的各个环节,让“数

据价值链”畅通。

而百度遍布全国的数据中心承载数十万规模的服务器、网络设备,他们是超强算力的载体,提供着 AI

计算所需的大量计算能力。百度在国内建成华南、华东、华北 3 个超大规模数据中心群组,包括 30 多个

IDC、200 多个边缘节点,实现国内用户全面覆盖;百度拥有数十万台服务器,EB 级别存储能力,通过 Tbps

级别网络高速互联,每天处理数据量近 100PB,相当于 5000 个国家图书馆信息量的总和。

经济责任:

1.百度“众智”与“释能”并举的政策缩小“智能鸿沟”,降低 AI 技术门槛,为众多企业和产业提供

了在未来的人工智能时代可持续发展的基础。

在 AI 时代,“智能鸿沟”成为新的挑战。百度的答案是,通过数据、算力和算法的不断替代和不断开

放来填平这样的鸿沟,让每一个开发者能够接触到全球 先进的 AI 技术,让每一个公司、每一个企业都能

够很方便地使用这些 先进的 AI 能力。这就是百度 Everyone Can AI 的理念。某种意义上,百度的主要

责任正在由“连接信息”(让人们 平等便捷地获取信息,找到所求)转到“用科技让复杂的世界更简单”。

19

我们在后面的报告里将展现大量已经发生的场景。更重要的是,数据处理、发布和流通的方式正在发生根

本性的变革,而我们才刚刚开始意识到这一切的影响。

百度智能云以极低的使用成本和便捷的使用方式,使得企业、开发者可以轻松使用超强计算能力。目

前百度云计算在政务、金融、教育、生命科学等 11 个行业制定了解决方案,与社会共享百度云的超强算

力。

2.云计算高效配置资源,解放和提高了社会生产力。

共享算力使得算力资源变得容易获得,每个人都可以按需调用超强算力,极大的提高了资源的使用效

率。而解放出来的人力,可以去做更有价值的工作,这就是云计算的革命性力量。它不仅提高互联网时代

的社会生产力,还激发这个时代的人们去创新,为社会带来更多价值。

百度云如何让客服更加高效?

如何让企业对客户的服务更高效、更优质?百度云给出了“智能化”的答案。基于百度多年积累的 NLP

和语音技术,百度率先对自有金融业务客服中心开展了智能改造,将客服服务 1 年内单次服务成本下降 80%;

能够处理 97%的在线咨询,金融业务问题解决率达 90%以上;智能语音质检在多个关键服务项的覆盖率达

到 100%,保障了更好的服务体验。

除了赋能自有的业务,百度云也在运用 AI 技术努力赋能各行各业。在金融领域,百度云和南京银行共

同打造了智能文字客服机器人,取得了 70%+的机器人解决率;结合百度 DuerOS 平台,百度云联合招商

银行打造了音箱端的智能客服,业内首创,延伸了客户服务的渠道边界。

在运营商领域,百度云和联通集团共同在天津实现了全智能语音客服,用户问题首次解决率达到 92%。

用户在拨打 10010 后,只需用中文说出需求,就能由智能客服助理替代传统的按键,识别并理解用户的需

求,提供类似人工的“多问多答”等 235 项服务,覆盖话费查询、流量包办理、故障报修、积分、国际业

务等 8 大类型 186 个标准化服务功能,帮助客服业务节省了 20%左右的人工通话时长。

3.百度的科技创新,更加高效的算力,不但把人从危险、低效的工作中解放了出来,还催生新的高科

技职业。

人工智能会不会取代人类?有些人认为这是杞人忧天;有些人忧心忡忡,甚至认为“智神”可能 终

主导人类,就像今天的“智人”曾经消灭了自己的近亲一样。回答这个重大问题不是我们在这里的任务,

我们也没有答案。

今年 9 月,普华永道发布的报告预计,未来 20 年,人工智能和机器人、无人机及自动驾驶汽车等相

20

关技术,将使中国就业净增长约 12%,相当于额外增加约 9000 万个就业岗位6。国际货币基金组织(IMF)

总裁拉加德与百度 CEO 李彦宏在 2018 年 9 月的一次对谈可以给我们一些启示。根据 IMF 的一项研究显

示,人工智能等技术未来可能将取代 2600 万就业机会,其中女性的利益在就业市场上将会受到相对严重

的损害。李彦宏的回应是,科技发展是一个长期的过程,比方说,我们距离自动驾驶技术取代司机的那一

天还很遥远;同时,在这个过程中,新的就业机会将会诞生,人类将更多地充当管理者的角色,机器只是

辅助人类做出决定,李彦宏相信人们 终将从中受益。

图表 4: 人工智能影响下的全球工作岗位变化

关于科技进步与就业的关系,工程师们喜欢举马车和火车的例子:火车的出现虽然消灭了马车夫行业,

但诞生了新的工种。那么,能不能举一个例子说明人工智能会催生新的就业机会呢?人工智能会催生很多

新的“高科技”的工作不难举例,但普通劳动者怎么办?在这里,我们发现了“百度众包”的独特案例。

百度众包如何创造新的就业?

百度 AI 能力的实现,离不了整个生态链的发展,百度超强算力的发挥,更需要标注清晰的海量数据作

为支撑。百度不仅拥有国内领先的数据标注平台(http://zhongbao.baidu.com/),更运营着国内 大的

线上数据标注用户群体。今年为了支持山西企业人工智能改造,促进产业升级,解决大学生就业问题,百

度在山西落地建成了人工智能基础数据产业项目,该项目建立了从普通标注团队到专业标注企业的分级数

据标注产业集群,打造人工智能时代数据标注产业高地,形成了新的业务发展形态,从而带动山西省人工

智能产业的发展,促进就业机会。百度数据众包预计在未来 3-5 年内实现全国 10%标注产业聚集山西,实

6 普华永道《人工智能和相关技术将对中国就业市场产生什么净影响?》

21

现销售收入 50 亿元,带动 5 万人就业和百亿级相关产业转型、升级。

当然,“数据标注”也许终究只是一个过渡性的行业。百度的技术带来了哪些更为长远的影响呢?至

少可以确定的是,一些极端环境、危险环境下的工作,尤其是在极端环境中的监测工作,如高压线、石油、

钢铁炼制行业的检测工作,过去只能由人来进行,现在可以由集成了算法的 AI 模块代替,从而避免对人产

生伤害。

社群-环境效应:

4.给合作伙伴在“人工智能锦标赛”中装上新马达,积极参与社会治理合作,从机器、设施的智能化

到社会生活的智能化,推动智慧城市建设,AI 让城市环境和生活变得更好。

越来越多的地方政府意识到了人工智能的重要性,人工智能的规划不断涌现,一场“人工智能的锦标

赛”正在出现。对于城市的管理者来说,智慧城市建设需要找到战略性的合作伙伴。百度就是这样的一个

为社会治理提供新动能的伙伴。

百度抓住了当前智慧城市的突破口——从政务运营开始做起。除了无人驾驶这样的产品,百度目前有

很多成熟的产品被用于社会治理。通过人工智能、物联网、大数据、云计算破解社会服务的发展瓶颈,创

新社会治理手段,百度正在给我们展示众多值得期待的项目。

百度 AI 城市签约上海 建设“ 智能”大上海

百度一直也在不遗余力地用 AI 助力城市建设。百度正式发布 AI 城市“ACE 王牌计划”,上海是率先

落地的城市之一。百度将通过在人工智能、大数据、云计算等领域的优势,特别是在自动驾驶、智能交通

领域的技术与实践经验,推进人工智能等核心科技与上海市实体经济的融合,共同推进上海智能城市建设,

将上海打造成真正 AI 化的全球智能城市新标杆,并以上海为龙头,进一步促进长三角地区产业经济、社会

治理、公共服务等方面实现更高质量的一体化发展。

双方将主要在四个方面加强合作:

首先,发挥百度在技术、人才、产品等方面的优势,依托上海作为全国中心城市和全球科技创新中心

的优势,在沪建设百度(上海)创新中心,助推上海打造国家人工智能产业高地。

其次,充分发挥百度在大数据、云计算、人工智能、区块链等领域的技术优势与实践经验,特别是智

能交通、自动驾驶领域的优势,参加上海智能城市建设,助推上海提升城市管理和公共服务能力。

第三,提升百度上海公司在市场开拓、业务发展、研发创新等领域的能级,带动长三角地区云计算、

22

大数据、人工智能产业发展,助推实现更高质量的长三角一体化。

后,加快建设百度物联网总部,打造本市重点区域物联网感知平台,积极推动“百度工业大脑”落

户上海,助力沪企上云和工业智能化升级。

百度云推动宁波智能城市建设之路

为推进“智能城市”在宁波的进一步落地,宁波市鄞州区启动智慧城管二期建设项目。基于百度云在

视频处理分析、图像识别以及大数据等方面的技术能力,对屡禁不止的城市顽疾进行分类检测识别,分而

治之。

通过双方构建的智慧城管系统,能够对店外经营、违章停车、暴露垃圾、无证游商、积存垃圾渣土、

乱堆物堆料、沿街挂晒等 7 种违章行为进行自动识别,在第一时间捕获违章行为,确定事发地点和责任主

体。目前,各违章行为的识别准确率已达 90%,并做到结合业务系统对违章行为进行多次警告。该套系统

中还具有百度自迭代功能,赋予智慧城市管理系统持续进化的能力。

借助百度云 ABC 技术赋能,宁波的城市管理从被动化、分散性升级为主动化、集中化管理,实现精准

管理和执法。同时,百度云以点带面,构建智慧生态,拓展智慧城市版图,其智能化城市管理系统在未来

将大放异彩。

图表 5:2017 年主要城市年人均拥堵成本 TOP107

5.智能云为节能环保提供了有力的技术方案

百度遍布全国的数据中心承载数十万规模的服务器、网络设备,他们是超强算力的载体。百度首个自

建超大型数据中心——百度云计算(阳泉)中心是百度 AI 的一个重要底座,8 个模组满载可容纳 16 万台

7 2018.1 Baidu《2017 年 Q4&年度中国城市研究报告》

23

服务器,已经承载了百度的搜索、地图、网盘、人工智能、智能云、自动驾驶等技术。

百度 GPU 集群针对大数据、人工智能等场景设计,广泛应用于语音、图像、搜索、无人车、加速计

算等业务,百度率先采用引入深度学习和异构计算集群,成为百度大脑的动力引擎。

PUE(Power Usage Effectiveness,电源使用效率)是全球普遍认可的衡量数据中心基础设施能效的重

要指标。阳泉数据中心 2016 年就创造领先全国的年均 PUE1.20。通过持续创新调优,2017 年单模组年均

PUE 值 1.10,达到国际一流水平,稳居国内第一并远超国内新建数据中心平均值 1.73,比全国平均基础

设施能效提升高达 84%。

绿色是百度阳泉数据中心的另一个标签。百度云计算(阳泉)中心秉承“数据中心是一个整体,节能

从源头开始”的绿色数据中心运营理念,以节能降耗为目标,积极技术创新,持续运营调优,实现从硬件、

电气、动力系统等多方位节能减排,并创造多项国际及国内第一的记录。

百度阳泉数据中心充分利用了模组屋顶剩余空间,安装太阳能电池板,光伏发电即发即用。此外,数

据中心还采用了污水回收再利用技术,数据中心既是耗电大户,也是耗水大户,百度将排污进行收集,应

用超滤和反渗透技术,除去水中的氯钠钙镁等离子。污水回收系统全部投产以后,每年的回收能达到 48

万吨水的量,相当于四千户家庭一年的用水量。

24

六、算法:技术迭代满足社会需求

今天我们全面展示了百度大脑各种各样的能力,在我自己和百度同学的想象范围内,这些能力能做的

事情已经很多了,但是更让我兴奋的是如果这些能力赋予到全社会的每个人,它能够变换出来无穷无尽的

可能性。所以,百度大脑会把语音、图像、自然语言理解和用户画像等能力完全开放出来,并且在大多数

情况下这些能力会是免费提供的。有了这样的能力,有了开放共享,将给各行各业的人群带来过去大家做

不到的、不敢想的能力。我在这里也邀请每个人重新想象你所在的行业,重新想象中国经济,重新想象世

界的未来。

——李彦宏在 2016 年百度世界的演讲

有人把算法简单地解释为解决问题的方法、步骤。还有人更通俗地比喻,算法就是做菜的流程、方法。

此前,任何一个基于算法的社会场景应用都要经历一个基础算法模块开发的过程,过于强调底层技术、过

于“硬核”的开发流程,不利于 AI 等技术在更广泛的社会场景发挥社会效应。这就像每个人做菜,需要放

多少原材料,需要多大火候,都需要自己进行摸索、尝试。

百度首先做的是算法资产的集成化,它带来的是某些成熟算法的基础化,即作为 基本的模块加以运

用,这在减少重复劳动的同时,也对技术壁垒形成了冲击。也就是说,现在做菜的流程已经归纳、总结成

了菜谱,任何人只要参照特定的配料,特定的流程去做,都能做出固定的菜品。

菜谱形成之后,如何被广泛推广、使用?下一步,就是通过致力于创造新的去中心化,开放、共享的

科技知识和科技文化,形成去中心化的知识传播机制,以及开放的 AI 生态,降低技术传播的门槛。百度的

Apollo 平台、百度大脑,实际都采取了开源的方式。这种开源、赋能的后果,就是降低了企业进入人工智

能行业的门槛,企业不再需要“重新发明轮子”。开放的算法模型弱化了技术的资本特征,强调了技术的

开放价值。另一方面,也彻底改变以往封闭的知识体系,可以使得算法资产渗透到经济社会毛细血管中。

目前百度已经从 AI 能力建设的阶段,进入了 AI 能力输出的阶段。

经济责任:

1.算法资产的应用形成新的经济增长点,创造新的就业岗位,形成新的劳动关系。

算法技术的不断突破,将劳动者从重复、低效、繁重的工作中解放出来。从经济模式上而言,将人力

资源从低附加值的重复劳动中解放出来,本身就是一种更尊重人的价值、更可持续的经济模式的形成。

25

PaddlePaddle 助力制造产业

小零件制造是制造产业的重要构成部分,由于其规模大,数量多,质检分拣环节一直是小零件制造产

业的关键。但质检工作的培训时间长、员工流动性大导致了企业在这方面的成本一直居高不下。

北京领邦智能装备股份公司,是一家专注于机器视觉类人工智能技术研究的高新技术企业,开发了零

件智能分选机器人,应用于工业生产线上零件的高速智能分选,利用人工智能的视觉技术把瑕疵零件快速

精准的挑选出来。

为了增强机器的深度学习能力,北京领邦引入了百度的开源深度学习框架 PaddlePaddle,通过深度

学习技术让零件智能分拣,在识别精度和人类工人持平的情况下,可以有更高的速度和稳定性,实现精密

零件外观检测方向上的机器替代人工。

现在北京领邦公司的智能零件分选机器人在零件外观检测方面已经能达到甚至超过人眼的精度,一台

零件智能分选机器人能达到 10 个工人的工作效率,对于使用企业来说,1 年即可收回成本。仅从机器减少

人工成本这个角度进行经济测算,就可使工厂生产成本平均降低 15%,效益提升 15%。由于机器检验水平

稳定,大大提高了产品的交付质量,交付投诉率平均降低了 30%,综合生产力水平平均提高了 30%。

算法技术将完善已有的商业模式。AI 可以为已有的商业模式的完善与升级解决限制性的障碍。AI 生成

算法可以一定程度上突破线上营销的实物体验限制,扩展营销能力;语音识别算法可以改变产品与用户互

动的方式,提升用户体验;语音分析算法为定制化开展客户服务提供了可能,等等。算法技术的输出突破

了商业模式发展和完善的技术限制。

算法资产输出促进新业态的形成。一方面是新的产业链。算法技术的发展将创造上下游产业的工作岗

位和就业机会,形成以数据采集业务为核心的产业、系统性地提供 AI 解决方案的产业等等,这些新兴产业

创造了丰富的就业岗位,也促进了新的产业链形成。另一方面是业态升级,如百度、新石器、车和家三者

就无人驾驶微型物流配送车达成合作意向。百度提供自动驾驶软件、算法,车和家提供车辆硬件平台,新

石器做集成以及产品落地和运营,全方位提升物流配送能力。

26

图表 6:百度 Apollo 平台生态合作伙伴数量增长情况

2.百度的 AI 赋能战略打破了 AI 壁垒,无限扩大经济可能性。

百度 终要创造的是一个开放、共享的商业生态,在相当长的一段时期内,技术能力发展的不平等造

成了商业模式发展的不对等,掌握了某项技术能力的企业依靠对某项技术的垄断,可以在一段时间内建立

起优势。然而这都将随着百度算法资产的入局在一段时间后不复存在。

在 AI 开放平台的 AI 市场上,技术是平等、可交换和共享的。由于 AI 技术开发完成后的低边际成本特

征,AI 平台已经实现了 大程度的免费,并且以非常低的单位成本提供着 AI 能力的输出。实质上,百度

成为了一个提供工具的“大仓库”,所有企业都可以从这个仓库中以极低的成本获取好用的工具,从而消

除因技术不对等造成的商业发展不对等,这有利于形成更加良性的商业竞争模式。

图表 7:百度 AI 开放平台开放能力数量增长情况

开源的 PaddlePaddle 让 AI 想法快速落地

PaddlePaddle 是百度提供的开源深度学习框架,它能够让开发者和企业安全、快速地实现自己的 AI

想法。

27

它为 AI 开发者提供了基于 Python 语言的学习框架、资料和工具,降低了开发者的学习时间和学习成

本。在 PaddlePaddle 的帮助下,深度学习模型设计师只需关注模型的高层结构,而无需担心任何琐碎的

底层算法的技术问题。比如生鲜产品业,受限于生鲜产品保质期极短的特点,商家需要丰富进货经验,才

能降低货物过期报损率。在这一过程中会造成大量的物品损耗和资源浪费,以及导致商业经营的困难。而

使用 PaddlePaddle 综合商超生鲜的历史销售数据,借助 DNN 神经网络建立销量预测模型,就可以预测

出有效的进货量。经过试点实验计算,每年为连锁商超节约百万报损。

未来,程序员可以快速应用深度学习模型来解决物流、医疗、金融等实际问题,让人工智能发挥出

大作用。已经有越来越多的企业和开发者调用了相关算法能力,并在 PaddlePaddle 开源社区交流创意。

个人福祉:

3.随着百度算法技术的不断突破和能力的不断输出,技术会更广泛地影响社会大众、家庭成员的情感

和社交互动的模式,提高幸福感。

也许在一些数据主义者看来,人类体验也只是一套算法。但目前为止,许多人仍然认为意义和情感是

机器不能取代的。可是另一方面,机器确实可以帮助人们沟通情感。尤其是改变情感和社交互动模式,满

足了不同个体实现有效互动的需求。这种技术不仅可以帮助特殊群体(比如身体障碍者)实现正常社会交

往和互动,更重要的是,戳中了当今典型的中国式家庭的痛点:缺失的爸爸、焦虑的妈妈、失控的孩子和

守望的老人。

通过对家庭场景的理解,通过人工智能技术的加持,百度的“小度在家”,能够拉近家庭中亲人的距

离,让亲人们有更多的互动和沟通,提升生活品质。这背后的技术,就是百度开发的对话式人工智能系统

DuerOS,就像安卓优化了人与屏幕之间的交互一样,DuerOS 将优化人们与设备之间的沟通。手机、电

视、冰箱等任何设备,都可以搭载 DuerOS,变成一个能“听懂”的设备。这个“听懂”的基础,其实依

托于百度强大的搜索、数据及智能交互技术,度秘可以在对话中清晰的理解用户的多种需求,进而在广泛

索引真实世界的服务和信息的基础上,为用户提供各种优质服务。百度 DuerOS 的开放赋能之路早已开启。

DuerOS 已与华为,VIVO,OPPO,创维,索尼等知名企业达成合作,已在智能家居、智能穿戴和车载等

多个场景,为用户带来“动口不动手”的智能生活体验。

28

图表 8:DuerOS 合作伙伴数量增长情况

小度在家的儿童模式

我们尤其感兴趣的是度秘的应用在人群细分场景上的价值。百度发现儿童家庭是语音智能设备的主力

人群,以儿童为核心,用户有大量的需求需要被满足。百度提供儿童友好的交互形式,搜集到了非常多的

儿童语音数据,开发了儿童语音识别引擎,定制儿童语音播报音色及对话逻辑,使得儿童进行语音交互的

门槛变得越来越低,能够越来越顺畅地跟设备交流。度秘希望陪伴儿童一起成长,在守住儿童信息安全底

线的同时,针对儿童不同年龄阶段,智能化提供适合他这一阶段能够接受并理解的信息内容。比如当 4 岁

和 8 岁儿童搜索“苹果的英文”时,我们会提供不同的信息呈现形式以满足他们的需求。儿童成长教育是

我们关注的,我们成立了儿童成长联盟,旨在引入各领域教育专家的力量,满足儿童不同阶段的教育需求,

用定时熏教、行为引导等多种产品形式帮助家长寓教于乐,儿童快乐成长。同时,我们帮助家长一同营造

适合儿童成长的安全空间,并且赋予家长一定控制能力,如时长控制、距离提醒、防沉迷等。

后续,度秘还会针对不同人群,开发例如老人模式等,不但内容上为特定人群定制,而且操作上也更

贴近此人群的使用习惯。

4.算法迭代让搜索更智能,不但呈现一个既个性化又全面的世界,还在引导我们看待这个世界的方式。

信息流已经成为用户获取信息的主要方式之一。百度 Feed 流背后的算法优化,可以让我们从源头就

获得更加优质的信息,让自己既“专心”,看到自己想看的;又“广博”,不至于带着偏见去看这个世界,

即“在避免信息单一化的前提下进行个性化推荐”。尤其是在当前舆论热点问题信息传播不均衡、不全面

的严峻情况下,这种算法资产能够有利于在维持信息质量的底线基础上,使社会大众更全面地接受信息,

29

形成开放的舆论氛围。

一方面,如何让用户从驳杂的信息流中快速定位到适合自己兴趣和阅读倾向的内容?百度所应用的

Feed 算法提供了答案。根据用户的点击、阅读、停留、退出情况,推荐给用户更符合阅读习惯的内容。这

构成了百度内容推荐的核心,基于 Feed 的算法,百度 App 呈现给用户信息的“瀑布”,以期用户获得优

质的阅读体验。用户减少了信息筛选和搜寻的时间成本,还可以有多种途径减少自己没有兴趣的推荐内容,

以获得更好的阅读体验。

另一方面,百度 Feed 算法破除“茧房”,展现无偏信息。“信息茧房(Information Cocoons)”

是指人们的信息领域会习惯性地被自己的兴趣所引,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的

现象。主要体现为信息获取来源单一、观点片面等。Feed 算法本身基于用户浏览行为推荐信息内容,在逻

辑上由于用户阅读习惯推荐权重过大,极易加重“信息茧房”现象。而百度通过对推荐算法的优化,对一

些社会性、带有强烈观点色彩的信息,自动推荐与其对立的、全面的观点,以防阅读者陷入“信息茧房”,

将局部当成全貌,将片面当成全面。

除了让我们既精准,又全面地看待这个世界。信息流还在通过价值观调教算法,引导我们看待这个世

界的方式。百度信息流建立了 50 多页的准入文档,会为每一个推送的百家号内容进行 0-3 打分,对信息

的质量进行严格把关。另外,一支近百人的由主编带领的编辑团队,会和权威的政府、媒体合作(例如和

人民日报的合作),会对 Feed 流进行人工干预,确保具有社会价值的内容得到重点推送。

5.以建立中国最大的诚信医疗服务平台为愿景,推动医疗广告行业“良币驱逐劣币”的机制。

百度与医疗行业的关系,一直是一个痛点。在 2016 年的魏则西事件将百度推上舆论的风口浪尖之后,

百度开始反思医疗推广中存在的问题并不断调整策略。

为了让诚信的优质广告更好地服务大众,百度逐步在进行一系列整改措施。百度计划建立中国 大的

诚信医疗服务平台,推动医疗广告行业形成“良币驱逐劣币”的机制:

(1) 截至 2018 年 11 月,百度已经对 6.9 万个公立医疗机构名称(包括公立医院和三甲医院的全称及简称

等)进行了保护,优先显示其官网且不出现商业广告; 终将完成对全国公立医疗机构的保护。

(2) 截至 2018 年 11 月,百度已完成对国家禁推的 11 类疾病(艾滋病、癌症、癫痫、乙型肝炎、白癜风

等)本体及 260 万+变体(如:白癜风/白点风)的重点保护;未来将持续对这 11 类禁推疾病检索词

的本体及变体进行精准全面保护。百度也对高危风险疾病(如黑色素瘤、尿毒症、败血症等 168 种疾

病)以及这些疾病名称+症状/病因等的组合检索词(如:抑郁症病因)都进行了保护,检索结果不出

现广告,日均保护 1700 万+。

30

百度也正在寻找一条技术赋能医疗发展的路子。基于数据的深度学习算法又赋予了 AI 模型快速满足社

会基本要求的能力。比如,在医疗资源、尤其是基层医疗资源的不平衡问题上,基层医疗困境的解决需要

大量的标准化人才投入,这些人才往往饱和式集中在经济发达地区。广大的基层地区医疗资源不足,AI 产

品随着技术的突破,能够缓解基层医疗资源的压力。

百度灵医

2018 年 11 月,百度推出百度灵医品牌,百度灵医品牌基于百度的顶尖 AI 技术,以“循证 AI 赋能基

层医疗”为目标,推出了一系列的 AI 医疗产品阵列。如 AI 眼底筛查一体机结合 AI 技术与眼底相机,无须

联网,能够快速检出眼底病,在没有医生的偏远山区帮助更多的风险人群进行眼底疾病筛查;临床辅助决

策支持系统,通过学习顶级三甲医院医生的诊疗逻辑,构造 AI 系统,把这套 AI 系统带到基层,帮助基层

医生降低误诊漏诊率,提升诊疗水平。“百度灵医”会以赋能基层医疗为目标,立志把更优质的医疗服务

带到医疗资源匮乏的基层,普惠更多的基层患者。

规则-法律效应:

6.积极参与设置社会议程,参与塑造互联网社会和人工智能社会的规则,为人工智能时代的法律法规、伦

理准则提供基础支持。

技术进步一直是法律体系完善的重要动力。当前,一方面,人工智能技术的突飞猛进;另一方面,我

们的法律和监管体系相对滞后,一些由人工智能引发和可能引发的法律问题尚未得到解答。数据、算力、

算法技术的不断突破,会加速暴露现有法律体系空白,促进某些法律体系的变迁;而人脸识别、声音识别

等算法的进步,又会反过来为完善现有的或制定新的规则和法律提供技术支持。比如,人脸识别、声音识

别、行为数据分析等算法,能够有力地防止诈骗等犯罪行为;图像算法,为反对网络色情、暴力、恐怖内

容提供了技术支持;动态视频分析等算法则在地区安防方面大有可为。算法的突破真正为法律的贯彻和执

行提供了保障,进一步促进更公平、公正社会的形成。

目前,百度正在参与塑造人工智能新规则,已经推动北京、深圳、海南、雄安等地多部相关法律、法

规的建设。

无人驾驶将如何改变我们的法律?

2017 年 7 月 20 日,国务院印发《新一代人工智能发展规划》。这是继《中国制造 2025》后,智能

网联汽车领域又一项重大顶层设计,也被认为将有力助推中国自动驾驶的发展。但无人驾驶系统若要在社

31

会中进行广泛推广和应用,还需要在法律法规领域做出更多的完善,包括确立智能联网汽车的自动驾驶分

级,分类管理;尽快制定无人驾驶汽车上路测试申报许可制度,尤其是进入开放路段测试;对于无人驾驶

汽车事故认责问题的判定;对于无人驾驶汽车保险制度、个人隐私保护制度及交通肇事罪的更新。高新科

技发展迅速,前瞻性立法易对法律的严肃性、稳定性造成挑战。这也是无人驾驶汽车多个方向立法面临的

问题。

科技-文化效应:

7.百度 AI 赋能打破公众对人工智能和大数据的恐惧,普及 AI 文化,奠基 AI 文明。

百度的 AI 能力输出,不仅有着对企业(To B)的后果,而且对个人(To C)的影响可能更为重要。未

来以是否能够掌握 AI 技术、享受 AI 红利为界,社会群体可能会被分化为“AI 阶层”和“非 AI 阶层”。 AI

阶层作为精英群体,很有可能忽视非 AI 阶层的权利和利益,社会不平等可能会进一步扩大。除了财富分配

的变化,AI 技术的差距也可能加剧社会中不同群体之间的差距,进一步放大教育水平和经济社会发展水平

的不平等。甚至会对现代性以来的人类社会的基本运作模式构成挑战。但通过包括企业在内的力量有意识

的努力,可以尽力消减这种差距带来的负面影响的范围、缩短负面影响的时间。百度的 Everyone Can AI

的理念正是打破公众对人工智能的恐惧,普及 AI 文化,奠基 AI 文明。

科技走进生活 全球首个 AI 公园面向公众开放

身边的万物都可以陪你聊天,跑步运动后刷脸就可以看到自己的运动数据,就算没带钱包和手机也可

以轻松刷脸购物……这不是电影情节也不只是我们的想象, 近,海淀公园附近的居民就已经享受到了这些。

2018 年 2 月,百度与海淀区政府签订《建设海淀区“城市大脑”合作备忘录》,将在科技城市建设

等方面做出有益探索。双方以海淀公园作为试点,根据人民群众的需求和人工智能技术的实际情况,对海

淀公园进行 AI 改造,让 AI 成为海淀公园的 DNA,让人民群众共享改革开放科技发展成果,让科技惠民成

为海淀新名片。目前,海淀公园的 AI 改造已经完成,智能步道、智能亭、未来空间等智能设施已面向公众

开放运行,而全球首款量产的 L4 级别无人驾驶巴士阿波龙也在不久的将来与公众见面。

AI 公园的推出是百度 AI 赋能、让文化历史氛围厚重的海淀公园焕发新生机、让科技真正用之于民的

标杆案例。

加快 AI 产业落地也是缩小 AI 鸿沟的重要手段。提供透明和便于理解的人工智能产品,事实上正在努

力缩小这种间隔;尤其是对少数群体、特殊群体,算法的突破将对各类障碍人群的生活带来非常重要的改

32

变,其社会价值更加重大。

百度小明帮助弱势群体享受 AI 红利

百度“小明”Dulight 是 2015 年推出的一款基于图像识别算法、人脸识别算法、语音识别算法的软硬

件结合的系统,旨在辅助视觉障碍者获取必要信息。一方面,可穿戴的图像输入设备结合百度大脑的驱动,

可将视觉障碍者第一视角的视觉信息图像识别转化为语音信息,给用户以必要提示;另一方面,基于语音

和人像识别算法,Dulight 可以根据用户需求执行功能,通过有效的人机互动来为用户与现实世界的互动

提供一架“人工智能桥梁”。

社群-环境效应:

8.百度催生了一个新的社群和劳动力市场。培养了近 55 万名人工智能相关人才,相当于建立了 10 所

专门的人工智能大学。

百度 AI 赋能是一个加速器,百度大脑、百度 DuerOS、百度 Apollo 三大开放平台主要提供四方面的

支持:顶尖导师定制课程、技术资源支持、百度的直接投资、定制化的产业资源。通过师资培训、高管教

育系列课程、公开课、企业培训、研讨会、大赛培训、技术沙龙等多种项目形式落地,在行业内形成了开

放、共享的行业氛围,促进了人工智能技术的发展。目前,百度已经培养了 55 万人工智能相关人才,相

当于已经建立了 10 所专门的人工智能大学。

百度如何培养 AI 人才?

未来对精通 AI 技术的人才需求将会大幅增加。为了满足这个人才的缺口,百度的“燎原计划”拟在

2018 年为百度招揽 500 多家生态合作伙伴,培养超过 5000 名人工智能人才,遴选 60 多家创业公司进入

AI 加速器,并投资其中的优秀者。即培训和赋能开发者,提供先进的 AI 生产工具,投资优秀项目,加速

优秀项目的孵化。

今年 7 月 4 日百度 AI 开发者大会上,百度携手优达学城面向全球推出首个 Apollo 自动驾驶线上课程;

同时,在这个暑假百度 Apollo 联合国内高等学府北京大学开设自动驾驶系列课程,也是国内首个落地高

校并含学分的自动驾驶课程。目前“Hello Apollo”自动驾驶公开课已走进企业和城市开展面向多行业不

同人群的宣讲及专业培训,旨在从源头破解行业发展人才瓶颈,帮助推动中国无人驾驶技术走向“全民时代”。

9.百度 AI 正在构建全新的身份体系,人们“身份认同”的方式将发生巨大变化,社会团结的方式将发

33

生变革。

人脸识别是一种基于生物特征的身份识别,现在已经被广泛应用到各种社会场景,尤其是警务安全、

城市治理之中。但更重要的是,以人脸识别为代表的 AI 技术,也加快我们建构了一套全新的身份体系。我

们过去判断自己身份,形成自己身份认同的方式将发生巨大变化,传统的肖像权、身份识别将被赋予新的

含义,“谁是我们的同类”这样的问题将持续困扰人类。面对越来越丰富的身份和身份认同,社会团结的

方式将发生变革。

不过对身份识别的智能化确实在帮助我们解决一些棘手的社会创伤。百度寻人就是很好的一个例子:

百度寻人,照亮回家的路

百度 AI 寻人项目旨在将人脸识别技术赋能专业权威机构,通过失踪者照片与寻亲者提供照片的比对筛

选,辅助社会各类寻亲工作。2017 年,百度 AI 寻人项目与宝贝回家、民政部全国救助寻亲网开展合作,

运用人脸识别技术帮助无数的家庭收获团圆,失踪 8 个月的张军宏于 2017 年 4 月与家人团聚,失踪 1 年

的朱诚市于 2017 年 10 月与家人团聚,失踪 3 年的赵刚于 2017 年 12 月于家人团聚,失踪 4 年的杨归来

于 2017 年 12 月与家人团聚,失踪 24 年的王启凤于 2018 年 4 月与家人团聚……2018 年 10 月,百度 AI

寻人项目与民政部深化合作,将人脸识别技术全面用于全国 2000 家救助站的流浪乞讨人员的服务与管理。

百度寻亲平台数据库已经整合了四万多的走失人口信息。

一个个鲜活的案例离不开百度人脸识别技术的发展与成熟。百度人脸识别技术准确率可达 99.7%,曾

在 2015 年国际评测 FDDB 与 LFW 中均斩获第一名,被《麻省理工科技评论》评选为 2017 十大突破技术

之一。相信在百度 AI 的帮助下,每个人的回家之路不再难找。

34

七、百度 CEO 的社会价值观

2016 年,百度正式发布了百度大脑。百度大脑经过三年的演进,内容越来越丰富,同时也越来越从底

层技术向实用、应用发展。从 底层的深度学习框架,到上层相对比较通用的语音识别技术、视觉技术、

自然语言理解技术等,再到各种开源和开放的平台,百度大脑可以说是百度所有人工智能 全的集合。

我们好奇的是,是否可以给百度的 CEO 李彦宏的“大脑”画一个像?百度至今成立了 18 年,李彦宏

所思所想的百度到底展现了什么样的面貌?尤其是,能不能从中看到百度在技术的社会应用方面的一些线

索?

我们根据李彦宏在 2005 年至 2018 年 270 篇演讲、采访、发言,通过时代划分、语句提取、汉语分

词、词频统计,挖掘了百度在搜索引擎时代(2005 年-2011 年,共 118 篇)、移动互联网时代(2012 年

-2014 年,共 48 篇)以及 AI 时代(2015 年-2018 年,共 108 篇)的关键词,用简单易懂的方式,展现

百度 18 年来的发展轨迹与时代特点。

2005-2011 搜索引擎时代 2012-2014 移动互联网时代 2015-2018 AI 时代

我们发现了什么呢?

第一,随着时代的发展,百度的关注重点已经从“搜索引擎”逐步转至“人工智能”。在搜索引擎时

代,“搜索引擎”一词总共出现了惊人的 1014 次,位于词频统计的第 5 位,而在移动互联网时代和 AI

时代,该词分别只出现了 82 次和 31 次,可见李彦宏的重心已经转移。伴随“搜索引擎”一同代表这个时

代的,还有“广告”,“排名”等词,分别出现了 340 次和 190 次。但是,这些词也只是这个特定时代的

缩影,在此之后的出现频率都已降至 30 次和 5 次左右。到了移动互联网时代,“移动”一词成为主角,

其出现频率从原先的 30 次大幅增长到了 137 次,位于词频统计的第 10 位。在这一时期,人工智能的概念

也逐渐浮现,例如“云”出现了 44 次(53 位),“人工智能”出现了 27 次(99 位)。这一时期也是百

度迎接人工智能时代到来的重要战略布局阶段,百度大脑、云战略、阳泉大数据平台,一系列关键性事件

35

为百度在人工智能时代的再次崛起奠定坚实基础。到了当今 AI 时代,“人工智能”出现频率陡增至 458

次,位于词频统计的第 4 位。同时,很多具有时代特征的关键词频频出现。如“数据”(153 次,19 位),

“识别”(152 次,20 位),“驾驶”(129 次,27 位),“语音”(112 次,31 位),“机器学习”

(77 次,57 位),“大脑”(66 次,68 位),“度秘”(40 次,116 位)等,这些都成为了人工智能

时代百度的代名词。

第二,李彦宏对 AI 的兴奋点不仅有经济,还有社会;而且越来越直面“就业”这个最为棘手的社会挑

战。人工智能的兴起带来的是行业的大变革,“汽车”(88 次,46 位),“医疗”(65 次,70 位),

“金融”(61 次,73 位)以及“视频”(57 次,83 位)等词汇在这一时期的演讲中频频出现。可以说,

人工智能赋能产业已经成为了这个时代的重要标志。伴随产业升级的,还有其对于社会的影响。例如,“就

业”一词就从原来两个时代加总不到 10 次增长到当今的 35 次,这不光体现人工智能时代的产业升级对于

就业的深层次影响。而且说明在李彦宏的意识里,“就业”是他始终直面的问题。比如,2018 年 9 月,

针对国际货币基金组织(IMF)总裁拉加德提出的人工智能可能带来的负面影响,李彦宏回应道,科技发

展是一个长期的过程,比方说,我们距离自动驾驶技术取代司机的那一天还很遥远;同时,在这个过程中,

新的就业机会将会诞生,人类将更多地充当管理者的角色,机器只是辅助人类做出决定,李彦宏相信人们

终将从中受益。

第三,虽然时代一直在变,但是对于“通过技术创新回应社会需求”的初心一直没变。百度具有超强

的科技基因,同时,技术创新也一直是推动百度前进的基础。三个时代中,“技术”、“能力”、“创新”

一直保持着很高的出现比例。其中,“技术”分别出现 908 次,244 次和 530 次,位居词频统计的第 6

位,第 4 位和第 1 位。“能力”分别出现 187 次,92 次和 213 次,位居词频统计的第 57 位,第 20 位和

第 8 位。“创新”分别出现 136 次,109 次和 171 次,位居词频统计的第 103 位,第 19 位和第 15 位。

长期以来,百度也一直从用户的需求出发,将自身的发展同市场紧密结合。例如“中国”、“市场”、

“用户”等词也一直位居词频统计的前三十位。“服务”,“社会”等关键词一直保持较高的出现频率。

其中,“服务”一词分别出现 329 次,49 次和 82 次,位居词频统计的 28 位,48 位和 50 位;“社会”

一词分别出现 165 次,48 次和 80 次,位居词频统计的 74 位,49 位和 53 位。百度在关注自身企业发展

的同时,也积极关心社会整体的发展,通过提供技术、资金等方式来支持企业的创新,助力社会的生产。

例如,“合作”一词分别出现 122 次,35 次和 107 次,位居词频统计的 118 位,77 位和 34 位,呈现出

大幅的增长;“平台”一词分别出现 191 次,40 次和 86 次,位居词频统计的 55 位,64 位和 48 位;“创

业”一词分别出现 221 次,40 次和 52 次,位居词频统计 49 位,66 位和 91 位。

第四,百度是一家互联网公司,但也十分重视文化建设,尤其是在新技术不断出现的过程之中,让技

36

术与文化建设相融合也是推动社会进步的重要力量。在三个时代的演讲之中,“文化”一词分别出现了 197

次,45 次和 134 次,位居词频统计的第 54 位,第 51 位和第 25 位;“开放”一词分别出现 73 次,29

次和 73 次,位居词频统计的第 198 位,94 位和 60 位。可见,百度对于文化建设的关注一直在不断增加。

可以说,在各个时代,百度都在积极地让技术成为社会的一种文化符号,让技术与社会更好地结合,更好

地服务于社会的发展。

37

附:李彦宏在 2005 到 2018 年演讲关键词词频统计

2005-2011 2012-2014 2015-2018 2005-2018

排名 词语 频次 词语 频次 词语 频次 词语 频次

1 公司 2056 互联网 471 技术 530 公司 2697

2 中国 1509 公司 355 中国 498 中国 2316

3 市场 1284 中国 309 互联网 477 互联网 2093

4 互联网 1145 技术 244 人工智能 458 技术 1682

5 搜索引擎 1014 问题 186 公司 286 市场 1645

6 技术 908 市场 185 问题 281 问题 1349

7 搜索 903 美国 168 新 222 搜索 1157

8 问题 882 企业 153 能力 213 用户 1152

9 用户 881 发展 147 发展 211 搜索引擎 1127

10 美国 801 移动 137 知道 191 美国 1125

11 知道 686 用户 129 领域 188 知道 1003

12 信息 632 产业 129 企业 183 发展 955

13 发展 597 搜索 126 市场 176 信息 823

14 时间 582 知道 126 时代 173 时间 817

15 价 532 新 121 创新 171 开始 783

16 开始 531 信息 120 美国 156 企业 772

17 百度 528 产品 116 机会 156 新 770

18 产品 526 机会 114 时间 153 产品 730

19 钱 522 创新 109 数据 153 百度 726

20 日本 486 能力 92 识别 152 钱 685

21 企业 436 开始 89 希望 145 价 644

22 新 427 百度 87 学习 145 机会 596

23 需求 425 钱 86 用户 142 产业 570

24 上市 421 领域 85 产业 142 需求 527

25 媒体 345 变化 84 文化 134 领域 520

26 广告 340 时间 82 喜欢 129 工作 505

27 过程 335 搜索引擎 82 驾驶 129 希望 501

28 服务 329 数据 81 搜索 128 日本 496

29 机会 326 手机 80 工作 128 能力 492

30 成长 318 改变 75 车 126 人工智能 489

31 工作 315 应用 73 语音 112 上市 473

32 产业 299 行业 70 百度 111 过程 469

33 研究 293 希望 68 计算机 109 服务 460

34 希望 288 喜欢 66 合作 107 喜欢 452

35 世界 278 优秀 63 科学 106 变化 416

36 中文 276 工作 62 手机 103 创新 416

37 发现 272 竞争 62 变化 102 成长 413

38 喜欢 257 过程 60 解决 99 媒体 411

39 模式 252 发现 59 行业 98 世界 405

38

2005-2011 2012-2014 2015-2018 2005-2018

排名 词语 频次 词语 频次 词语 频次 词语 频次

40 客户 249 人才 57 移动 94 发现 405

41 领域 247 计算 56 影响 94 广告 394

42 选择 243 环境 55 世界 93 找 390

43 网站 239 传统 53 语言 93 数据 384

44 成功 235 商业 52 应用 89 文化 376

45 变化 230 价 52 改变 88 研究 364

46 商业 226 模式 51 汽车 88 影响 346

47 学 225 学习 49 产品 88 模式 342

48 检索 225 服务 49 平台 86 时代 331

49 创业 221 社会 48 智能 84 应用 329

50 影响 209 想法 46 服务 82 学 327

51 大学 204 文化 45 理解 81 中文 325

52 竞争 202 员工 45 经济 80 竞争 324

53 管理 202 云 44 社会 80 成功 317

54 文化 197 时代 44 政府 79 平台 317

55 平台 191 上市 43 自然 79 解决 315

56 排名 190 影响 43 钱 77 创业 313

57 能力 187 效率 43 机器学习 77 选择 311

58 简单 185 需求 42 过程 74 学习 309

59 内容 184 成功 42 发现 74 商业 302

60 兴趣 183 工程师 42 开放 73 大学 302

61 关注 180 解决 41 增长 73 计算机 300

62 环境 177 理解 41 人类 73 网站 294

63 角度 177 金融 41 生活 72 社会 293

64 学校 176 平台 40 信息 71 环境 287

65 解决 175 找 40 全球 68 行业 275

66 原因 173 创业 40 学 68 客户 274

67 股票 171 计算机 40 成长 68 简单 272

68 结果 171 思维 40 大脑 66 全球 270

69 容易 168 全球 39 内容 65 内容 269

70 决定 167 容易 39 医疗 65 关注 269