AI

【转发】百万年薪的人才泡沫?关于程序员向AI转型的事儿,这几位老司机是这么说的

Millions of annual salary of the talent bubble? On the programmer to AI transformation of things, these old drivers are so to say

Posted by 石头人m on July 28, 2017

口述 :蒋涛、孟岩

来源: AI100社区

img

陆奇说,这个时代终将是技术驱动的。作为程序猿们,也该考虑考虑怎么转型AI的事儿了。但是,AI时代真的是一场泡沫吗?转型AI,机会和问题又在哪里?

AI时代的开发者,面对的究竟是百万年薪,还是虚假繁荣?首先,你得了解这个AI时代到底有什么特点,机会在哪里,以及最大的需求是什么,以及如果转型,会遇到的问题和技术实操。

7月15日,在AI100社区的沙龙上,极客帮创始合伙人 & CSDN创始人蒋涛,以及CSDN副总裁孟岩,跟现场众多程序员们聊了聊开发者转型和AI时代的那些事儿。而这,或许对每个开发者而言,都值得借鉴和思考。黑智现摘录如下。

01

蒋涛:AI时代,B端比C端更有机会**

img

这几年我也在做投资,从一个比较宏观的角度给大家讲一下,就是说为什么人工智能这么重要。

上上周,百度开了一个开发者大会,叫Create大会,是由史以来中国最像开发者大会的开发者大会。

为什么像开发者大会?

因为有很多大会打着开发者大会的名义,其实都是在推销自己的东西,并没有真正提供给开发者实际的资源。

第二个也没有建立所谓的开发者生态,因为我们开发者生态都是建立在国外的公司的基础上。

百度这场会含义还是非常深的,也是陆奇去作为百度的二号人物,第一次大的亮相,他讲了一句话:未来属于创作者,AI的未来属于开发者,开发者成功才是百度真正的成功,这句话有一定的逻辑关系,我后面给大家解读一下,为什么开发者变得这么的重要,然后AI为什么成为百度的一个重要的基石。

PC时代回顾

首先让我们来回顾一下历史。

历史上,最大的开发者大会是微软1992年开的,为什么?

因为这是PC时代,PC时代最核心的是入口就是操作系统,或者是Windows的桌面,它是建立在X86因特尔的芯片技术上。围绕着这个,我们才有了PC时代,也诞生了开发者的时代。

他们为开发者做了什么东西?

img

在PC时代,我们看最大的一个公司,出现了几类:

一个是行业,公司百亿级别,如IBM,Oracle,SAP,他们为企业提供信息化的软件和工具,包括数据库、ERP,还有做外包,因为各个行业都需要信息化。

另外一个就是C端的业务,服务个人。在个人市场只产生了两类大的公司:

一类是做游戏的,暴雪公司,EA,这是PC游戏行业,也是非常大的一个产业。

还有一类是工具厂商,如图像工具Adobe。

移动互联网时代

接着我们迎来了移动互联网时代,大家都开始找入口,一开始是门户,后来发现不是门户。

img

比如,一开始最厉害的是新浪,三大门户,还有网易。

后来随着时间的发展,发现最重要的入口是搜索引擎。谷歌和百度等掌握了绝大部分流量的分发权。

电商也是很大一块入口。比如淘宝,58同城,大家一般都直接去到淘宝,而不是用百度搜索,因此不会被百度卡了脖子。

这是整个PC互联网的发展,这时候我们开发者在做什么呢?

他们在建立各种各样的网站,但是你的网站呢,很重要一点是要服务这些C端的用户。

第二个,可能要做好跟搜索引擎之间的关联。

这是PC互联网,到了移动互联网,才是一个开发者大显身手的时候。

到了移动互联网时候,入口变成了APPSTORE,就是说你做一个应用,原来是关健词搜索,现在是你的应用名字比较重要,你的应用名字能不能在用户之间建立它的认知。

img

微信作为一个巨大的入口,对开发者没起什么作用,倒是对内容起到一个巨大的作用,不少内容生产者立足微信做创业。

因为PC互联网跟人的连接还是比较远一点,而手机是随身携带的,因此移动支付发展起来。

跟生活比较贴近的,如做天气的APP,也发展得很好,因为它跟生活连在一起,就可以接入更多的服务。

现在APP已极大丰富,APPSTORE上有150万个APP,你现在需要分走用户的注意力比较难了,基本上能做的都被大家做了一遍。

第二个用户没有增长了,获得新用户的成本越来越高。

这是整个APP移动互联网时代。

AI时代

今天什么百度要提出这么一个战略?

因为百度发现,它在移动互联网的时候抓瞎了,因为它不是入口,入口变成APPSTORE、变成微信,变成小米手机,手机成为一个入口,还有应用宝商店,腾讯开了个应用宝,百度买了个91也不是很成功,所以在移动互联网上,百度就Miss掉。

Miss掉以后,O2O战略也不是很成功,这次他们下了很大的决心要做AI的OS,做AI的生态。

img

那AI的OS是什么呢?

以后所有的东西都要和互联网连接。摄像机可以连网,摄像机带人脸识别。摄像机识别以后,怎么跟你互动呢?

百度提了一个口号叫唤醒万物,你说Hello索尼摄像机,它就知道是在叫它。这个大概三年内就会发生,这就是说,语音会作为一个入口。

有了入口以后,后面是什么?

你把它唤醒了,它得和你进行交互,它得有算法在背后,而这个算法是要靠大量的硬件驱动。

百度认为,未来的每个行业,每个硬件都可能变智能,而智能化一定要有一个核心的OS来驱动它,所以这就是一个是入口。

但是现在这个生态刚刚开始,机会在哪里呢?

第一个你要做C端的应用,还是很有挑战的,因为现在做人工智能的应用,要有数据,没有数据你的算法就没有办法做出精确度。

那么数据在哪?

数据都在BAT手上,他们有大量的数据,有一大堆C端的公司,他们每天都产生大量的数据,饿了吗,滴滴,摩拜等。有了信息,他就能判断你的意图。

比如,现在亚马逊在美国就能根据你过去的购买记录,预测你会喜欢什么样的书,于是它会提前把书送到你家。你回家就能看到5本新书,想看就留下,不想看就退。

所以在C端,实际上我们的机会就不是很大了,因为这些公司手上的数据太大了。其实在B端,AI时代产业B端布局会比移动互联网更大。

AI时代,B端机会更大

为什么这么说B端机会更大呢?

我来详细解释一下。

移动互联网大量解决的是C端的问题,而B端有很多问题没有解决,B端也面临巨大的变革,他们做了第一步的信息化,但是他们没有把业务进行重构,但是人工智能来了以后,会有一个非常大重构的机会。

这其中最大的重构就是无人驾驶汽车,这是一个上万亿美金的市场,围绕着它配套的产业,光售后就有八千亿,如果汽车都变成无人驾驶了,现有的很多服务都会瓦解。

所以我们看到有很多大的公司在这里面下重注。

这是从投资角度看到的一个非常大的机会。

深度学习可以做什么

那从整个产业的角度,人工智能为什么现在变得这么热?

当然第一个原因是阿法狗在去年打败了李世石。

实际上,真正历史性的转折点在2012年。

在2012年Imagenet比赛中,深度学习的使用,将识别错误率大大降低,引起了人们的关注。

也就是说,原来人工智能技术被一道墙堵住了,过不去,进步很小,但是采用深度学习后,这个墙相当于被凿开了一个窟窿。下图中紫色代表采用深度学习,蓝色代表传统方式,可以看出其中的跨越式的变化。

img

如下图,计算机采用深度学习可以做到精确的识别,把这张图描述出来。

img

我们常说代码时代结束了,其实它指的不是所有代码,而是原来我们是用各种各样的规则和技术,现在可以用深度学习,用神经网络来建立模型,用以取代原来人工设立的规则。

img

这是很大的一个不同,而且这个技术不是说只是用在识别领域,它可以用在非常多,以及看起来很小的领域。

这是Google发布的数据源,展示出自己内部哪些项目用到了深度学习。

img

从2012年开始,他们就开始用,一开始几个项目,到2015年Q3已经有1200个项目使用深度学习。到2016年,已经有2700个。目前Google内部的所有项目,80%以上都用到了深度学习来改进。

比较小的地方,大家意想不到的地方,比如做缩略图的时候作,同比例放缩就看不清楚人了,所以用深度学习技术来改进。

img

如上图,图片里有人头,当你同比例缩小的时候,就有点看不清了,不方便浏览。于是,我就可以用深度学习来识别头像,以此在缩放的时候,做一个调整,让人像看起来吐出一些方便查找。

还有做压缩,利用这个技术,还可以再压缩30%,因为机器会学习,知道哪里更重要,压缩的时候主要内容保持质量,其他次要内容进一步压缩。

img

现在我们已经进入到新应用时代。

img

图片上这个人是深度学习的网红,原来在Open  AI,刚刚跳槽到特斯拉做无人驾驶的首席科学家。

img

他曾经拿托尔斯泰的作品来做一个学习,用机器去模拟,程序只有几百行,但就能让机器创造出来作品,虽然还达不到托尔斯泰的水平。

很多行业,都面临着这个巨大的挑战。

围棋行业已经被颠覆了,后面还有律师、金融,包括程序员,美国已经有不只一家公司做自动化编程,取代程序员的一部分工作。

img

上图是调用了Google的API做识别,这个人是斯坦福机器人研究室的一个博士,花一百美金左右买了这些设备,就做出来原来需要花50万美金的东西。这说明什么,说明智能应用时代是真的来临了。

img

这是来自YC的分析图。从上图可以看出,学术界的突破在2012年,从2014年起进入创业高峰期,2017年进入爆发期。

AI现在被我们捧得非常热,但是要很好地解决我们实际面临的困难和问题,达到大家期望,还需要经历一个过程,我们把它分三个阶段。

AI发展的三个阶段

img

目前还是算法红利期。现在大家都下重注去挖算法的优秀人才,年薪开到上千万美金,这是一个优秀算法掌舵的时代。

学术界的进步对我们非常重要,因为论文的一个突破就可能带来技术上应用上的一个大突破,一个快速发展期。

不过这个阶段很快会稳定下来,变成局部很小的改进,不再是大的突破。

这之后是工程技术期,会在2到3年后到来,这个时期就可以真正去做出各行各业的应用,而且对这些行业会产生比较大的价值。

img

再后面才是平台,谁拥有最多的数据,谁就拥有最大的商业资源,谁就更强大。

我记得我很早时,跟微软谈事的时候,他们内部就说过,我们公司没有10亿美金以上收入的项目,都不会列入我们的计划。

但是无人驾驶他们是可以杀进去的,这是一百亿一千亿的市场,但是我们可以在很多行业都找到这样的机会往里去切入,但是等到这个市场变得非常巨大的时候,你不一定打得过平台,或者你要先把这个平台要做的事做好,才有空间。

现在AI是同样的情况,我们可以调用谁呢?

Google是在这个领域做得最好,百度是目前最大,我把他们做了个对比,开放的能力大家可以去看一下,包括百度推的语音唤醒,Google现在还没有。视频内容比较分析,就是一个视频封面,我刚才讲,你怎么去选视频里面的哪一帧,作为你封面的展示页,百度也把它公布出来了,这些都是他们很大的积累了。

所以呢,这些技术的丰富,包括框架的成熟,就像安卓1.0时代,2.0时代,也不太成熟,我大概是3.0参加了Google  IO大会,那时候才有了点气象,也不是像现在这样,安卓一定会胜利,大概是在4.0的时候会确定。

02

孟岩:人工智能的泡沫与啤酒

img

著名财经作家吴晓波最近发表了一篇文章,《为什么新科技的风口总火不过一年》,在文章中引用了Garner技术发展曲线,他认为人工智能目前处在第一波峰的顶点,那么很显然,马上就会面临泡沫的崩溃。如果他的判断是正确的,那么这将是第三次人工智能的泡沫破灭。

人工智能产业有没有泡沫?

作为财经作家,吴晓波非常的博学,而且也特别的聪明,他能够很快的从一个现象当中抓住足以引爆舆论的点。但从专业角度分析的话,这个判断有问点题。从这幅图上来看,无人机、机器人和物联网已经开始爬坡了。

img

那问题来了,如果无人机、机器人和物联网即将迈上迅速成长的阶梯,你怎么可能想象人工智能会崩溃呢?因为无人机,机器人本身就是人工智能的应用平台,而物联网则是大数据的最大来源,会有力的推动人工智能的发展。大家要理解,在无人机、机器人、物联网这样的技术浪潮当中,人工智能将扮演很重要的角色。

所以我直接说我的观点,人工智能目前没有泡沫。

具体的分析一下。

第一,本轮人工智能技术的红利还没有吃完。今天人工智能的热潮,是技术上主要是深度学习的突破引发的。深度学习理论上的突破是2006年,所以大家会问一个问题,11年过去了,深度学习的红利是不是已经吃完了?

img

我们来看,这张图是吴恩达在一本书叫 Machine Learning Yearn的书里面一幅著名的插图,纵坐标是算法的表现,横坐标数据量。从这个图中你可以看到,对于大规模的神经网络来说,数据量越大,它的性能就会越高,也可以说它的能力越强。

我问过在这方面非常顶尖的专家,目前有没有看到顶点?他告诉我说,他们有人已经做到上万层的深度神经网络,还是没有看到这个顶点在哪里。深度学习它的红利是很厚的,目前还远远没有吃完。这是第一点。

img

第二件事情,最近DeepMind公布了两分钟的Video,他们利用深度增强学习,教会虚拟空间的木偶走路、跳跃、跨越,甚至在漂浮的木条上保持平衡和跳跃。

这些木偶并不知道什么叫走路,仅仅是给它目标,给他激励,他就自己学会了走路,自己学会了跨越障碍物,甚至可能在一些复杂情况下比人的表现要好得多。这充分展现了深度学习的潜力。

所以我们不需要看每天 arXiv 上那么多的论文,就从这些新闻事件上来看,都可以得出结论,这一代技术的红利还远远没有被吃光。

另外,我们不能光看技术,还要看这个产业。

img

这个是来自麦肯锡的一个报告,2013年到2016年里面,AI这个领域获得的外部投资增加了3倍,2016年的总规模达到了260亿到390亿美金之多。投资的效应是累积的,这些投资将会对 AI 的发展产生很大的拉动。

img

一个重点的行业是自动驾驶。同样来自麦肯锡的报告,预测从2015年到2010年,自动驾驶和半自动驾驶车辆的数量将从100万上升到1000万台。汽车这是一个几万亿美元的产业,单单只要考虑这一个产业的转型,对于 AI 就足以产生巨大的牵引力。

所以我完全不担心这次 AI 的泡沫会崩溃。

今天的 AI 整体是什么水平呢?如果你反推,从现实需求出发来对 AI 提要求,你会发现,它有很多事情确实做不到。但是如果你正推,从AI今天已经具备的能力出发,来看看我们能够解决什么问题,你会发现,在今天的AI的能力范围之内,已经可以解决很多问题,可以激发很多行业的变革。

所以如果你们认为AI有泡沫,我告诉你,泡沫只会来的更凶猛,这是第一个问题,AI是不是有泡沫?我的回答很明确,AI没有泡沫。

人工智能人才薪资虚高吗?

第二个问题,人工智能的人才薪资是不是虚高。PingWest 最近发表了一篇文章,作者花了很大的功夫去做调研,写出来一篇强文,题目是《百万年薪的人的泡沫与人工智能的虚假繁荣》。文章写得很棒,我读了好几遍,也推荐所有人都去看。

这个文章的核心意思,是说现在很多 AI 的人才在市场上拿到高薪,但是却没有为企业赚到钱。有些挂着高级学术头衔的人,跑到企业里先拿个高薪爽几年,然后可能拍拍屁股就回学术圈了。

我们怎么看待这个问题。

首先,AI 和数据科学人才的高薪是个全球现象,他们现在就是在享受薪资溢价,这个是事实。我接触的很多 AI 界的人也是这么看。

我们看一下美国的情况。

img

在美国,AI、机器人,机器学习与数据科学人才薪资水平目前快速增长中。你如果是程序员,你的薪资平均水平是九万一千美金,不过图中代表众数(mode)的那根柱子靠左,说明更多的人是略低于这个水平的。

这说明少数的超高薪的程序员把多数低工资的程序员给平均了。而算法工程师,尤其是数据科学家,他们整体收入水平很高,均值十三万美元,而且图中代表众数的那个柱字偏右,说明超过这个收入的人群在他们整个这个人群当中也是多数。

在招聘网站上,把 AI 方面人才的广告挂出去,5天时间招不到人,显著高于其他职业。意味着什么?供不应求。这个是美国的情况。

img

英国是全球人工智能的另一个中心。从2014年开始,英国的AI人才需求迅速的直线的上升,就是需求量迅速的上扬。

img

然后看印度,他们对程序员和机器学习专家的收入做了一个对比。结果呢,机器学习专家的收入不仅始终高于开发者,而且差距还越拉越大。

我们再从另外一个侧面来看一下,我们知道这个AI开发者使用的主力语言主要是Python。

img

这是从2005年到2016年,这三个语言薪资水平之间的一个对比,排在上面的是遥遥领先的是Java,它在整个企业应用,电子商务开发的地位,很难被撼动,目前它的薪资是排名第一的。

排名第二名的是世界上最好的语言,PHP,这个语言跟Java一直是并驾齐驱,保持不是很大的一个差距,但是到2014年,15年之后,出现了一个死亡交叉,Python语言在收入上开始超过PHP,我相信Python开发者的薪资水平超过是Java是迟早的事情,在最近两三年之内就会发生。

img

中国会怎样呢?大家看这幅图,也来自麦肯锡,在世界地图上蓝色越深的地方,当前劳动力当中可以被机器和人工智能取代的比例越高。

墨西哥、玻利维亚、秘鲁这些国家,它整个自动化程度很低,所以有大量的手工工作都是可以被机器所取代的,他们是深蓝色。然后呢,像美国、加拿大、澳洲这样的国家,他们的自动化程度很高,所以他能够被机器所取代的工作的比例并不是特别高,所以是浅色的。

你看我们中国呢,是比较深的,是49%到51%,就是在我们中国的话,AI和自动化取代人力是非常有潜力的。所以呢,我认为在未来的相当长的时间里面,中国的做AI的这帮人,都将参与到一场劳动力替代当中,而且是占据优势地位的一方,享受高薪是必然的。

但是刚才那篇文章里所说的薪资泡沫也很确凿,因为我们看到呢,很多的企业,现在花了很多的钱去雇了一些一流的博士硕士,但是 AI 这个产业的规模还没有起来,这些高薪基本上是靠投资人撑着,这合理不合理?

img

我认为事情的本质是人才结构的问题。这张图是我和蒋总讨论了很久以后我们列出来,其实一个成熟的,在未来5年以后真正赚到很多钱的人工智能企业,它的人才结构应该是这个样子的,应该是AI专家学者,机器学习的博士们,资深专家比较多;然后呢,应该有一大堆AI的机器学习工程师,AI的产品经理、架构师在这里。

更重要的底下有大批的开发者,数据工程师,运维人员,行业人员,这是一个合理的结构。

img

但是实际情况,目前市场上独立的人工智能初创企业,普遍严重缺乏优秀的产品、工程和运维人才。有些公司非常得意的宣传说,你看我的团队里,一流名校博士占百分之多少,比 Google、Facebook、微软高多了。

但其实这样的构成恰恰有问题,这种团队的工程化、产品化能力会成为瓶颈,从而制约他们赚钱的能力。很简单,用户只会为产品和服务买单,不会为论文、算法和你们的学位买单。正是这样的反差,让一部分人觉得这里头有泡沫。

img

那么怎么办呢?我主张不要着急,把这个事情交给市场。投资者不傻,他们很清楚,现在我们处在算法红利期,算法领域还不断的有突破,所以我们先把懂算法的人找来,花钱养着他,先把论文看懂,先突破,往前突破。

但是算法红利期还有个两三年可能就要结束了。这不是说算法不会有进步了,还是会有很大的进步,但是呢,从算法的突破,到工具化,这个转化路径现在变得很顺畅,两三年之后会更顺畅。

如果你有一个算法突破,发表论文出来,很短的时间内,几个月,甚至几周内,Github 上会有实现出来,甚至你可能会看到百度、谷歌把新的算法放在自己的开放API里面,这就意味着,企业竞争主要拼的就是工程能力和产品能力了。到那个时候,整个 AI 产业里的薪资水平会有更合理的分布。

我说一下我的结论。所谓的人才泡沫问题,只是一个暂时性的现象,是发展的一个必然过程,不需要担心。

数据科学向左,人工智能向右

我再说第三个问题,选择方向的问题。

我们现在叫广义 AI,其实里面大致包含两个工作性质差别挺大的方向。一个是商业分析与优化,一个是智能产品与解决方案。

两者主要的不同是谁来做决策,人做决策还是算法做决策,这个决定了自动化程度的高低。

img

商业分析与优化技术的应用的周期当中,人仍然在里面扮演很重要的角色,数据分析是用来辅助人类决策的,自动化水平受到人的决策的制约,不会太高。

另外一个方向叫做智能产品和解决方案,自动驾驶、扫地机器人、自动广告投放系统,都是这类。整个产品的执行过程基本上是完整的,很少需要有人干预,决策主要由机器来完成,自动化程度接近 100%。

大家很快会面临方向上的选择,你是走左分支,还是走右分支,这件事情你们要好好的想一想。左边这一支走下去,你可能会成为数据分析师、数据科学家、CDO。右边这一支走下去,你应该会成为 AI 工程师、AI 产品经理,CTO。

走左分支,你的关键是获得高质量的业务数据。在中国,这个事情难度很大。

img

这个是最近的一个全球数据开放度调查,美国排名第8,中国排名第93。如果你们想走左分支,尽可能加入到一些具有数据访问特权的机构,否则想在中国想低价拿到别人的数据是很难的。

那么怎样选择行业呢?麦肯锡给了六个原则,

第一,数字化高度成熟;

第二,业务规模巨大;

第三能够把AI用在自己的核心业务里边,而不是一些边缘业务;

第四,它能够同时的去接纳多项科技,不仅仅是AI,可能还有区块链,还有物联网,还有其他的科技,都能够去接纳;

第五,它更加注重增量,而不是存量;

第六,领导对AI的应用有强有力的支持。

选择方向的时候,用这六把尺子来量一量,就会有一个大致的判断。这是麦肯锡的一个行业分析,排在第一名的,叫做高科技和电信,就是它各个领域里面绿的比较多,如果你们在这个领域做AI比较容易。

今天大部分在互联网领域里,你们可能在这个领域里面做AI比较容易,因为数据也比较全,各方面的支持也比较到位,人的意识到位。

随后分别是汽车和生产线、金融、电力、娱乐传媒、零售等行业。我们现在很多人都在谈医疗的大数据,医疗的AI化,但是其实呢,这个行业的准备度是不足的,做这个方向,要克服很大的难度。

其他的行业不一一解释了,谢谢大家。

img

原文链接