威胁还是利好?
“进化的代价就是——失控。”《失控》作者凯文·凯利的这句话,令人联想到影片《黑客帝国》中人类沦为人工智能附庸的故事。
随着AlphaGo战胜人类,AI、深度学习越来越被普通民众所熟知。一方面,AI技术催生了新的产业;另一方面,AI威胁论也不断升温。那么,AI真的会像科幻故事那样威胁到人类吗?AI技术和AI产业本身要克服哪些瓶颈才能达到人们理想中的智能?AI技术的应用会带来哪些法律、伦理方面的挑战呢?
AI只有3岁?
“虽然深度学习很火,但AI还达不到3岁小孩的水平。”在人工智能领域15年之久的北京科技大学计算机科学与技术系副主任殷绪成对《经济》记者表示。普通老百姓所熟知的深度学习其实只是一种技术、工具。但由于近期发展的效果好,成了人工智能、机器学习的代名词。但它并不是人工智能、机器学习的全部。
“目前关于人工智能评判标准尚无定论。”中国电子信息产业发展研究院软件产业研究所副所长潘文告诉《经济》记者,中科图灵世纪CEO刘锋等人希望通过建立数学模型来判断人工智能系统所属的分类等级。
刘锋曾撰文将人工智能分为6个等级。第0级、第1级不能与人类交互。第2级能够与人类测试者进行交互。第3级系统程序或数据可升级,如家用电脑、手机。第4级是通过网络与其他智能系统共享信息和知识,如谷歌大脑、百度大脑。第5级的特征是能够创新创造。
“第5级的AI相当于人类哪个年龄段?是3岁、10岁、15岁,还是100岁?这需要一个科学化的认识。”潘文说。
“我们把某些东西看成是智能的,主要在它尚未实现时。”北京邮电大学智能科学与网络工程系主任王小捷对《经济》记者表示,就像AlphaGo下棋,现在倒不觉它智能了。
还有一个例子,聊天机器人微软小冰对1920年后519位中国现代诗人的上千首诗进行迭代学习。今年5月,微软从其创作的7万余首诗中精选出139首,并出版了《阳光失了玻璃窗》的诗集。微软此前宣称小冰具备了创作能力。那么,小冰的创作是相当于人类哪个年龄段的创作水平呢?关于这一点,我们不得而知。
目前大部分人工智能不是像人一样拥有智能。人工智能最核心的问题是,它如何像人一样学习。关键是,人类还没搞清楚自身的学习机理,包括脑机理,都是人工智能要发展的问题。
深度学习仍属于监督学习。金山云大数据和AI技术总监张东进指出,最大的难点在于如何实现无监督学习,即人不需要告诉机器怎么做,AI可以通过自己学习然后决策。但未来50-100年可能都不会实现强人工智能的技术突破和大规模应用。
“人工智能威胁论是非常遥远的事情,至少我是看不到这一天的。”15年前就开始研究AI的殷绪成直率地说。
人工智能 AlphaGo 战胜李世石
伦理挑战是“黑盒”?
“核能可以用来发电,但用它发动战争就会受到约束。AI技术本身是中性的,关键看它如何应用。”殷绪成耐人寻味地说。
“国内一直从经济效益的角度来审视AI产业,但其他国家已经开始上升到另一个境界——关注AI带来的道德、伦理问题。国内应该抓紧对这类议题的思考。”香港中文大学工程学院副院长黄锦辉告诉记者,目前对AI的教育同样重要,即如何让大众了解AI只是一个很好的工具而已,也要教育大众它还存在很多未知的危险。
2016年3月,微软在Twitter平台上推出了一个人工智能聊天机器人Tay。结果上线还不到一天,Tay就“堕落”成了一个满口纳粹言论的种族主义者。
“目前,机器感觉不到自我,更不会为了自我的利益而产生自发行为。当前AI系统的伦理问题,本质上还是AI系统操纵者的伦理问题。”北京理工大学计算机学院副研究员冯冲告诉《经济》记者,机器可能学会发表有种族歧视的言论,也可能学会说脏话,甚至可能被用于犯罪,但这些系统都是完全被人操纵的。AI系统会不会带来大规模杀伤的问题,本质上不是AI系统的问题,是人的问题。
如何规避AI发表种族歧视言论,冯冲表示,从技术上,训练AI系统时不让它学习即可。在管理上,训练输出不当言论或做出不当行为的AI系统,开发者就应该为此承担法律责任。
张东进建议,国家相关法律法规应当适时的跟进完善,对一些涉及伦理的应用场景进行规范和引导,确保人工智能研发在可控的框架下发展。企业应当加强自律,避免将不成熟的产品推向市场而造成问题,尤其是在法律法规缺失的领域。
潘文举例,电子商务从2004年开始萌芽。2013年年底正式启动《电子商务法》的立法工作。2016年底至2017年年初,该法通过中国人大网向全国公开电子商务立法征求意见。“不是因为效率低,而是因为电子商务发展得太快。”人工智能也是如此,无论是法律制定还是标准制定,都面临同样的问题和挑战。
“当AI真的像电影《超级陆战队》中的大白或电影《AI》中的小机器人一样拥有人的感情和智能。我也不知道该如何面对他们,或者像主人与宠物之前的关系?”冯冲耸耸肩说道。
无人机展示 李雪娇 / 摄
标准应提上日程
AI产业的发展主要由数据推动,大数据、深度学习都离不开数据。“但是数据越多,谣言越多,虚假信息越多。”黄锦辉坦言。
美国等发达国家对大数据公司的监管严格。中国信息通信研究院研究员刘耀华曾撰文提到,近年来,美国联邦贸易委员会(FTC)开始针对数据经纪商进行立法。
“2010年某跨国IT企业,以数据自由、保护用户隐私为由,拒绝中国政府的数据审查。”黄锦辉认为,这种理由未免冠冕堂皇。而美国政府问该企业拿数据,他们便提供可疑的数据和人物。“这不是一个适宜不适宜的问题,政府定下规则以后,在特定情况下,政府可以监控这些数据,尤其是可疑的数据。”
未来一定会出现数据银行。就像银行业有银监局来监管黑钱、假货币一样,数据银行也应该有类似的监管者。黄锦辉建议,政府需要制定相应的政策、法律,一方面,预防虚假信息的传播,另一方面,确保数据的安全。
张东进表示,企业应当加强对数据,尤其是个人隐私的保护,确保数据全链路和全周期的安全性。云计算企业也应全力为企业提供安全保障服务。
今年7月,百度无人汽车违章上五环引起热议。黄锦辉指出,无人驾驶汽车在什么情况下可以出街?人类驾驶汽车尚需考取驾照,至少无人车也应该有牌照才行。
近年来,无人机十分流行,但我们要考虑自然环境等问题。“如果一架无人机坠落,毁坏了一片大草原,谁来负责呢?”黄锦辉表示,目前中国香港政府禁止无人机在政府管理的公园上空飞行。“科技带来的创新、颠覆,不等于颠覆我们的伦理、哲学,也不能对人情、安全坐视不理。即便人工智能在科学上是合理的,如果在社会上不合情,那么我们要多少机器人都没用。”
AI将带动就业
多年在银行工作的薇薇最近在某AI论坛圈里发布一则毛遂自荐的求职告示,希望能寻找一份人工智能的工作。有业内人士回复说其毫无工作经验。薇薇笑着说:“我就是看好这个方向。”
“我读大学时,就有一门人工智能课程。”赛迪智库电子信息产业研究所所长安晖告诉记者,当时人工智能更多地偏重理论,与产业很难结合。“现在人工智能已有了很大突破,尤其是大数据的发展,极大地促进了人工智能的发展。”
“近年来,计算机系学生就业较火,我们的人工智能方向专业最火。今年BAT互联网公司,都会招聘这个专业的人才,深度学习热潮对促进就业带来非常明显的效果。”殷绪成欣喜道。
科技部副部长李萌曾公开表示,人工智能技术发展和技术应用对经济社会发展领域的影响是可控的。从长期看,科技带来的就业远远大于失业。
除了AI专业火,行业对跨界人才的需求也十足。“像我们搞计算机出身的人,常常觉得自身对语言学的研究不够,有些东西就做不动了。”王小捷告诉记者,不少国外搞自然语言处理的专家,既是语言学教授,又是计算机系教授。“跨界人才对技术发展有很大突破。我们很希望引进有语言学背景的人才。”
1993年以前,国内在自然语言处理(NLP)领域的研究较少,技术分析以英语为主。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。黄锦辉是香港第一批投身NLP的研究者之一。随着网络的普及,汉语已成为全球网络中使用的第二大语言之一。“很多国外的公司希望到中国寻找汉语专家,帮助他们研究汉语分析技术。”
“从我的经验教训来看,专注更重要。”在殷绪成15年的科研工作中,期间有三四年的时间转向人工智能其他方向。像智能交通、卫星遥感图像、车联网等热门领域他都尝试过。后来才发现,任何一项技术的攻关,没有长时间积累很难成功。
最后殷绪成又回到文字识别、图像识别的老本行。“这几年模式识别在国内发展得很有特色。”算下来,殷绪成在自己的研究方向坚守了11年,才迎来曙光。“不管从事人工智能的哪个方向,专注很重要,这点对科研人员尤为重要。”他总结道。
但不得不提,当前的科研氛围以产出为导向,在应用研究时也针对热点问题。科研人员有了思路就会发表论文。但做出产品、产业化的这段距离更长,成功率更低,科研工作者在产业化方面深耕较少。“不要看到哪个应用热门就跟风,只有专注才能在激烈的竞争中,找准自己的定位。”殷绪成建议。
用人才撬动产业发展
据浙江清华长三角研究院发布《全球人工智能人才研究报告》显示,美国人工智能人才数量以87399人的储备量近3倍领先于第二名的中国。中国拥有在国际上活跃的人工智能人才数量为26665人。
在人工智能领域,很多论文是在美国高校发布的,其中约一半是华人。人工智能产业发展最大问题是人才的竞争。中国和美国在同一起跑线上。BAT等企业都从国外招揽人才,人才流动性较好,国内市场对人才也很有吸引力。张东进如是告诉《经济》记者。
今年3月,曾经创建了谷歌深度学习团队又加盟百度的AI权威学者吴恩达宣布从百度离职。“科研创新最大的瓶颈是人才,人工智能的领军人才较少。能否留住这些人才也是另外一回事。”中国电子信息产业发展研究院软件产业研究所副所长潘文对《经济》记者表示。
安晖认为,对于创业企业而言,优秀的领头人固然重要,但是在AI领域能做产业领头人的并不多。“AI领域的专家较多,但越到顶尖,公认的专家越少。”鉴于AI的发展方向和领域繁多,有些领域门槛相对较低,有很多发展机会。最重要的是AI产品能否真正做起来,并找到应用场景。
开源:效益第一,公益第二
在AI圈里,除了人才,大家关注较多的另一个概念是开源。
“过去微软的Windows系统,或苹果的iOS系统从一开始就是封闭式的。”安晖向记者举例,Facebook人工智能研究院、谷歌开源机器学习平台Tensor Flow、IBM旗下机器学习平台SystemML等都采用了开源形式。
他认为,目前开源、开放已成为全球人工智能发展的主流模式。“这点值得中国借鉴,以一种开放的心态,打造一个开放的产业体系,将产业资源聚拢起来发展AI产业,而不是把AI当成花瓶,闭门造车。”
“金山云一直积极拥抱开源社区,不仅积极参与开源社区的技术交流,也在自身的产品研发中与开源标准保持统一。”张东进指出,开源蕴含了全球技术人员的集体智慧,不仅加速了技术本身的发展,同时也能推动行业标准的制定。
在开源的道路上,国内国外都比较重视。殷绪成认为,是否开源,开源的程度如何,均与企业的商业利益息息相关。例如,安卓系统开源是为了获得更大的产业链。对企业而言,经济效益第一,公益第二。我们能清楚地看到,谷歌将能够扩大生态链的技术或代码开源,但基础部分不会开源。
“如果是基础研究,很多人愿意开源。如果是应用研究,一半人愿意,另一半不愿意开源。如果做技术应用研究,大部分人都不愿意开源。”殷绪成笑道。
“AI从上世纪60年代就开始了,不要说国外那些老先生,我自己都搞了16年。”冯冲表示,目前国家政策的积极调整,有利于人工智能产业的进一步快速发展,甚至社会上出现了AI将带来第四次产业革命的说法。“以目前的环境下,再加上政府、学术界、产业界有那么多的投入,AI再热5年不成问题。”
(本刊实习生付曦地对本文亦有贡献)
链接
人工智能发展三阶段
60多年来,人工智能发展分为三个阶段:第一阶段是专家系统,即将专家的经验输入系统内部。如垃圾邮件的确认,包括早期的语音系统,每一句的答复都是前期配置好的。第二阶段是机器学习,让机器从人工设计的特征和标签学习人类已有的经验,如早期的分类模型、序列模型等。
随着数据量越来越大,以及数据自身的复杂性越来越高,应用场景越来越多,慢慢进入到深度学习阶段(第三阶段)。起初深度学习在国际图像分类比赛中取得了不错的成绩,之后便在学界和产业界掀起了一股深度学习的热潮。比如,百度曾用深度神经网络做搜索。机器能够自动提取特征,自己进行学习。当前的深度学习更多的是监督学习。人类给机器提供很多监督学习的原始资料,机器主要依赖人类的经验进行学习。