Shih-Tzu-edit-660x495

微软人工智能系统Adam可以区分狗的品种和植物类型

导语:据美国科技杂志《连线》报道,微软在学术峰会期间首次公开展示了全新人工智能系统Adam。该系统具有非常强大的图片辨别能力,可以区分狗的品种和植物类型,其神经网络优于Google Brain。

以下为全文:

我们正在步入一个全新的人工智能时代。

凭借着学术研究人员的工作,科技巨臂——包括谷歌、Facebook、微软和苹果——都纷纷都开始探索一种更强大的人工智能(AI)形式,称为“深度学习”,用它来改善一切,从语音识别到语言翻译再到计算机视觉,其中,计算机视觉是在没有人工帮助下,机器识别图像的能力。

在新人工智能时代,谷歌是走在最前端的。谷歌聘用了“深度学习”权威研究员——多伦多大学的杰夫•辛顿(Geoff Hinton)。

谷歌公开讨论了新人工智能技术的实际进展,包括“深度学习”算法如何改变Android智能手机的语音搜索功能,而这些技术在语音识别和计算机视觉方面的准确度不高。

但现在,微软的研究机构表示,凭借全新的“深度学习”系统——Adam,公司在准确度上取得突破。这一项目于今天早上在微软华盛顿总部雷德蒙的学术峰会期间首次公开讨论。

据微软称,Adam在图像识别方面的熟练程度是当前系统的两倍,包括识别照片中特定品种的狗或植物,而使用少了30倍的机器。

Microsoft Research的负责人彼得·李(Peter Lee)说:“Adam是一个探索如何构建最强大脑的项目。”

Adam_team-edit

Adam项目团队(从左到右):卡斯柯·柯岩那曼(Karthik Kalyanaraman),特里苏·棋力必(Trishul Chilimbi),约翰逊·阿帕斯堡(Johnson Apacible),由隆铃江(Yutaka Suzue)

彼得·李鼓吹,当运行一个称为ImageNet22K的基准测试时,Adam神经网络高于目前的Google Brain的性能数据,Google Brain系统为Google的在线服务帝国提供人工智能计算,包括Android语音识别和Google地图。

这个测试处理了22000种图像的数据库,在Adam之前,只有少数的人工智能模式能够处理大量的输入数据,其中一个就是Google Brain。

但是,Adam并不旨在使用新的“深度学习”算法击败Google,秘诀在于,Adam系统更好地优化机器处理数据的方式,以及调整它们之间的通信模式。这个创意来自微软研究员,名为特里苏·棋力必(Trishul Chilimbi),他并非精通人工智能学术,而在大规模计算系统的艺术方面有所造诣。

运行原理

类似深度学习系统,Adam运行一组标准的计算机服务器,在这种情况下,机器提供微软的Azure云计算服务。

深度学习的目标是通过创建神经网络,更紧密地模仿大脑的工作原理,至少在某些方面,这个系统的运行方式类似大脑中的神经元网络,通常,这些系统神经网络需要大量的服务器。不同的是,Adam使用一种称为“asynchrony”的技术。

随着计算机系统变得越来越复杂,各个部分之间的通信变得越来越困难,但是asynchrony可以缓解这一问题。

基本上,asynchrony将系统分割成多个部分,这些部分在分享计算以及合并成一个整体之前,几乎可以相互独立运行。麻烦的是,由于计算可以分布在许多不同的计算机芯片上,因此,asynchrony可以很好地适用于智能手机和笔记本电脑,但它很难架构于跨越多个不同服务器的系统之上,如神经网络系统。

但是,大量研究人员,以及包括谷歌在内的科技公司,都已经探索了多年的asynchronous系统,在Adam系统中,微软利用了威斯康星大学开发的一种新技术,称为“HOGWILD!”。

HOGWILD!设计的初衷是让机器中的每一个处理器运行更加独立,不同的芯片甚至可以写入相同的内存位置,没有什么可以阻止它们进行相互覆盖。

在大多数系统中,HOGWILD!并不适用,因为它可能会导致数据冲突,其中一台机器覆盖了另一台机器的数据,但在某些情况下,它可以很好地工作。

在小型计算系统中,数据冲突的几率是相当低的,美国维斯康星大学研究人员表明,HOGWILD!能在单一的机器中实现显著加速。Adam进一步推进了这一想法,应用了HOGWILD!的异步化到整个机器网络中。

虽然神经网络非常密集,数据冲突的风险很高,但是这种方法是可行的,因为冲突往往会导致相同的计算。当每一台机器更新主服务器时,更新往往被添加。例如,一台机器决定添加“1”到预先存在的数值“5”上,而另一台机器决定添加一个“3”,系统并未仔细控制,哪台机器数据首先更新,而是只要可以更新,就让它们自己更新。不管哪台机器先更新,最终的结果都是“9”。

微软表示,这种设置可以帮助其神经网络更快速、更准确地训练自己理解诸如图像的东西。深度学习专家、现任职搜索巨头百度的吴恩达(Andrew Ng)说:“这是一种积极的战略,我明白为什么这可以节省大量计算。”

Adam是如何工作的

吴恩达表示惊讶,Adam运行在传统的计算机处理器上,而不是GPU上,GPU最初设计是用来处理图形的芯片,现在用于其他各种数学计算。许多深度学习系统正在向GPU迁移,以避免通信瓶颈,而棋力必表示,Adam的全部意义是走了一条不同的路。

由于数据数量大幅增多,多到用标准的计算机芯片或CPU无法处理,由此,神经网络蓬勃发展,这就是为何它们分布在这么多的机器中。然而,另一种选择,在GPU上运行系统可以更快地处理这些数据。

问题在于,如果AI模型不能完全适合GPU卡或者运行几个GPU的单一服务器,该系统可能停滞。数据中心的通信系统速度不够快,跟不上GPU处理信息的速度,导致数据卡壳。这就是为何一些专家认为,GPU用来扩大神经网络并不合适。设计了大量硬件和软件包括微软Bing搜索引擎的棋力必就是其中之一。

继续推进HOGWILD!的探索?

微软为Adam项目定的文案为“令人兴奋的系统”,但一些深度学习专家认为,该系统的构建方式与谷歌没有什么本质区别。由于更多如何优化网络的细节还不清楚,专家说,很难知道棋力必和他的团队如何显示他们声称的性能提升。

曾在Google Brain工作,现在开设自己的深度学习公司Clarifai的马特·塞勒(Matt Zeiler)指出,因为它们添加了更多机器,因此,Adam的精度提高了。他说:“我绝对认为,应该更多研究HOGWILD!”

微软的彼得·李说,该项目仍然处于“胚胎”阶段,到目前为止,它只能通过一个内部应用部署,当你用手机拍了照片之后,它能够识别对象。彼得·李已经用它来识别狗的品种以及照片中的虫子是否有毒。

目前,还没有向公众发布应用的明确计划,但彼得·李指出,该技术可以应用在潜在技术领域,包括电子商务、机器人、情绪分析等。微软内部还展开讨论,如果运行在可编程阵列或FPGA中,处理器可以修改来运行定制软件,Adam的效率能否得到提高。微软已经尝试用这些芯片来改善必应。

彼得·李认为,Adam可以作为他所谓的“终极机器智能”的一部分,它的处理方式更接近于人类处理各种事态的方式,如语音、视觉和文字等。这条“终极智能”之路十分漫长,自50年代以来,人们一直在努力实现它,可以肯定的是,我们离这个目标越来越近了。