谷歌研发经理陈雍昇
谷歌研发经理陈雍昇

我们想知道,一个念头是如何破茧而出,最终发展成为优秀的产品。在这背后又有着怎样的技术与思考?我们想知道,成长道路上的合作、碰撞与收获。为此新浪科技推出《科技开讲》系列访谈,希望能远离喧闹纷繁的商战,寻找IT企业的灵魂。

访谈主题:

语言不互通,是否还能交流?谷歌即时语音翻译,就打开了这样的一扇门。借助谷歌的翻译技术,语言将不再是聆听演讲、查看文档的主要障碍。究竟冰冷的机器翻译,怎样向信达雅的目标前进?本期《科技开讲》将对这一产品进行解码。

做客嘉宾:

谷歌研发经理陈雍昇

本期精彩看点:

- 手机即时语音翻译功能主要有三个模块。一是语音识别,把音频内容转换成文字代码;二是进行机器翻译;三是把翻译好的文字转换成语音。

- 网页翻译流程:解构网页——机器翻译——还原重组。这一拆分再重新拼接的过程,实际耗时在一秒之内,期间同样是海量计算支撑。有一部分计算机在拆网页结构,另一部分则把获取的文字分散发布给上百台计算机进行翻译。

- 谷歌三大产品开发理念:方便、速度和质量。就像调校高级跑车一样,复杂的内容都放到引擎盖之下,同时跑车能够调高1%的时速已属不易,挑战性很大。

- 翻译质量背后其实是海量的数据,需要非常多的平行语料(即对同一内容的不同语言版本)。而平行语料的常用来源是联合国官方文件,但仍需找到更多口语化、普通的平行语料,机器翻译才能不断的接近信达雅的标准。

- 产品开发出现异议,崇尚“动手不动口”。即先把产品雏形做出来,甚至再通过部分用户测试后,以实际结果代替理论之争。

以下是本期《科技开讲》的文字实录:

新浪科技孟鸿:大家好,今天我们来主要讲讲有关翻译的故事。坐在我旁边的这位,他是Google的研发经理陈雍昇,但是我们现在假装不认识他,同时他也不会讲中文,我们应该怎么跟他交流呢,这时候我们可以用一部手机试试,我们这里装了Google翻译,看看是怎么用这个交流的,我就直接用这个和他讲话。

新浪科技(对手机):欢迎您来新浪。

手机语音翻译:Welcome to Sina。

陈雍昇(对手机):Thank you very much。

手机语音翻译:非常感谢您。

新浪科技:我们看到这就是我们刚才用手机做的交流,可以听到我们不同的声音,然后换上我们各自懂的语言,方便我们之间做一些沟通,这也是一个非常有意思的功能。大家都叫您Peter,刚才通过手机端完成的Google翻译功能是怎么实现的,给我们讲一下?

三个模块组成手机翻译功能

陈雍昇:手机即时语音翻译(即手机翻译对话模式)、对话模式主要有三个模块。第一个需要把人说的语音翻译成电脑可以识别的文字代码,这方面是叫做语音识别。第二个当有了文字代码以后,机器翻译需要把这个语言从原语言翻译成目标语言,这是叫做机器翻译。第三个翻译好了,还是以电脑的文字来呈现,我们要把这个文字转换成语音。这三个模块搭建在一起,就可以实现刚刚看起来非常炫的功能了。

新浪科技:这样一个功能对我们来说容易实现吗?

陈雍昇:从机器的角度,我们毕竟也是实现出来了,它的背后代表着一大堆海量的运算还有统计模型。从语音识别来讲,也需要庞大的数据模型,才能非常精确的识别出你说的字,同时机器翻译也是,需要输入很多平行语料,构建成海量的语言模型,最后文字转换成语音也是一样的。这三个模型都非常适合我们说的云计算,他们背后都是庞大的计算机、运算、储存构成的。

新浪科技:除了对话之外,我们在手机端上Google翻译还有哪些功能?

陈雍昇:既然是手机它是一个移动的平台,既然已经拿在用户的手上地我们要让它跟日常生活有非常密切的连接。所以我们现在手机方面的功能,都是在想怎么样让用户更方便。如果我在国外,有一些话我要跟计程车司机或者是服务员说,我不可能说完以后把手机给他看,如果给他看的话,如果我转成横的就变成大字体,手机就不用交给其他人。

新浪科技:就是我说一句它翻译好之后,会有一个很明显的展示功能。

陈雍昇:是的,这只是其中一个例子。我想主要的宗旨是如何在日常生活中让用户更方便的用。

新浪科技:这是一个中英文的翻译,Google翻译现在到底可以支持多少种语言之间的翻译?

陈雍昇:如果是单纯文字的翻译我们现在支持58种语言,如果是语音翻译的话,语音识别方面的数量我们还正在加强过程中,差不多是20多种语言可以进行语音到语音的翻译。

新浪科技:现在文字输入的话还可以实现判断输入的到底是什么样的文字是吗?

陈雍昇:这也是Google翻译让用户方便的一个理念。我们几年前的Google翻译,您输入您的原文字再去选原文字是什么样的语言,如果计算机能够自动判断既然是在输入中文字肯定是中文,如果是输入英文的话我们还要判断是西班牙文还是法文,如果计算机可以判断的话,我们就可以少做工作。当翻译走进日常生活,一个外国人跑过来跟你讲外语,你不知道他是讲英文还是法文,如果计算机可以自己识别的话,也是很炫的功能。

拆分计算请求降低延迟

新浪科技:在手机端做翻译的话,在整个过程中会遇到什么样的挑战和困难?

陈雍昇:手机方面的挑战之前有碰过几个。第一Google的理念不只是Google翻译的理念,就是要让用户方便,除了使用方面的方便还有就是速度,我们不用输入搜索的字眼等半天才能回来,同样的我们输入翻译的字也不希望等半天机器才把结果给我,在降低中间延迟方面做了非常大的努力。在手机方面有几个特别的挑战,一个是手机无线比平常的速度慢一些,第二个方面手机方面语音的应用非常多,大部分人在桌上电脑习惯做网页翻译、文字翻译,手机基本上都是语音到语音的翻译。语音到语音的翻译,就表现我得向云计算的云端发三个请求,如果三个请求叠在一起时间会相当长,能不能把三个请求慢慢的重叠,把文字、语音都可以同时处理,这样对于用户来说是等于省了三倍的时间。所以当时我们碰到的这样的问题,也都尽量克服了。

新浪科技:对于Google来讲更多是看技术的未来,大家都说手机、移动互联网是未来,在Google翻译上面未来还会给大家带来一些什么样的东西,或者说我们关注的方向是哪里?

陈雍昇:移动的翻译主要宗旨是让它走进日常生活,像这样横放屏幕就要放大。同时在输入方面我们也想要做更多的改进,语音的收入我觉得也是让用户非常方便的一点。另外一点手写,我们刚刚发布的在Google翻译里面的手写输入功能,应该也会让用户更方便。

新浪科技:您说手写输入是什么意思?

陈雍昇:如果我今天去日本,看到日本的一些路标、指示牌上面有很多日文,既然我不懂日文的话,你让我去发音、语音输入这些日文其实对我来讲很难,可是你让我照着写还可以做到,所以我可以在手机上面用手写的方法把日文输进去,这样再翻译比我们在日本对日文一窍不通容易的多。

新浪科技:会不会有一天我们带着手机就可以到世界各地,不需要再学日文、英文。

陈雍昇:这是我们一直致力的目标。

新浪科技:那翻译就要失业了。

陈雍昇:机器翻译是解决日常的应用,一些高端应用还是要靠一些专业人士。