the part that is good is not original, and the part that is original is not good.

- 塞缪尔·约翰逊

“iPhone人工智能”的背后

October 8, 2011

本来想直接推荐这篇9to5Mac的访谈:《Siri联合创始人: 苹果的“语音助手”将改变世界》 ,但是要补充的太多,豆瓣说的字数不够用了……

我在iPhone 4S发布会之前就看过这篇文章,居然没注意到关键信息……我一直以为Nuance才是“iPhone语音识别”背后的核心技术,因为Nuance市值超过60亿,因为Apple买了Nuance的语音技术授权,因为Nuance跟IBM合作研发了人工智能Watson(其实除了语音识别和理解问题的部分,这家伙剩余的技术就是搜索和数据挖掘罢⋯⋯)

今天看了iPhone 4S发布会视频的后半段,感觉Siri(特别是结合Wolfram Alpha之后)绝对被低估了,现场演示和广告都相当惊艳,让人浮想联翩,无愧于amazing、incredible之类的乔式营销词汇——这才不是什么“语音识别”!这是霹雳游侠里的KITT!高智能方程式里的Asurada东之伊甸里的Juiz!星际争霸里的人族Adjutant!Portal里的GLaDOS!2001太空漫游里的HAL9000!⋯⋯

恰好今天又传出Nuance收购手机输入法Swype的新闻,其中都提到T9输入法是Nuance的业务之一,我才知道Nuance的业务其实很广……

重读那篇访谈,才注意到根源是DARPA发起的CALO项目,DARPA(美国国防高级研究计划局)在我心目中是跟硅谷并列的美国科技两大引擎之一,它比硅谷的VC更大胆更有前瞻性,赞助过一大堆充满科幻风格的未来技术,其中就包括投资数亿的“学习型个人助理”(PAL)计划,目的是为指挥官和作战人员提供革命性的辅助系统,快速掌握战场状况并辅助决策——有没有想起一大票FPS游戏里的辅助语音系统,比如HALO中跟”超级战士”计划配套的,UNSC研发的最强人工智能Cortana⋯⋯

PAL主要涉及的技术是人工智能(具体一点是机器学习和自然语言),而CALO正是PAL的子项目,占用了首期投资的76%,全称是”Cognitive Assistant that Learns and Organizes”,但也表示拉丁文”calonis”,意思是“soldier’s servant”(英灵!?⋯⋯)

参与CALO项目的强力组织包括麻省理工、斯坦福、卡内基梅隆大学、UC伯克利、波音等20多家,但牵头的是斯坦福的SRI International,而Apple收购的Siri正是SRI的嫡系,Nuance同样也是SRI孵化出来的——比起访谈里的信息,更值得注意的是:PAL计划是2003年启动的,Siri在2007年创立,直接来源于SRI在CALO项目中的工作,而Nuance早在1994年就创建了,前身是SRI的STAR实验室(Speech Technology and Research)⋯⋯

所以Norman Winarsky说Nuance只是Siri中可替换的“语音识别组件”——Nuance的业务只是语音技术,而Siri开发的是人工智能!

那么最实用的好消息便是:Nuance在上海和北京望京都有研发中心,一直在做国内各种方言的识别,“在广东话和普通话,我们是下了很大的功夫,然后我们把普通话的口音都覆盖,所以像我是香港口音、或者台湾国语、四川国语、东北国语其实全部是可以覆盖的”,而Apple可以直接利用“语音组件”的这些进展~

P.S. Thank you, Steve. Bravo.

posted in Apple, SF/F by Dexter.Yy

Follow comments via the RSS Feed | Leave a comment | Trackback URL

4 Comments to "“iPhone人工智能”的背后"

  1. 雨忆 wrote:

    苹果每每准确的的把握住全新的交互方式 很牛叉呀~ 交互方式真的很重要呀

    英灵这个太有喜感了 哈哈

  2. 小骆驼商队 wrote:

    当时看发布会就觉得很科幻~~

  3. 电源线 wrote:

    人类最终会生活到科幻之中

  4. www.chaojishop.com wrote:

    第一次来你这,支持下。

Leave Your Comment

YY in Limbo (混沌海狂想) © Dexter.Yy

Except where otherwise noted, content on this site is licensed under a Creative Commons Attribution - NonCommercial - ShareAlike 3.0(署名-非商业性使用-相同方式共享).
Creative Commons License