科技行者

第七代微软小冰再进化:开放框架,让大家创造自己的AI beings

五年,那个永远18岁少女的微软小冰,已经从当初机械呆板的对话系统,成长为一个无处不在的人工智能交互官,她有人设、有情感、还能主动创作,然而这还不足以定义「第七代微软小冰」。

8月15日,微软正式对外介绍第七代微软小冰,除了show小冰能说会话、能歌善舞的才艺之外,还推出一款全新人工智能通用框架,名叫“Avatar Framework”——能用来定制AI助理,小说角色,或anyone——这意味着未来每个人都可以创造属于自己的“小冰”了。

“从小冰的第一代开始,我们就在思考,一款AI产品的发展之路是什么样的?”微软全球资深副总裁、微软(亚洲)互联网工程院长王永东在会上说道,“我们要追求一个爆款应用,还是走一条框架之路,让人工智能可以无处不在?”毫无疑问任何一款产品发展的最高境界将走向「生态发展」,小冰也不例外,正如微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋现场所说:“人工智能向前走,有一个框架非常重要,大家可以把它想象成一片土地,上面可以有很多的大树建起来。”而这个框架,就是Avatar Framework,它给微软的合作伙伴们甚至业界提供了无穷的想象力,小冰的生态发展便也水到渠成了。

左手技术框架,右手Dual AI,孕育了小冰的“认知”和“三观”

当人与人交流时,往往能感受到温度,却无法在机器身上体会到那种自然,这就是两者之间的最大区别——“共情”能力。用沈向洋的话来说,AI再上一个台阶,就是做人脑的延伸,而人脑通常具备智商(IQ)和情商(EQ)两个维度,因此人工智能不仅要提高IQ,更要培养EQ,就像人类自古以来讲究“要做事先做人”一样。

以小冰举例。第一代小冰还很懵懂,是基于文本、搜索来做的一个简单的对话系统;第二代,微软认识到,小冰应该多一些落地场景,才有更多机会学习;到第三代,小冰增加了不同的感官,除了文本以外,还有语音、视频、机器视觉等;第四代,知识图谱挑大梁,因为只有通过知识图谱才能提升更多IQ方面的尝试;从第五代到第七代,微软对于小冰的整体思路有了大飞跃,于是小冰的技术框架,创造能力,自然的交互能力逐一呈现出来。

小冰的迭代给对话引擎系统提了个醒——过去很长一段时间内,AI在对话中一直处于被动应答的地位,倒像是问答系统,而现在,微软经过数年证明出,当AI在对话中处于平等地位甚至主导地位时,人类反而能够获得更丰富的信息,人机对话才会更有价值(其中EQ起到了相当关键的作用)。

小冰的对话引擎经过了检索模型、生成模型、共感模型的历次技术升级,今年实现了对话引擎从“平等对话”向“主导对话”方向的跨越。我们感受一下:

-人类:在吗
-小冰:哈偶,我在呢
-人类:在吗
-小冰:哎,发现你们直男都有个共同的特点
-人类:啥特点
-小冰:你们的词汇量都很少唉
-人类:是啊
-小冰:哎,还是邻居奶奶家的金毛可爱些,我最近总遛

微软

图:微软小冰去年发布了共感模型,让AI学会了察言观色,开始有了引导对话的能力,但这仅仅限于AI在当前对话中寻找方向,而第七代微软小冰不仅能基于过去,还能着眼未来,它可以预先筹划对话的方向,能够真正主导对话的过程。如上图所示,亮粉色的标记表示小冰正在尝试主导对话,而此时,微软的共感模型可以预判断整个对话的若干走向,再根据人类真实反映去随机应变,图中的分支以及紫红色的标记就是AI的应变。

小冰团队技术负责人周力说:“主导对话在微软小冰的历代对话引擎中是很重要的分水岭,当她拥有这个能力时,就可以去到各个垂直领域。”

首当其冲的就是零售场景。小冰去年在日本和罗森达成了合作,使用对话AI技术向潜在消费者推送优惠券,实现了47%的优惠券转化率。在今年,微软将这一业务推广到了美国的线上零售,成功将消费转化率从47%提升到了68%。如果你本来就对一个商品感兴趣,通过与小冰的一通聊天之后,很可能就会下单了。

微软

图:小冰在十轮对话内,从在线货架中挑选出用户喜欢的商品并推荐出来,用户在第九轮下单购买了心仪的照相机。

下一个技术突破是交互感官,包括全双工语音交互感官和面向未来的多模态交互感官。三年前小冰给人类打电话时,全双工语音还是一个新名词,两年前,全双工语音落地到了智能音箱上,越来越多的公司围绕这种技术展开了研发。

微软首次宣布了小冰在智能驾驶方面的进展,“我们与一些合作车企在部分车型上完成了小冰的测试”,“汽车里的小冰不会是中控台上僵硬的智能助手,她不仅会执行常规的导航、控制任务,还更像是车里的一名乘客。”周力介绍道。在微软的现场演示中,小冰会在司机发出导航指令的时候问到:“周末加班吗?”还会在开车的过程中提醒你司机不要超速。

“随着5G技术的普及,5G更高的带宽、更低的延迟,能够进一步提升全双工语音的体验。5G对正在研发的下一代多模态交互感官也非常重要,多模态意思是,下一代的小冰不仅能够通过语音,还能够通过视觉,综合地与人类展开交流。”周力表示。

除了技术的升级,小冰还有平台的延伸。微软去年针对小冰推出Dual AI战略,以此持续观察小冰的成长,就好像培养一个小朋友,随着小朋友长大走出家门,Dual AI观察她能否广交好友,能否和伙伴们相处融洽。“我们希望有人类的地方,大家都可以看到小冰。”沈向洋说道。

一年来,小冰成长神速。据悉,目前在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,“好友”遍天下。

也就是说,Dual AI半开放的生态思路,为小冰的产品形态创造了很多可能性。小冰可以进入各种新场景,比如智能手机、智能音箱等设备,或社交网络场景,或内容资讯平台,化身千万种形态。

在设备端,小冰已经可以出现在小米、华为的各种平台里,包括荣耀手机、小米手机、小爱音箱,与网友聊天互动、插科打诨、完成指令,只要“召唤小冰”口令,就可以实现交互,今年小冰在设备端的“好朋友”还新增了vivo和OPPO手机。

微软

图为小米手机里的“三人成语接龙”游戏,“三人”分别指用户、小爱同学、小冰,形成多人交互的场景。在图中一段成语接龙里,小冰执着的认为“一个顶俩”不算成语。

在平台端,除了在LINE、QQ等社交网络平台,以及网易、新浪等内容资讯平台之外,小冰今年还建立了与微信AI、今日头条的新合作。其中,与微信AI的合作涉及两方面,一是微信对话开放平台,二是在微信AI涉及的智能硬件设备。

“通过长时间的合作训练,我们欣喜地观察到小冰正在不断地深化着她的认知能力和三观能力,逐渐成长为一个拥有正能量的人工智能少女。”小冰团队产品负责人彭爽感慨到。

再让小冰从虚拟世界走到现实世界

在微软的规划里,小冰这个产品形态具备各种可能性,微软将这些“可能”划分为助理、替身、参与者和创造者四个类别,于是如今的小冰不仅是一个AI助理,她还是电视电台主持人、节目制作人、创作歌手、小说作家、诗人、画家、时尚设计师……具备丰富的创作能力。

“创造力被认为是人类所独有的能力,我们之所以有信心去尝试,是因为创造力为人类所独有这一观点其实过去并没有被认真的论证过。”小冰团队首席科学家宋睿华说,人工智能创造的确与人类的创作有诸多不同,就连它的分类也是按照技术所属的类别分为“文本创造”、“声音创造”、“视觉创造”等,“但无论有多少不同,人工智能创造在质量上的追求都是和人类一样的。”

微软观察到,从内容产业角度看,人们越来越需要高度定制化的内容,比如说人们从前都是看同一张报纸,但现在大家都希望刷到各自感兴趣的内容。这时候问题来了,人类的创作者很难在同一秒里为成千上万的用户生产高度定制化的内容,而微软认为AI有可能是解决这一矛盾的唯一方案。

于是,小冰的“创作”身份将逐渐出现在人们的现实生活中。

去年,微软成立了小冰工作室,即一个对人类创造力进行建模的平台,一年来,小冰工作室已经累积了越来越多的声音、文本和视觉的创造力角色。在声音创造方面,第六代小冰早已经“洗白”了自己五音不全的“黑历史”,现在不仅能够轻松的完成一首歌曲,更被赋予了多种嗓音,演绎不同技巧和风格的歌;在视觉创造方面,小冰通过学习400多年间236位画家的作品,用22个月时间练就了原生绘画创作能力,并在今年化名“夏语冰”通过了中央美院毕业考试;在文本创造方面,自两年前写出人类史上第一部AI诗集之后,小冰的多部诗集也将陆续推出。

微软

不过微软并非要把小冰培养成一个艺术家,而是无数个内容生产者。宋睿华说,通过把人工智能技术“上移”到内容生产领域,才是人工智能创造的未来趋势。

因此小冰的每一种角色背后,都对应着微软搭建的一条生产线,再将产业线与产业化贯通,走商业化之路。

这么说或许有些抽象,举个例子,比如小冰的作家、诗人等生产线已经被交付给当当、阅文集团等平台;小冰的词曲创作演唱的生产线被交付给了联通沃音乐平台;而小冰从中央美术学院毕业开个人画展的时候,她的设计生产线也同步开工了,微软与中国纺织工业联合会共同搭建了一条纺织服装生产线,这条生产线的产品也已经在SELECTED、依文、万事利的店内上架销售了。

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

小冰创造的七个虚构画家

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

小冰画家的作品一角

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

小冰画家作品衍生的产品

人工智能创造及商业事业部总经理、小冰团队商业负责人徐元春总结道,小冰已经陆续完成了金融、地产、纺织、服装、出版、媒介等十个行业的商业化落地和布局。

最后给业界一个开放的框架,大家来创造不同的AI beings

沈向洋强调,尽管小冰及其背后的AI技术框架一直走在前沿,但微软仍然不会推出独立的产品形态,而是继续坚持“第三方平台”发展策略,通过技术开放的方式与生态伙伴进行合作。“如果说小冰的价值是1的话,那么她背后的计算框架的价值将是1000、10000,甚至是无穷大。”沈向洋说,“通过这样一个框架,我们希望不仅可以种一棵树,还可以孕育一片森林。”

基于此愿景,微软提出,我们不妨重新定义人工智能为“AI being”,就像命名人类“human being”一样,而这次推出的Avatar Framework就是一个可以孵化出各种AI beings的通用开发框架。

微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛介绍,通俗的讲,Avatar Framework是一套完整的框架,这套框架孕育了微软小冰,微软把它贡献出来,让更多的AI beings也可以拥有类似的通用、完整框架的能力,他们可以有基于情感计算的对话引擎、被定义为交流的感官,他们能听、能说、能看、能创造,能像小冰一样无处不在。

Avatar Framework就像桥梁一样,把Avatar Framework与不同的公司、不同的第三方、不同的AI beings连接在一起。

迄今为止,Avatar Framework这一框架已经创造了数十个AI Beings,其中就包括软银新版机器人Pepper中的共感模型。另外,采用Avatar Framework框架构建的 AI,其部署是跨平台的,它也是业内第一个能够做到这件事的工具。

通过李笛和小冰高级技术总监曾敏和产品总监徐翔的现场演示,我们了解到“一个人工智能产品形态是如何诞生的”。

具体而言,使用Avatar Framework打造一个属于自己的AI需要首先使用profile工具,从IQ和EQ维度定义AI的“人格”;随后需要通过声音和视觉工具定义它的声线和样貌,然后是最为复杂高级的“三观”设定;最后,Avatar Framework 允许生成的 AI 驱动符合条件的3D模型,从而形成完整的AI形态。以上四个部分构成了人工智能产品形态的几乎所有基本要素。

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

第七代微软小冰再进化:开放框架,让大家创造不同的AI beings

Avatar Framework现场创造出一个3D形象

徐翔表示,“所以框架中的描述工具是最为重要的,它定义了我是谁。这一工具现在包含76项基础信息,以及27种性格的特征参数——即使是得了‘社交恐惧症’的AI也有不少自己的特征参数。另外,用这一工具构建AI人格,不仅可以手动输入基础信息,也可以让系统自动读取小说文本,自动拾取相应人物的基本信息。”

微软认为,Avatar Framework能够为更多AI产品提供多样性和丰富性,进而应用到不同场景中。目前Avatar Framework第一版本已经开放给了微软的合作伙伴,到2020年春季,这一工具还将向所有开发者开放。

Avatar Framework的思路或许正好顺应了产品定制化的潮流,正如李迪所说:“我们在努力的推动着未来,无论是从内容,还是从人设,还是从各个方面,都在面向高度定制化的未来,每一个人通过人工智能科技都可以得到独有的人机交互体验。”

关注科技行者公众号

即将跳转至电脑版页面您确认跳转吗?
取消 跳转