微軟小冰由微軟(亞洲)互聯(lián)網(wǎng)工程院于2014年5月正式推出,是一個融合了自然語言處理、計(jì)算機(jī)語音和計(jì)算機(jī)視覺等技術(shù)的完備的人工智能底層框架和系統(tǒng)。該框架注重人工智能在擬合人類情商維度的發(fā)展,強(qiáng)調(diào)人工智能情商,而非任務(wù)完成,在人機(jī)交互中的基礎(chǔ)價值。
經(jīng)過數(shù)次迭代,2019年8月15日,小冰已進(jìn)化至第七代。第七代微軟小冰已成為全球最大的跨領(lǐng)域人工智能系統(tǒng)之一,產(chǎn)品形態(tài)涵蓋社交對話機(jī)器人、智能語音助理、人工智能內(nèi)容創(chuàng)作和生產(chǎn)平臺等。在全球多個國家,微軟小冰單一品牌已覆蓋6.6億在線用戶、4.5億臺第三方智能設(shè)備和9億內(nèi)容觀眾,在交互場景大幅度拓寬的情況下,微軟小冰與用戶的單次平均對話輪數(shù)(CPS)仍保持在23輪。
近日,微軟小冰首席科學(xué)家宋睿華、微軟小冰首席NLP科學(xué)家武威及微軟小冰首席語音科學(xué)家欒劍向記者分享了小冰近一年間的最新研發(fā)進(jìn)展,展現(xiàn)了小冰背后的研發(fā)情況。
武威介紹稱,小冰發(fā)展的目標(biāo)是成為一個“自我完備的對話機(jī)器人。“他應(yīng)該具有的能力包括:1、學(xué)習(xí)。2、自主管理。3、連接。對話機(jī)器人發(fā)展到今天,除了微軟小冰以外,實(shí)際上是整個業(yè)界、工業(yè)界、學(xué)術(shù)界一起努力得到的成果,小冰在里面做了很多開創(chuàng)性的工作,但如果沒有整個業(yè)界的努力,對話機(jī)器人產(chǎn)業(yè)不會發(fā)展的這么快。
第七代微軟小冰升級了微軟小冰的部分核心技術(shù),主要包括核心對話引擎、全雙工語音及多模態(tài)交互感官等。其中:
全新的對話引擎:經(jīng)過檢索模型、生成模型、共感模型的歷次技術(shù)迭代,本次升級的對話引擎實(shí)現(xiàn)了從“平等對話”向“主導(dǎo)對話”方向的跨越。它不僅能提高開放域的對話表現(xiàn),也能在垂直領(lǐng)域發(fā)揮高轉(zhuǎn)化率的效果。以在美國進(jìn)行的“在線零售垂直領(lǐng)域”測試為例,新的對話引擎向商品頁面轉(zhuǎn)化率高達(dá)68%,比上一個版本的轉(zhuǎn)化率提高21%。
全雙工語音交互感官:微軟小冰于2017、2018年分別上線了全雙工語音交互感官的傳統(tǒng)電話及智能音箱設(shè)備落地,此次新增車載場景,可大幅度提高人工智能助手與駕駛員及乘客的交互體驗(yàn),促進(jìn)人工智能從智能中控向“虛擬乘客”體驗(yàn)標(biāo)準(zhǔn)的轉(zhuǎn)化。
面向未來的多模態(tài)交互感官:是一種融合了全雙工語音交互、實(shí)時視覺與核心對話引擎的全新交互感官。它能夠?qū)崿F(xiàn)用戶與人工智能同時邊聽邊說邊看的交互體驗(yàn)。繼去年宣布率先開始多模態(tài)感官的研發(fā)后,今年2月,微軟日本小冰團(tuán)隊(duì)已邀請當(dāng)?shù)孛襟w進(jìn)行了公開測試。該感官有望成為5G時代的全新交互形式。