第九屆中國(guó)智能產(chǎn)業(yè)高峰論壇(CIIS 2019)在西安開(kāi)幕。本屆峰會(huì)以“驅(qū)動(dòng)未來(lái),智能無(wú)界”為主題,海內(nèi)外知名人工智能學(xué)者、企業(yè)代表等參與峰會(huì),圍繞人工智能技術(shù)創(chuàng)新和在各場(chǎng)景中的應(yīng)用展開(kāi)研討。百度首席技術(shù)官、ACL/CAAI 會(huì)士王海峰出席峰會(huì),并發(fā)表題為《AI大生產(chǎn)平臺(tái)推動(dòng)產(chǎn)業(yè)智能化》的演講,全面介紹百度如何通過(guò)探索頂尖AI技術(shù)、打造AI大生產(chǎn)平臺(tái),助力產(chǎn)業(yè)智能化發(fā)展。
王海峰介紹,人類經(jīng)歷的前三次工業(yè)革命中,驅(qū)動(dòng)工業(yè)革命的核心技術(shù)都表現(xiàn)出很強(qiáng)的通用性,呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化、模塊化的工業(yè)大生產(chǎn)特征。當(dāng)前,我們正身處以AI為核心驅(qū)動(dòng)力量的新一輪科技革命和產(chǎn)業(yè)革命浪潮之中,AI正將人類社會(huì)帶入智能時(shí)代。
作為國(guó)內(nèi)投入最早、技術(shù)最強(qiáng)、布局最完整的AI領(lǐng)軍企業(yè),百度持續(xù)研發(fā)領(lǐng)先的AI核心技術(shù),并積極建設(shè)AI大生產(chǎn)平臺(tái),推動(dòng)應(yīng)用落地,促進(jìn)產(chǎn)業(yè)智能化的發(fā)展。百度人工智能技術(shù)多年積累和產(chǎn)業(yè)實(shí)踐的集大成——百度大腦,實(shí)現(xiàn)了AI能力與應(yīng)用場(chǎng)景融合創(chuàng)新,已升級(jí)為“軟硬一體AI大生產(chǎn)平臺(tái)”。
在數(shù)據(jù)和算力的基礎(chǔ)上,百度大腦“軟硬一體AI大生產(chǎn)平臺(tái)”以飛槳深度學(xué)習(xí)平臺(tái)為基礎(chǔ)技術(shù)底座,打通了人工智能產(chǎn)業(yè)化應(yīng)用落地相關(guān)的全部流程,包括深度學(xué)習(xí)平臺(tái)、通用AI能力、定制化訓(xùn)練平臺(tái)、部署與集成,以及應(yīng)用的技術(shù)解決方案,同時(shí)有完整的AI安全體系保障,實(shí)現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動(dòng)化、模塊化,推動(dòng)產(chǎn)業(yè)智能化。
人工智能的發(fā)展離不開(kāi)算力的支撐。百度大腦的AI計(jì)算架構(gòu),通過(guò)芯片、連接、系統(tǒng)和調(diào)度的協(xié)同設(shè)計(jì)和技術(shù)創(chuàng)新,提供百萬(wàn)TOPS的強(qiáng)大算力,并緊密結(jié)合百度飛槳訓(xùn)練與推理框架,提供面向算法優(yōu)化的極致效率。
芯片是算力層面被關(guān)注的焦點(diǎn)。百度自研云端通用AI處理器——百度“昆侖”,針對(duì)語(yǔ)音、自然語(yǔ)言處理、圖像等專門進(jìn)行了優(yōu)化,同等性能下將成本降低了10倍。此外,百度打造了遠(yuǎn)場(chǎng)語(yǔ)音交互芯片百度“鴻鵠”,“鴻鵠”芯片按照車規(guī)級(jí)標(biāo)準(zhǔn)打造,采用HiFi4自定義指令集,雙核DSP核心,具備超大內(nèi)存,包含TCM Cache SRAM,而且能耗極低,平均功耗僅100mW,可實(shí)現(xiàn)遠(yuǎn)場(chǎng)陣列信號(hào)的實(shí)時(shí)處理和高精度低誤報(bào)語(yǔ)音喚醒,并集成離線語(yǔ)音識(shí)別功能,適配車載語(yǔ)音交互、智能家居等各種場(chǎng)景。
底層的芯片和上層的應(yīng)用之間,還需要操作系統(tǒng)承接。在智能時(shí)代,深度學(xué)習(xí)框架向下對(duì)接硬件、芯片,向上承接各種業(yè)務(wù)模型、行業(yè)應(yīng)用,起到承上啟下的作用,是“智能時(shí)代的操作系統(tǒng)”。百度在多年深度學(xué)習(xí)和人工智能技術(shù)的積累和產(chǎn)業(yè)實(shí)踐的基礎(chǔ)上,打造了自主可控的飛槳產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開(kāi)源開(kāi)放平臺(tái)。飛槳平臺(tái)核心技術(shù)領(lǐng)先,具備開(kāi)發(fā)便捷的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)框架、超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù)、多端多平臺(tái)部署的高性能推理引擎、開(kāi)源開(kāi)放覆蓋多領(lǐng)域的產(chǎn)業(yè)級(jí)模型庫(kù)四大領(lǐng)先技術(shù);飛槳平臺(tái)集深度學(xué)習(xí)訓(xùn)練和預(yù)測(cè)框架、模型庫(kù)、開(kāi)發(fā)套件、工具組件和服務(wù)平臺(tái)等為一體,是功能完備、全面開(kāi)源開(kāi)放的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái)。王海峰介紹,基于飛槳的EasyDL等服務(wù)平臺(tái),企業(yè)和開(kāi)發(fā)者即使不懂深度學(xué)習(xí),也可以訓(xùn)練出滿足應(yīng)用需求的模型,加速AI的應(yīng)用落地。
以飛槳為基礎(chǔ)技術(shù)底座,百度大腦的AI核心技術(shù)持續(xù)取得創(chuàng)新突破,保持世界領(lǐng)先水平。語(yǔ)音技術(shù)領(lǐng)域,百度大腦的流式多級(jí)截?cái)嘧⒁饬δP停⊿MLTA)使識(shí)別準(zhǔn)確率提升15%-20%。王海峰現(xiàn)場(chǎng)展示了基于SMLTA中英文混合識(shí)別能力,這一能力目前已在的百度輸入法上大規(guī)模應(yīng)用;風(fēng)格遷移的語(yǔ)音合成技術(shù)把聲音中的音色、風(fēng)格、情感等不同元素解耦分離,獨(dú)立組合,靈活控制合成的聲音,只需錄制20句話,就可以制作一個(gè)人的專屬聲音;诖思夹g(shù),百度上線了全球首個(gè)地圖語(yǔ)音定制功能,為用戶帶來(lái)了前所未有的個(gè)性化體驗(yàn)。
在視覺(jué)技術(shù)方面,基于圖像技術(shù)、人臉人體技術(shù)和視頻分析技術(shù),百度已經(jīng)形成適用于不同應(yīng)用場(chǎng)景的技術(shù)矩陣,如OCR文字識(shí)別、車輛識(shí)別、物體識(shí)別、風(fēng)格轉(zhuǎn)化,以及人臉檢測(cè)、人臉對(duì)比、駕駛行為檢測(cè)、人流量統(tǒng)計(jì)等,在機(jī)械制造、金融、醫(yī)療、教育等領(lǐng)域得到廣泛的應(yīng)用。而通過(guò)3D和AR的手段,已經(jīng)實(shí)現(xiàn)人臉、手勢(shì)、環(huán)境、肢體多維度的技術(shù)突破,可用于一體化人機(jī)交互等創(chuàng)新應(yīng)用。
綜合應(yīng)用語(yǔ)音和視覺(jué)技術(shù),機(jī)器可以自動(dòng)合成虛擬形象。百度大腦的虛擬形象合成技術(shù),首先對(duì)語(yǔ)音信號(hào)和視頻信號(hào)進(jìn)行識(shí)別與理解,再通過(guò)唇動(dòng)生成,以及語(yǔ)音、面部和肢體的合成,合成一個(gè)虛擬形象。
在語(yǔ)言與知識(shí)技術(shù)方面,百度建立了完整的、包含知識(shí)圖譜、語(yǔ)言理解、語(yǔ)言生成等在內(nèi)的語(yǔ)言和知識(shí)技術(shù)布局,全面支持搜索、問(wèn)答、對(duì)話等百度產(chǎn)品,同時(shí)開(kāi)放賦能,支持各行業(yè)的創(chuàng)新應(yīng)用。百度構(gòu)建了世界上最大的多元異構(gòu)知識(shí)圖譜,在能夠滿足90%用戶需求的實(shí)體圖譜的基礎(chǔ)上,針對(duì)不同的應(yīng)用場(chǎng)景和知識(shí)形態(tài)建立起關(guān)注點(diǎn)圖譜、行業(yè)知識(shí)圖譜、POI圖譜、事件圖譜等多種知識(shí)圖譜。
自然語(yǔ)言處理技術(shù)也在持續(xù)創(chuàng)新突破。百度結(jié)合知識(shí)和語(yǔ)義理解打造的可持續(xù)學(xué)習(xí)的知識(shí)增強(qiáng)語(yǔ)義理解框架ERNIE,通過(guò)建模海量數(shù)據(jù)中的實(shí)體概念等先驗(yàn)知識(shí),學(xué)習(xí)真實(shí)世界的語(yǔ)義關(guān)系。這種融合知識(shí)的語(yǔ)義建模大幅增強(qiáng)了模型的語(yǔ)義表示能力,在共計(jì)16個(gè)中英文自然語(yǔ)言處理任務(wù)上效果超越了谷歌BERT和XLNet;在機(jī)器同聲傳譯方面,百度首創(chuàng)感知上下文的機(jī)器同傳模型,可以實(shí)現(xiàn)端到端實(shí)時(shí)同聲傳譯,翻譯準(zhǔn)確率和時(shí)延與人類水平相當(dāng)。百度構(gòu)建的面向任務(wù)的理解與交互技術(shù),現(xiàn)在已經(jīng)積累了6.8萬(wàn)個(gè)定制技能、累計(jì)交互570億次,在車載交互、地圖導(dǎo)航、智能音箱、政務(wù)咨詢等諸多場(chǎng)景中得到廣泛應(yīng)用。
隨著AI技術(shù)的產(chǎn)業(yè)化應(yīng)用不斷深入,AI安全也受到越來(lái)越多的重視。百度大腦打造了完整的AI安全體系,從基礎(chǔ)的開(kāi)源技術(shù)矩陣、開(kāi)放行業(yè)解決方案的平臺(tái),到與學(xué)術(shù)界、企業(yè)、政府、機(jī)構(gòu)等多層面的開(kāi)放協(xié)作,為AI技術(shù)的產(chǎn)業(yè)應(yīng)用保駕護(hù)航。
以百度大腦為核心,以飛槳為基礎(chǔ)底座,依托百度智能云,百度大腦AI大生產(chǎn)平臺(tái)為各行各業(yè)的智能化轉(zhuǎn)型升級(jí)提供了強(qiáng)有力支撐。例如,百度聯(lián)合浦發(fā)銀行推出了金融領(lǐng)域首個(gè)“數(shù)字”員工小浦,憑借專業(yè)的金融知識(shí)、對(duì)用戶需求的深刻理解,為客戶帶來(lái)全新的服務(wù);百度的AI質(zhì)檢技術(shù)應(yīng)用于工廠的質(zhì)檢車間,幫助人員成本節(jié)省90%,占地面積減少80%,將漏檢率從0.5%-1%降低到0.1%以內(nèi);為重慶氣象局打造的智能預(yù)報(bào)預(yù)測(cè)系統(tǒng),可以覆蓋短臨、短期和氣候預(yù)測(cè),大幅提升氣候預(yù)報(bào)的準(zhǔn)確率、縮短氣象預(yù)警信息的發(fā)布時(shí)間。
目前,百度大腦AI大生產(chǎn)平臺(tái)已開(kāi)放216項(xiàng)核心AI能力,日調(diào)用量突破1萬(wàn)億次,開(kāi)發(fā)者超過(guò)150萬(wàn),企業(yè)用戶發(fā)布模型超過(guò)16.9萬(wàn)個(gè)。
在峰會(huì)活動(dòng)中,王海峰還參加了以“人工智能如何打破大規(guī)模產(chǎn)業(yè)化的瓶頸”為主題的尖峰對(duì)話。他以翻譯為例,介紹了人工智能的發(fā)展歷程,人工智能在當(dāng)下科技變革和產(chǎn)業(yè)革命過(guò)程中的重要作用,以及百度在推動(dòng)產(chǎn)業(yè)智能化面取得的成就。
談及人工智能的未來(lái),王海峰表示,人工智能已經(jīng)具備工業(yè)大生產(chǎn)特征,將會(huì)開(kāi)始廣泛的大規(guī)模應(yīng)用,整個(gè)產(chǎn)業(yè)乃至整個(gè)社會(huì)都將從中受益。