5秒!對著物流單據(jù)掃描、信息錄入,這是整個流程的用時,而且,單據(jù)識別召回率與準(zhǔn)確率均超過了98%。在這之前,人工錄入環(huán)節(jié)需要3分鐘。
作為物流行業(yè)領(lǐng)軍企業(yè)的中外運提出智能化轉(zhuǎn)型方向,這家企業(yè)對接世界上不同公司的貨物運輸,內(nèi)部涉及到非常復(fù)雜的表單數(shù)據(jù)錄入流程,幾乎每個貨運碼頭都需要人工錄入,成本高、效率低,錄入時間不能靈活處理,但通過騰訊云,諸多問題迎刃而解。
這背后,為騰訊云提供計算機(jī)視覺AI技術(shù)的便是騰訊優(yōu)圖實驗室。一直以來,作為騰訊消費互聯(lián)網(wǎng)業(yè)務(wù)背后的“隱形 AI 戰(zhàn)隊”,優(yōu)圖為包括 QQ、微信、騰訊微視等提供技術(shù)支持,而隨著騰訊戰(zhàn)略轉(zhuǎn)型擁抱產(chǎn)業(yè)互聯(lián)網(wǎng),優(yōu)圖以計算機(jī)視覺技術(shù)為核心,專注人臉、人體、圖像等視覺領(lǐng)域的前沿研究和產(chǎn)品落地,加速與實體經(jīng)濟(jì)深度融合,在社會民生領(lǐng)域廣泛應(yīng)用。
如今,騰訊優(yōu)圖在技術(shù)研究和產(chǎn)業(yè)落地“兩條腿”支撐下,通過產(chǎn)業(yè)應(yīng)用實踐對技術(shù)進(jìn)行檢驗,不斷加速產(chǎn)業(yè)數(shù)字化升級,探索如何讓AI真正惠及社會大眾,為“科技向善”加速。
快跑階段已過
多年服務(wù)C端技術(shù)積累,領(lǐng)先優(yōu)勢持續(xù)擴(kuò)大
疫情之下,小小的口罩,帶來的是安全感。然而,全民佩戴口罩也對諸如高鐵閘機(jī)等需要人臉識別的場景提出了挑戰(zhàn):戴口罩人群由于面部區(qū)域大范圍被口罩遮擋,現(xiàn)有算法無法準(zhǔn)確檢測人臉位置、定位五官關(guān)鍵點,大大降低現(xiàn)有的人臉識別算法效果。
即便戴口罩,不同場景千差萬別:誰偷偷摘下了口罩,誰戴錯了,單靠人工排查怎么減少疏漏?再比如,在高鐵閘機(jī)等需要人臉識別的場景,能不能不摘口罩實現(xiàn)人臉識別,降低感染風(fēng)險?
針對這些難題,優(yōu)圖迅速成立攻堅小組取得了突破,成功研發(fā)出了口罩佩戴識別專用AI。這套AI既能對戴口罩者實現(xiàn)人臉識別,又能發(fā)現(xiàn)口罩佩戴錯誤人員,口罩佩戴識別準(zhǔn)確率超過99%。
對于社區(qū)人員管理和排查,騰訊優(yōu)圖還能結(jié)合人體識別技術(shù)(ReID)進(jìn)行身份確認(rèn)。人體識別技術(shù)不完全依賴人臉識別,而是結(jié)合了著裝、體態(tài)、發(fā)型等特征進(jìn)行辨認(rèn)。
疫情期間,各大AI廠商紛紛推出各自的識別解決方案,甚至形成了同質(zhì)化競爭的格局。但在黃飛躍看來,事實上,企業(yè)的差距其實越來越大。
“不能只看準(zhǔn)確率,還要看識別的規(guī)模,比如是針對幾千還是幾十萬人的識別,還要識別老人、小孩等不同人群的差異,不同口罩、不同光照下的差異,還有長相相似的人群區(qū)分,這部分提升空間越來越難,尤其是針對細(xì)分領(lǐng)域,差別依然很大。”騰訊優(yōu)圖實驗室總監(jiān)黃飛躍說。
在黃飛躍看來,人臉識別已經(jīng)過了快速奔跑、粗放增長的階段,不同企業(yè)的差距不僅僅是技術(shù),還包括生態(tài)整合能力,也不只是單一的識別率問題,還包括服務(wù)客戶的能力和硬件輸出的能力。
與產(chǎn)業(yè)結(jié)合
推動企業(yè)數(shù)字化提質(zhì)增效
依托前沿技術(shù)研究,騰訊優(yōu)圖視覺AI早已走出實驗室,加速產(chǎn)業(yè)數(shù)字化升級。
這背后,是騰訊全面擁抱產(chǎn)業(yè)互聯(lián)網(wǎng)。在2018年9月騰訊組織架構(gòu)大變革之前,優(yōu)圖實驗室的工作主要集中在騰訊內(nèi)部的內(nèi)容技術(shù)中臺的打造之上,轉(zhuǎn)型后則更多的放在了通過騰訊云等業(yè)務(wù)為載體的技術(shù)對外輸出之中。
針對工業(yè)企業(yè),從供應(yīng)鏈、研發(fā)、生產(chǎn)到營銷、服務(wù)的全流程問題,騰訊優(yōu)圖的AI能力正在助力工業(yè)行業(yè)提升生產(chǎn)效率,降低生產(chǎn)成本,保證科學(xué)管理和智能生產(chǎn)。
對于華星光電來說,面板屬于精密儀器,對產(chǎn)品良率的要求非常高。但是面板一些細(xì)微瑕疵非常微小,不容易被檢測出來。由于缺陷種類多達(dá)120種,在不同線路、不同產(chǎn)品上的缺陷特征又不一樣,一個質(zhì)檢員從入職到上崗,需要2-3個月的崗前培訓(xùn)才能勝任。
騰訊云結(jié)合在工業(yè)視覺的能力提供相關(guān)解決方案,通過AI算法來學(xué)習(xí)華星工廠AOI設(shè)備拍攝的缺陷照片,對缺陷進(jìn)行自動分類,給華星上線了一百多個算法模型,這背后便是來自優(yōu)圖的圖像識別算法。
“圖片檢測其實挺考眼力的,因為很多圖片看上去都差不多。”華星光電工作人員說,過去,產(chǎn)線上每天產(chǎn)生一兩百萬張圖片,每個人要看1萬多張圖片,對比傳統(tǒng)的人力判片方式,AI識別速度提升5-10倍,縮減人力50%,
華星光電高級副總裁陳盛中也感慨道,“用AI、大數(shù)據(jù)等進(jìn)行判別,最終回歸到了人的價值。實際上,用人來判別圖片,這樣的簡單重復(fù)勞動,對個人并沒有實現(xiàn)增值,相反,讓人脫身從事大數(shù)據(jù)分析,將有更大的價值”。
從生產(chǎn)流程向兩端延伸,騰訊優(yōu)圖進(jìn)一步將人工智能覆蓋整個產(chǎn)業(yè)鏈,提升管理和運作效率。在國外某知名企業(yè)的應(yīng)用中,通過圖像分析和統(tǒng)計,大型大工廠車間里的各種信息,比如不同工種的工人區(qū)域分布是否最優(yōu),貨物的擺放是否合理。這些信息會有助于管理層判斷當(dāng)前的業(yè)務(wù)流程是否合理,是否有優(yōu)化的空間,進(jìn)而提升工廠的管理和運作效率。
騰訊優(yōu)圖在為工業(yè)企業(yè)提供解決方案層面,具有“人工和自動化相結(jié)合”“通用性和定制化相結(jié)合”“公有化和私有化相結(jié)合”等三大策略,推動傳統(tǒng)制造業(yè)邁向高質(zhì)量發(fā)展。
發(fā)力新基建
助力騰訊打造”底座建設(shè)“
自新冠肺炎疫情發(fā)生以來,以人工智能為代表的新興科技,已經(jīng)從云端“落地”。與此同時,產(chǎn)業(yè)互聯(lián)網(wǎng)的快速發(fā)展在網(wǎng)絡(luò)、算力、算法和安全等方面都提出了更高要求,迫切需要進(jìn)一步加快以5G、數(shù)據(jù)中心、人工智能、物聯(lián)網(wǎng)等為核心內(nèi)容的新型基礎(chǔ)設(shè)施建設(shè)。
對此,騰訊在持續(xù)推動新一代信息技術(shù)與制造業(yè)深度融合,助力新基建的底座建設(shè)。事實上,作為騰訊頂級的AI實驗室之一,騰訊優(yōu)圖擁有超過800項全球?qū)@。在零售、金融、工業(yè)等領(lǐng)域都有非常深厚的沉淀,經(jīng)過這兩年的摸爬滾打,為各行各業(yè)積累了相當(dāng)多的案例和經(jīng)驗。
在與中外運的合作中,除了單據(jù)錄入,目前中國外運在訂艙委托、訂艙確認(rèn)件、提單樣本、發(fā)票四個環(huán)節(jié)都應(yīng)用了騰訊云OCR技術(shù),基于優(yōu)圖領(lǐng)先的深度學(xué)習(xí)算法,將過去大量需要人工操作的業(yè)務(wù)流程變成全自動化,大大降低企業(yè)負(fù)擔(dān)。
在智慧生活方面,在騰訊與步步高合作的智慧門店中,刷臉識別會員、刷臉支付均依托于優(yōu)圖人臉識別技術(shù),消費者在2秒內(nèi)即可完成支付,門店收銀效率提升了兩倍,為步步高節(jié)省30%以上的人力成本。
從人工智能在零售、物流等產(chǎn)業(yè)的快速落地中不難看出,AI與產(chǎn)業(yè)融合的趨勢愈發(fā)明顯,AI將成為各行各業(yè)降本提效的關(guān)鍵武器,助力行業(yè)升級轉(zhuǎn)型。未來,隨著5G、云、大數(shù)據(jù)和人工智能對產(chǎn)業(yè)的深入,優(yōu)圖也將繼續(xù)以技術(shù)創(chuàng)新為驅(qū)動,為各行各業(yè)提供數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新等服務(wù)的基礎(chǔ)設(shè)施體系。
【高端訪談】
騰訊優(yōu)圖實驗室總監(jiān)黃飛躍:
與產(chǎn)業(yè)互聯(lián)網(wǎng)結(jié)合發(fā)揮更大價值
12 年前,黃飛躍從清華大學(xué)博士畢業(yè),隨即加入騰訊剛成立不到一年的騰訊研究院,帶著 5 個人的小組,第一個項目是做一款名為“QQ影像”的桌面處理軟件。如今,這個團(tuán)隊已經(jīng)擴(kuò)展到數(shù)百人的規(guī)模,并憑借已有的技術(shù)積累與產(chǎn)品落地能力加速向To B的產(chǎn)業(yè)互聯(lián)網(wǎng)邁進(jìn)。
筆者:一直以來,騰訊優(yōu)圖以服務(wù)內(nèi)部為主,而現(xiàn)在逐步向外拓展,這背后是一個怎樣的邏輯?
黃飛躍:從內(nèi)部到外部,是一個比較順的邏輯。我們先在內(nèi)部探索,但其實對AI技術(shù)來說,外部才是很大一個市場,我們需要尋找更大的價值,而伴隨著騰訊向產(chǎn)業(yè)互聯(lián)網(wǎng)邁進(jìn),優(yōu)圖的核心技術(shù)也開始以業(yè)務(wù)形態(tài)來對外輸出。
筆者:騰訊之前以服務(wù)C端為主,和現(xiàn)在服務(wù)B端時有怎樣的不同?
黃飛躍:從C到B端,技術(shù)本質(zhì)上來說都是相通的,C端需要一種技術(shù)運營商的思維,要求對線上客戶有實時的反饋和提高,而B端有較多都是線下場景,場景千差萬別,復(fù)雜程度也會更高,同樣是人臉識別技術(shù),到了線下就涉及室內(nèi)還是室外、白天還是傍晚等等,B端對技術(shù)和要求會更高一些,客戶可能會更傾向于穩(wěn)定性,而不是高頻率的創(chuàng)新性。
B端考慮的問題也更多,比如有些客戶對安全要求比較高,還有客戶使用的是低端攝像頭,獲取的數(shù)據(jù)分辨力差一些,那我們的算法就要在安全性、便利性等方面得到平衡,使客戶在不同的場合都能用起來。