在針對(duì)的目標(biāo)市場(chǎng)方向,阿里云表示圖像識(shí)別分為生物識(shí)別、物體與場(chǎng)景識(shí)別、視頻識(shí)別等,預(yù)計(jì)2020年的總市場(chǎng)規(guī)模將達(dá)到數(shù)百億美元,應(yīng)用領(lǐng)域包括金融、安防、醫(yī)療、自動(dòng)駕駛、手機(jī)、工業(yè)、娛樂(lè)圖片、媒資等。
阿里云認(rèn)為,對(duì)于手機(jī)廠商和圖片娛樂(lè)業(yè)來(lái)說(shuō),行業(yè)現(xiàn)狀為沒(méi)有相關(guān)的技術(shù)儲(chǔ)備或儲(chǔ)備不足,核心需求包括人臉AR、智能相冊(cè)管理、圖片安全監(jiān)控等,阿里云的價(jià)值在于高性能底層核心算法;對(duì)于金融行業(yè)和安全監(jiān)控行業(yè)來(lái)說(shuō),行業(yè)現(xiàn)狀為人工圖像辨別的成本高、支付安全性低,核心需求包括身份識(shí)別、人臉支付、敏感圖片識(shí)別、客戶行為分析等,阿里云的價(jià)值在于降低人工成本、實(shí)現(xiàn)智能識(shí)別、提高識(shí)別準(zhǔn)確率、增強(qiáng)安全性等;對(duì)于電子商務(wù)行業(yè)來(lái)說(shuō),行業(yè)現(xiàn)狀為購(gòu)物場(chǎng)景和體驗(yàn)單一、人工圖片監(jiān)控力度弱,核心需求為試妝試戴、電商圖像分析、電商圖像檢索等,阿里云的價(jià)值為豐富購(gòu)物體驗(yàn)與購(gòu)物場(chǎng)景、增強(qiáng)圖片安全性等。
與電商、搜索和存儲(chǔ)等緊密結(jié)合,阿里云一站式視覺(jué)產(chǎn)品服務(wù)生態(tài)平臺(tái)的商業(yè)模式為標(biāo)準(zhǔn)化產(chǎn)品收費(fèi)、定制化方案項(xiàng)目收費(fèi)、SDK收費(fèi)以及共建分成等方式。阿里云方面表示,其圖像識(shí)別服務(wù)面向全球市場(chǎng),目標(biāo)客戶包括了行業(yè)客戶和行業(yè)ISV等。
車輛檢測(cè)刷新KITTI的新紀(jì)錄
在一個(gè)月前的5月18日,阿里云的智能視覺(jué)識(shí)別算法刷新了全球權(quán)威機(jī)器視覺(jué)算法測(cè)評(píng)平臺(tái)KITTI的新紀(jì)錄,將該測(cè)評(píng)的車輛檢測(cè)準(zhǔn)確率拉升至90.46%。在車輛檢測(cè)這一競(jìng)賽項(xiàng)目上,要求參賽計(jì)算機(jī)視覺(jué)算法能檢測(cè)出由車載相機(jī)所拍攝的車輛以及估算車頭朝向。該測(cè)試包含7千多張訓(xùn)練圖像和7千多張測(cè)試圖像,單張圖像上有車輛遮擋等真實(shí)場(chǎng)景,檢測(cè)挑戰(zhàn)相當(dāng)大。本次技術(shù)突破是由阿里巴巴iDST視覺(jué)計(jì)算研究員華先勝領(lǐng)導(dǎo)的團(tuán)隊(duì)完成,他們提出了基于區(qū)域融合決策和上下文相關(guān)的多任務(wù)深度神經(jīng)網(wǎng)絡(luò),用于復(fù)雜場(chǎng)景下的車輛檢測(cè)任務(wù),重點(diǎn)解決其中多視角、多姿態(tài)以及車輛遮擋等問(wèn)題。在訓(xùn)練過(guò)程中,還借鑒了GAN(生成對(duì)抗網(wǎng)絡(luò))中的對(duì)抗訓(xùn)練模式。
華先勝在云棲大會(huì)·上海峰會(huì)上表示,當(dāng)天發(fā)布的“圖像識(shí)別”和“人臉識(shí)別”兩項(xiàng)服務(wù)僅是阿里云的智能視覺(jué)服務(wù)中的一部分技術(shù),阿里云已將智能視覺(jué)技術(shù)集成到阿里云ET當(dāng)中,阿里云ET的人臉識(shí)別技術(shù)已經(jīng)實(shí)現(xiàn)了人臉檢測(cè)、器官輪廓定位、1對(duì)1人臉認(rèn)證和1對(duì)多人臉識(shí)別等多個(gè)功能。阿里云的視覺(jué)識(shí)別服務(wù)還包括視頻分析、視覺(jué)設(shè)計(jì)、工業(yè)診斷、醫(yī)療診斷等,將陸續(xù)推向市場(chǎng)。
此外,阿里云的智能視覺(jué)識(shí)別服務(wù)還已經(jīng)在城市大腦中落地。城市大腦是包括阿里云在內(nèi)的13家企業(yè)聯(lián)合杭州市政府發(fā)起的項(xiàng)目,旨在構(gòu)建一個(gè)城市級(jí)的人工智能中樞,其中分析視頻是城市大腦獲取信息的關(guān)鍵。以交通治理為例,城市大腦通過(guò)普通攝像頭就可以感知復(fù)雜路況下車輛的運(yùn)行狀態(tài)和軌跡,對(duì)這些數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,并基于此進(jìn)行多種智能交通優(yōu)化。