“我想這個時代還遠沒有到來。”作為《大數(shù)據時代》的譯者,成都數(shù)之聯(lián)科技集團CEO兼首席科學家周濤認為,當前大數(shù)據應用主要是在互聯(lián)網和金融行業(yè),這些只是大數(shù)據產業(yè)的冰山一角,未來會進一步向工業(yè)和農業(yè)等傳統(tǒng)產業(yè)滲透。
不過,對于當前我國傳統(tǒng)企業(yè)來說,大數(shù)據應用常常總是“余音繞梁”,卻又難以“觸手可及”。“在傳統(tǒng)制造企業(yè)中,產品需求、生產流程、銷售渠道、售后評價依舊是傳統(tǒng)的‘拍腦袋’,尚未實現(xiàn)智慧化生產、精細化運營、個性化營銷。”周濤舉例說,比如農業(yè)領域就依然停留在粗放的耕種土地、收獲糧食和進入市場銷售模式。在周濤看來,目前我國傳統(tǒng)企業(yè)普遍面臨的大數(shù)據應用困境,多為數(shù)據存儲管理和分析挖掘的能力瓶頸。
“正是數(shù)據挖掘技術門檻高,使得數(shù)據和價值分離的問題嚴重。”數(shù)之聯(lián)董事長兼財務總監(jiān)傅彥認為,“雖然有小部分互聯(lián)網企業(yè)具備數(shù)據挖掘技術,但傳統(tǒng)企業(yè)考慮到數(shù)據安全問題,不愿意把數(shù)據拿出來。面對這些問題,我們的解決方案是:通過開放數(shù)據挖掘能力,降低傳統(tǒng)企業(yè)將數(shù)據轉化為價值的門檻,對傳統(tǒng)企業(yè)進行大數(shù)據賦能。”
如何不拿出企業(yè)數(shù)據,卻依然借助大數(shù)據賦能?
數(shù)之聯(lián)首席技術育柯介紹,數(shù)之聯(lián)在2012年成立后,為政府、企業(yè)和機構提供集數(shù)據采集、存儲、管理、分析、挖掘和應用為一體的大數(shù)據價值發(fā)現(xiàn)全產業(yè)鏈服務,重點解決數(shù)據價值挖掘、數(shù)據變現(xiàn)問題。企業(yè)的iCloudUnion大數(shù)據價值發(fā)現(xiàn)與應用創(chuàng)新平臺更強調開放數(shù)據挖掘過程,平臺上集成了100多個機器學習算法,適配到hadoop、spark等分布式處理框架,使得能夠快速處理大規(guī)模的數(shù)據。“有了這個平臺,我們可以通過托拉拽快速完成大型數(shù)據挖掘算法和模型開發(fā)工作。”他舉例說,在公司分析富士康SMT生產線上不同環(huán)節(jié)的加工數(shù)據項目中,為了解哪個環(huán)節(jié)容易導致產品不良率比較高,平臺僅用數(shù)小時便搭建起一個集成學習模型,并通過該模型,將之前進料階段準確率實現(xiàn)了大幅度提升。
“經過初級培訓的人在幾個小時內就可以完成高級算法工程師要幾周才能完成的編程工作。”方育柯說,平臺的價值在于可以幫助客戶實現(xiàn)自主的數(shù)據價值發(fā)現(xiàn)和應用創(chuàng)新能力,真正做到授之以魚不如授之于漁,對傳統(tǒng)企業(yè)進行大數(shù)據賦能。
警惕重復建設“先手棋”,產業(yè)布局需科學統(tǒng)籌
去年以來,“國家大數(shù)據戰(zhàn)略”的發(fā)展目標被寫入十八屆五中全會公報中,我國大數(shù)據產業(yè)發(fā)展明顯加快,一些大數(shù)據產業(yè)發(fā)展規(guī)劃或智慧城市項目也在各地紛紛上馬。然而,“下先手棋”的大規(guī)模產業(yè)布局是否就意味著發(fā)展領先?
方育柯注意到,大數(shù)據產業(yè)發(fā)展中存在的資源浪費、重復建設應當引起關注。一方面,很多地方在推大數(shù)據產業(yè)項目時基礎設施先行,投入大量資金建設IDC(互聯(lián)網數(shù)據中心)、IPC(工業(yè)個人計算機)等,使得國內的計算資源和數(shù)據平臺的容量遠大于需求量;另一方面,部分政府、企業(yè)在數(shù)據開放過程中,要么開放范圍有限,要么開放的數(shù)據是過于宏觀或“高度”匯總的小數(shù)據,對大數(shù)據的價值挖掘幫助有限,“這好比空有一身功夫的‘武林高手’,只能在小武館里施展才華。”
談及數(shù)據開放之于大數(shù)據產業(yè)發(fā)展的重要性,他以數(shù)之聯(lián)發(fā)展歷程為例:團隊在2001年開始做數(shù)據挖掘、機器學習的科研時,數(shù)據挖掘僅在國外少量企業(yè)應用,這階段團隊分析的數(shù)據主要是企業(yè)的結構化數(shù)據或者電子表格數(shù)據,規(guī)模一般都不會超過10萬;2006年前后,團隊與電信部門合作,通過機器學習的方式智能識別垃圾短信時,逐漸開始處理非結構化的數(shù)據,但依然是文本方式,數(shù)據規(guī)模約在千萬級別;2009年后,隨著移動互聯(lián)網、物聯(lián)網的發(fā)展,大數(shù)據概念迅速流行起來,數(shù)據量從之前的TB發(fā)展到PB、EB、ZB等,數(shù)據產生速度、數(shù)據類型、數(shù)據價值都在快速增長。
方育柯建議,地方產業(yè)布局時,在考慮后續(xù)大數(shù)據項目或者智慧城市期間,應強調數(shù)據驅動的智慧城市建設,科學、統(tǒng)籌、合理規(guī)劃大數(shù)據相關產業(yè)發(fā)展規(guī)劃,盡量依托現(xiàn)有IT設施資源,避免重復資源建設,開展輕量級的大數(shù)據解決方案,“不要為了發(fā)展大數(shù)據而發(fā)展大數(shù)據,應該本著開放數(shù)據資源、分析數(shù)據價值、創(chuàng)新數(shù)據應用的原則,推動大數(shù)據在政府和企業(yè)尤其是傳統(tǒng)企業(yè)中的有效運用。”
“大數(shù)據的核心要素是數(shù)據、技術、人才。”他認為,對于數(shù)據,可以優(yōu)先推動政務數(shù)據開放,鼓勵企業(yè)數(shù)據開放;對于技術,優(yōu)先扶持大數(shù)據技術創(chuàng)新類企業(yè),提升傳統(tǒng)企業(yè)大數(shù)據技術能力;對于人才,制定大數(shù)據人才引進策略,尤其是三、四、五線城市,因為這些地區(qū)是未來大數(shù)據的價值寶藏。