PS:我是一個數(shù)據(jù)挖掘工程師,我不是PM,我是一個無證Data Scientist,我熱愛大數(shù)據(jù),希望大數(shù)據(jù)能夠給企業(yè)帶來價值,我為自己代鹽。
其實移動互聯(lián)網(wǎng)、大數(shù)據(jù)已經(jīng)不單單是一個IT的概念了,它更多的是一個改變人類生活方式的產(chǎn)業(yè),而且誕生了一個新的名詞O2O。O2O被譽為未來一個萬億市場規(guī)模的行業(yè)。O2O企業(yè)本質是傳統(tǒng)行業(yè)的互聯(lián)網(wǎng)化或者說用互聯(lián)網(wǎng)的方法改造傳統(tǒng)行業(yè),那么本質上解決的問題和傳統(tǒng)行業(yè)沒有區(qū)別,還是人們日常生活息息相關的衣食住行等問題。例如通過電商買衣服和生活用品,通過微信解決朋友之間通信的需求,團購買餐飲,嘀嘀打車,網(wǎng)上買機票和火車票,支付寶交水電煤氣費,余額寶理財,甚至一度被叫停的醫(yī)院掛號等。要做的事還是一樣的,只是做事的方法不一樣,目的是讓用戶的生活更加便利。那么什么樣的玩法更受用戶歡迎呢?過去傳統(tǒng)企業(yè)或者靠領域知識的傳承,或者是靠用戶問卷調查的形式反饋的,顯然周期長、反應慢、服務內容和服務方式跟不上時代的發(fā)展和用戶的需求。而經(jīng)過互聯(lián)網(wǎng)化之后,所有的用戶行為都被記錄和存儲下來,我們可以快速精準的分析和挖掘出用戶的需求變化和每一個用戶的個性化需求,從而給每一個用戶制定不同的服務策略。
我們都知道,領域知識是一個人在某個行業(yè)安身立命的本錢。過去傳統(tǒng)行業(yè)的領域知識是靠在行業(yè)內不斷摸爬滾打積累出來的,而互聯(lián)網(wǎng)化之后的這些行業(yè)的領域知識將是從海量的用戶行為數(shù)據(jù)中分析和挖掘出來的。過去的傳統(tǒng)企業(yè)一旦確立了領導地位,那么被同行業(yè)的其他企業(yè)顛覆的可能性是比較小的;而互聯(lián)網(wǎng)化之后的這些行業(yè)中,從海量用戶的行為中挖掘出的領域知識的時效性是非常明顯的,一旦一個企業(yè)不能夠與時俱進將很快被別人超過去。舉個例子來說,著名的“啤酒和尿布”的故事在最開始的時候會給相應的企業(yè)創(chuàng)造價值,但是當同行業(yè)內其他企業(yè)也學會了這招之后,這個就不是一個利潤增長點了。那么企業(yè)就需要不斷的挖掘新的利潤增長點,這個時候海量用戶數(shù)據(jù)的價值就會體現(xiàn)出來。未來全面互聯(lián)網(wǎng)化的時代中“三天不學習,趕不上劉少奇”這句話就會有深刻的體會。所以像Coursera這樣的在線教育平臺會非常有前途,因為僅僅靠十幾年的學校學習已經(jīng)不能滿足一個人一生的知識和能力的需求,未來是個終身學習的時代。很多大佬們也看到在線教育這塊大蛋糕了,都開始跑馬圈地。
那么對于一個企業(yè)來說如何讓大數(shù)據(jù)發(fā)揮出價值,推動企業(yè)業(yè)績的增長呢?我想首先需要考慮的一個重要問題就是:你的企業(yè)是一個平臺還是一個垂直行業(yè)?
平臺就好像淘寶、京東、騰訊,上面的商品或者服務的種類非常非常多,而且不同商品或者服務的特點可能差別很大,同時對用戶數(shù)據(jù)的積累是多方面的;垂直行業(yè)就是類似攜程、聚美優(yōu)品,上面的商品或者服務是某一個垂直領域的,只有當用戶在這樣的垂直領域有所需求或者感興趣的時候才會光顧,那么一般情況下你只能得到用戶在這個領域的一些數(shù)據(jù);不過這里面有個灰色地帶,就是互聯(lián)網(wǎng)金融。因為從本質上講這是個垂直行業(yè)(金融行業(yè)),但是想到金融行業(yè)在人們日常生活中的重要性,我們單單從一個垂直行業(yè)的角度來衡量這個用戶的價值顯然是不夠的,因為金融影響到人們的方方面面。
對于大數(shù)據(jù)從業(yè)者來說這三種類型的企業(yè)在利用大數(shù)據(jù)的過程中是有很大的不同的。舉個簡單的例子,在對用戶進行細分或者用戶畫像的過程中,如果一個用戶有好幾個月沒有買東西,那么怎么界定這個用戶是否流失了呢?仔細想想,如果一個用戶好幾個月沒有在淘寶、京東上買東西,那么顯然是流失了;但是如果沒有在攜程上買東西,未必能認為他流失了。因為用戶對旅游類產(chǎn)品的平均購買周期可能就有好幾個月,所以顯然單單是這樣一個因為未必可以把這個用戶標定為流失。
對于不同的企業(yè)在利用大數(shù)據(jù)的方法上也是不一樣的:
像阿里巴巴的目的就是做基礎設施,像自來水公司、煤氣公司、電力公司這樣人們生活中必不可少的一部分,也就是所謂的“剛需中的剛需”,所以阿里巴巴整合了多個部門的廣告團隊成立了阿里媽媽。京東在這方面也不甘示弱,一直養(yǎng)活著獨立DSP服務商MediaV,而且兩家企業(yè)不斷傳出收購緋聞。騰訊的廣點通也是這方面的典型代表。阿里巴巴、京東、騰訊的共同特點就是解決了用戶的剛需,成為了用戶每天生活中必不可少的一部分,然后培養(yǎng)起一系列的產(chǎn)業(yè)鏈。
阿里和京東解決了用戶購買商品的需求,騰訊解決了用戶通信和社交的需求,而且提供的服務都是免費的,這樣用戶把自己的一些數(shù)據(jù)不知不覺中就送給了這些平臺級企業(yè),這些企業(yè)就可以利用這些大數(shù)據(jù)分析出用戶的年齡、性別、興趣偏好、收入水平、家庭構成等跟消費密切相關的特征,從而成為一個廣告上的目標客戶群體,把這些用戶買個廣告商。這是這些平臺級企業(yè)賺錢的主要方式,說白了就是拉皮條的。而且隨著互聯(lián)網(wǎng)金融的興起,一旦這些平臺廠商了解了和你相關的數(shù)據(jù)越來越多,那么就可以給你推銷一些金融產(chǎn)品(典型的例子就是余額寶),從而控制你的個人金融體系,這些平臺可以像銀行一樣吸納你的存款用于投資。
這才是第一步,在金融機構最重要的風險防范體系中,由于這些平臺廠商知道你交水電費很及時,剛剛買了一輛車,最近又沒怎么生病掛號,而且還定期出國旅游。那么顯然你是一個優(yōu)質客戶,不需要你提供任何證明來抵押貸款給你的風險。這個就是互聯(lián)網(wǎng)金融/大數(shù)據(jù)金融的玩法。那么對于垂直類企業(yè)(包括互聯(lián)網(wǎng)金融)該怎么使用大數(shù)據(jù)呢?
垂直類企業(yè)特別是傳統(tǒng)企業(yè)的最大特點就是在自己的CRM系統(tǒng)里面有用戶大量的高質量數(shù)據(jù),這個是像上面的平臺級企業(yè)所不具備的。典型的例子就是像電信、金融這樣的企業(yè)擁有質量非常高的用戶金融數(shù)據(jù)、交易數(shù)據(jù)、關系鏈數(shù)據(jù)等,這些數(shù)據(jù)所表達出的意思是最真實可靠的。但是這些垂直類企業(yè)所積累的數(shù)據(jù)量往往沒有像前面所說的平臺級企業(yè)那么多。這個時候可以考慮通過引入第三方數(shù)據(jù)的方式來補充用戶的數(shù)據(jù),美國twitter公司的IPO文件中顯示其15%的收入來源是“倒賣”用戶的數(shù)據(jù),在國內阿里巴巴與新浪微博戰(zhàn)略合作之后也打通了微博和淘寶的用戶數(shù)據(jù),雖然很多微博用戶在吐槽這件事。數(shù)據(jù)交換首先要保證用戶數(shù)據(jù)的安全性,讓數(shù)據(jù)流動起來數(shù)據(jù)才能發(fā)揮更大的價值。
對于面向用戶的企業(yè)來說,如何利用大數(shù)據(jù)現(xiàn)在的玩法應該是比較清楚了。簡單來說就是以用戶和業(yè)務為核心,對用戶的相關維度進行數(shù)據(jù)挖掘,構建用戶和業(yè)務的屬性和特征庫,服務業(yè)務需求。具體再實施過程中還需要重點考慮以下問題:
1.以用戶和業(yè)務為核心,以思路為重點,以數(shù)據(jù)挖掘技術為輔助
企業(yè)使用大數(shù)據(jù)的目的是解決問題(說白了就是賺錢),賺錢的方法就是跟自己的business model密切相關的,也就是我們通常說的業(yè)務。在這個過程中大數(shù)據(jù)技術只是一個手段,是幫助我們解決業(yè)務問題的。所以說在大數(shù)據(jù)技術選型和架構的時候,一定要搞清楚自己的業(yè)務模式,不能別人用什么架構就跟著用,別人挖掘什么就跟風挖。
2.小步快跑,快速迭代,持續(xù)優(yōu)化
千萬別想著一次就搞出個大新聞,在互聯(lián)網(wǎng)領域永遠是beta版的,只要這次比上次好就行了。大數(shù)據(jù)的思想就是把現(xiàn)實世界中的現(xiàn)象用數(shù)學的形式表示出來,分析和挖掘這些現(xiàn)象之間的關系,并且能夠定位到哪些群體具備哪些特征,哪些特征會影響企業(yè)的盈利。所以很多問題并沒有或者需要嚴謹?shù)臄?shù)學證明,我們重點關注的是關聯(lián)關系而不是因果關系。
在大數(shù)據(jù)時代,ABtest是非常重要的,很多現(xiàn)象是不需要理論證明的,ABtest會告訴我們該怎么改進產(chǎn)品,哪些產(chǎn)品的哪些特征更受用戶歡迎。
3.用戶的反饋很重要,要積極調動用戶的參與度
傳統(tǒng)的調動用戶參與度的方式就是發(fā)優(yōu)惠券或者促銷券。這種方法在有些情況下是有效的,有些情況下可能需要更深入的了解用戶的需求,例如用戶為什么來我們這個平臺?為什么流失了?舉個例子來說吧,對于有些用戶來說你給他發(fā)了10塊錢優(yōu)惠券,但是他沒有買的需求或者找不到他想買的東西,那么他不會因為這10塊錢的優(yōu)惠券去制造一個需求?;蛘哂行┯脩艨赡鼙容^有錢,每次買東西都是大手筆,你給他10塊錢優(yōu)惠券可能他根本看不上。用戶細分模型可以幫助我們針對不同的用戶群體采用不同的調動用戶參與的方式。
大數(shù)據(jù)是幫助我們補充行業(yè)知識的一種重要的方式?,F(xiàn)在越來越多的行業(yè)是數(shù)據(jù)驅動的,那么這個行業(yè)的很多行業(yè)知識都是通過大數(shù)據(jù)挖掘出來的。而獲取這些數(shù)據(jù)的主要方式就是用戶的行為和對運營動作反饋的挖掘,這也是未來以數(shù)據(jù)為核心的企業(yè)的價值所在。
4.從運營驅動到數(shù)據(jù)驅動
關于誰來主導大數(shù)據(jù)服務用戶這個需求,其實有很多的使用場景。例如一個推薦系統(tǒng)由產(chǎn)品經(jīng)理來主導比較合適;對于一個數(shù)據(jù)化運營系統(tǒng),那么從事運營或者市場相關的人員來主導會是比較合適的。對于很多大公司來說,慢慢會發(fā)展出專門從事數(shù)據(jù)驅動業(yè)務的部門和人員,例如我們經(jīng)常提到的Data Scientist的概念。
5.業(yè)務人員和數(shù)據(jù)挖掘人員的密切配合
這個也是我們大部分公司經(jīng)常遇到的一個問題:做業(yè)務的不太懂技術或者數(shù)據(jù),做數(shù)據(jù)挖掘的對業(yè)務又不是特別了解,目前社會上最缺的就是既懂業(yè)務又懂技術的。如何把數(shù)據(jù)挖掘的結果應用到業(yè)務中是個比較難的問題,我們常說沒有數(shù)據(jù)是無價值的,只是要找到它發(fā)揮價值的地方。因為數(shù)據(jù)挖掘的結果往往表現(xiàn)出的是用戶在某一方面的屬性或者特征,那么在實際業(yè)務中用戶的行為往往受到多個因素的影響,所以在把數(shù)據(jù)挖掘的結果推廣到具體的業(yè)務過程中要和業(yè)務方密切合作,找到合適的促銷方式、展位、文案、刺激手段、效果評估方法等。
大數(shù)據(jù)的范疇內我們應該把用戶還原成一個人,而不要割裂的看他的某些行為,而要把這些行為和他的社會學屬性、生活背景、活動時間、地點、氣候因素和應用上下文聯(lián)系起來。目前的大數(shù)據(jù)Ecosystem沒有一個很好的BI工具,給對應的分析師或者挖掘工程師帶來了很大的難度。
6.與客戶的溝通方式(運營手段)很重要
現(xiàn)在社會大家都很忙碌,像過去那種通過call center給用戶打電話推銷的方式的效果越來越差,因為用戶很忙碌的時候是不希望被打擾的。那么異步通信的需求就比較強烈,典型的應用就是微信,可以很好的利用碎片時間,那么對于企業(yè)營銷來說也是非常好的通道。同樣對于企業(yè)給用戶的各種促銷或者運營手段的時機也會比較重要,而且不同興趣偏好的用戶的瀏覽和購買時間最好也要區(qū)別對待。
同時運營活動設計的巧妙程度、文案和展位比大數(shù)據(jù)技術可能會發(fā)揮更重要的作用。聽過一個真實的例子,某公司的推薦系統(tǒng)在模型完全沒有改變的情況下只是改了下展位的位置,導致最后的下單率有明顯的提升。
7.大數(shù)據(jù)帶來的價值如何衡量
企業(yè)養(yǎng)了一個大數(shù)據(jù)團隊,那么對這樣的團隊怎么衡量他們帶來的價值呢?例如天貓雙十一的交易額有350億,那么這350億中有多少是通過大數(shù)據(jù)來提升的?
我覺得大數(shù)據(jù)的短期回報是精準營銷,而從長期的角度來看對于一個企業(yè)或者平臺來說更重要的是客戶關系維護,增加用戶的粘性和購買力,從而使得用戶很難遷移到其他平臺上,那么對于你這個企業(yè)來說就有點類似于壟斷了,就屬于躺著都賺錢了(就像現(xiàn)在的可口可樂、寶潔類似的公司)。所以說大數(shù)據(jù)的價值可以在產(chǎn)品的各個層次得到體現(xiàn),而具體價值的衡量也要因不同的業(yè)務模式而有所不同。同時大數(shù)據(jù)也幫助企業(yè)更好的理解這個行業(yè),建立起行業(yè)的壁壘,從而更好的支撐管理者的決策。