手機上的大數(shù)據(jù)(六):手機大數(shù)據(jù)的挑戰(zhàn)
通過手機瀏覽、手機音樂上的用戶舉動,我們可以看到手機大數(shù)據(jù)在移動互聯(lián)網(wǎng)利用上的威力,但同時,手機上的大數(shù)據(jù)也不是萬能的,它的發(fā)展還面臨著很多實際的問題和尋釁。
數(shù)據(jù)的稀疏性
智能手機端的App利用數(shù)以十萬計,但是每個利用中兩個用戶之間選擇的重疊非常少,如果用用戶和商品之間已有的選擇關(guān)系占所有可能存在的選擇關(guān)系的比例來衡量系統(tǒng)的稀疏性,在我們研究的幾個App數(shù)據(jù)中,稀疏度均不超過4%,其實這些其實都是非常密的數(shù)據(jù)。想想一個具有千萬級用戶,百萬級歌手的App,平均而言一個用戶能聽100首歌嗎,估計不能,所以稀疏度應(yīng)當(dāng)在萬分之一或以下的量級。
這個問題本質(zhì)上是無法完整克服的,但是有很多措施,可以在相當(dāng)程度上緩解這個問題。比如擴散方法、隨機缺省值方法、隨機選擇等。
冷啟動問題
在我們前面討論的音樂APP中,我們創(chuàng)造歌曲的籠罩只有2%左右,這個是由于大批歌曲出于冷啟動狀態(tài)造成的。這是因為新商品由于被選擇次數(shù)很少或沒有,難以找到合適的措施推薦給用戶結(jié)論。
近一個有趣的研究顯示,新用戶更容易選擇特別風(fēng)行的商品—這無論如何是一個好消息,闡明利用熱歌榜也能獲得不錯的成果。
大數(shù)據(jù)處理與增量計算問題
盡管數(shù)據(jù)很稀疏,大部分數(shù)據(jù)都含百千萬計的用戶,與此同時新用戶不停進入系統(tǒng)。數(shù)據(jù)量不僅大,而且數(shù)據(jù)本身還時時動態(tài)變更,如何快速高效處理這些數(shù)據(jù)成為迫在眉睫的問題。在這個大前提下,算法時間和空間的復(fù)雜性,尤其是前者,獲得了空前器重。一般而言,一個高效的算法,要么自身復(fù)雜性很低,要么能夠很好并行化,要么兩者兼具。
隨著參加的信息量的增多, 終每過一段時間還是需要利用全局數(shù)據(jù)重新進行計算。更先進但也更苦難的措施,是設(shè)計出一種算法,能夠保證其誤差不會累積,也就是說其成果與利用全部數(shù)據(jù)重新計算的成果之間的差別不會單調(diào)上升。
用戶舉動模式的發(fā)掘和利用
深入發(fā)掘用戶的舉動模式能更正確的抓住用戶愛好,從而有渴望做出更好的用戶體驗。譬如說在音樂APP中,新用戶和老用戶具有很不一樣的選擇模式:一般而言,新用戶偏向于選擇熱門的歌曲,而老用戶對歌曲的多樣性關(guān)注更多。
用戶舉動的時空統(tǒng)計特點也可以用于進步者設(shè)計針對特定場景的利用。舉個例子,在進行手機個性化瀏覽推薦的時候,如果曾經(jīng)的數(shù)據(jù)顯示某個用戶只在7點到8點之間有一個小時左右的手機瀏覽舉動(可能是上班時在地鐵或者公交車上),那么9點鐘發(fā)送一個電子書瀏覽的短信廣告就是很不明智的選擇。從含時數(shù)據(jù)中還可以分析出影響用戶選擇的長期和短期的興趣,通過將這兩種效應(yīng)分辨出來,可以明顯進步推薦的正確度。

多維數(shù)據(jù)的交叉利用
目前手機端的APP還出于孤立的狀態(tài),并沒有真正的完成數(shù)據(jù)買通及數(shù)據(jù)共享的地步。想象如果能夠把這些數(shù)據(jù)整合起來,特別是知道每個節(jié)點身份的對應(yīng)關(guān)系(不需要知道你真實身份,只需要知道不同APP中存在的若干節(jié)點是同一個人),可以帶來的宏大的社會經(jīng)濟價值。
舉個例子,你可能已經(jīng)在新浪微博上關(guān)注了很多數(shù)據(jù)發(fā)掘達人的微博,并且分享了很多算法學(xué)習(xí)的心得和問題,當(dāng)你第一次上當(dāng)當(dāng)網(wǎng)購書的時候,如果主頁向你推薦數(shù)據(jù)發(fā)掘的 新專著并附有折扣,你會心動嗎?所以多維數(shù)據(jù)發(fā)掘是真正有望解決系統(tǒng)內(nèi)部冷啟動問題的法寶——只要用戶在系統(tǒng)外部的其他系統(tǒng)有過運動。
目前有很多技術(shù)方法可以實現(xiàn)這種多維數(shù)據(jù)發(fā)掘,比如統(tǒng)計物理學(xué)的物質(zhì)擴散、熱傳導(dǎo)方法,機器學(xué)習(xí)的遷移學(xué)習(xí)方法都有望解決這種多維數(shù)據(jù)發(fā)掘。

結(jié)論與展望
由于移動互聯(lián)網(wǎng)的迅速崛起,讓互聯(lián)網(wǎng)大數(shù)據(jù)變得更為多樣、豐富。它不但可以作為互聯(lián)網(wǎng)大數(shù)據(jù)的一個有益補充,而且還可以作為移動互聯(lián)網(wǎng)新業(yè)務(wù)本身的舉動領(lǐng)導(dǎo)。
在市場營銷領(lǐng)域,數(shù)據(jù)可以用來洞察客戶,例如衡量他們的生命周期價值或者預(yù)測可能的購置舉動。對于全部企業(yè)而言,利用數(shù)據(jù)進行分析和應(yīng)對的能力,對于進行正確的決策并 終取得更好的事跡是至關(guān)重要的。
真正實現(xiàn)“精準(zhǔn)營銷”需要底層海量的用戶舉動數(shù)據(jù)做支撐,網(wǎng)絡(luò)營銷尋求的都不應(yīng)是曝光率,而是用戶轉(zhuǎn)化率。而對用戶轉(zhuǎn)化過程進行有效的數(shù)據(jù)分析,可實現(xiàn)效果的優(yōu)化。效果可從三個層面分解:目標(biāo)是否明確、向過程要效果, 終目標(biāo)達成率就是效果。利用數(shù)據(jù)工具把持和優(yōu)化營銷過程,可不斷提升ROI效率。
這需要具體懂得客戶的業(yè)務(wù)發(fā)展目標(biāo)和推廣需求,可以考慮借助專業(yè)的第三方服務(wù)公司作有關(guān)于網(wǎng)絡(luò)營銷策略的效果評估。以制定出或調(diào)劑有關(guān)于網(wǎng)絡(luò)營銷策略。
一般來說,對于不同的營銷平臺會有不同的廣告情勢投放,從而產(chǎn)生的效果也多種多樣,各家說各家的好。網(wǎng)絡(luò)營銷中,品牌認知、提升偏好、主動尋找、購置轉(zhuǎn)化、分享/再購各階段,分辨對應(yīng)廣告管理、口碑、網(wǎng)站、電商、客戶管理的營銷策略。以“大數(shù)據(jù)”貫穿網(wǎng)絡(luò)營銷全過程,就可將有價值的數(shù)據(jù)轉(zhuǎn)化為有意義的數(shù)據(jù),讓廣告從效果監(jiān)測變?yōu)樾ЧA(yù)測、讓流傳更有效率、用戶體驗更佳,用戶轉(zhuǎn)化更明確、可控。
讓我們一起隨著手機上的大數(shù)據(jù)一起“爆發(fā)”吧。
相干瀏覽:
手機上的大數(shù)據(jù)(一):移動互聯(lián)網(wǎng)的入口
手機上的大數(shù)據(jù)(二):手機大數(shù)據(jù)的特點