秦雯講大數據:心動.幡動.風動
我想因為今年我覺得是傳統媒體,或者說媒體行業發展,中國的媒體行業發展比較特殊的一年。有幾個大的市場因素在變化,第一個大的變化是政策因素,應該說政策因素對傳統媒體是向好的,在這一塊兒在座的所有的各位都比我解讀的要深,我就不展開講了。第二個因素實際上是一個多屏化對媒體帶來的多渠道的機會,我覺得這個是越來越成熟了,雖然不是今年出來的,但是我們看這兩年隨著移動,未來還有越來越多的終端出現的時候,我覺得對媒體本身是機會,第三個因素就是我們今天,下午重點要分享的,就是大數據。所以我今天的這個演講主題的話,我借用了否較上的一個公案,我們做媒體的都是文化人,應該比我更了解這個故事,佛的《六祖壇經》所講的,我們在面臨技術變化的時候,我們只是順應客觀環境的變化而隨波逐流,還是我們要主動的積極的擁抱這樣的變化。
風動代表客觀上的形勢,幡動代表我們企業的行為,心動是什么?心動代表決策者的思想和意識。所以我今天的演講的話,也是分這三個方面,我們先看一下大勢。
大勢的話,現在的環境,可能我們每天早上起來,打開媒體,無論是我們自己家做的,還是行業里的其它媒體,無論是通過什么樣的終端去分享,或者說去瀏覽新聞的時候,逃不開的這三個字,或者說這個詞,就是大數據。我引用了一個注解,這個注解的話是我上個月在北京的一個行業活動上,360的首席架構師講的,我覺得非常的精辟。就是說“未來不會用大數據的企業,就像不會用電的企業一樣可笑!”這說明大數據對每一個企業,它不是一個輔助性的,或者是包裝性的,這樣的工具,它是什么呢?它是你將來賴以生存的技術,像電和水一樣。
那談到大數據的話,我還是花一兩頁PPT講一下什么是大數據?在這個活動之前,我們和主辦方國際在線也一起合作,就今年參會的嘉賓,做了一個小小的問卷調查,然后讓嘉賓填寫你認為什么是大數據?我看了一下結果,這個答案是五花八門的,占的比例比較大的,一個說大數據就是海量數據,就是規模比較大的數據,還有一個的話是說大數據就是數字化了的信息。所以我想的話,還是有必要稍微就大數據的概念,跟大家做一些分享。這個也是我們一家之言,但是我想對我們所有的媒體,尤其是在做互聯網媒體、網絡媒體的,可能這樣的定義的話是最契合大家的。
所以從我們自己的業務體會來講的話,我們把大數據定義成全樣本、全方位、全過程、全天候的這樣一個業務過程記錄,這個叫大數據,這個記錄收集的前提是互聯網。怎么這么講?我們舉一個例子,媒體收集數據比電商還要簡單。我們看傳統的商業環境,在商場,如果我們想知道一個人。通過我們的廣泛推廣我們的宣傳,然后進到這個商場,在商場里逛來逛去,挑選商品然后購買商品,最后出去。
我們要想知道這樣一個人進到商場里的過程,在傳統的線下商場,這樣的數據是很難收集的,但是如果在互聯網上,我們把整個這一系列的過程,把這樣的數據收集下來,對互聯網平臺,我經常說成本,單個用戶這樣的數據收集成本,幾乎可以為零,幾乎可以不計。所以在這個意義上,我們可以說每一個互聯網應用都是大數據平臺。大家平時可能會覺得,我的網站很小,按我們現在大概的水平,一般綜合性網站,尤其是傳統媒體背景的,一天的流量可能是百萬級、千萬級,到了一個區域性媒體,一天的流量小的有幾萬,大的有幾十萬。我們這樣的平臺似乎沒有大數據,大數據只有BAT(音)三家才有,他們是大數據企業,大數據跟我們沒有關系。但是我們來看,如果我們從這樣的角度來看大數據,其實只要你的業務是在線的,你就有大數據。我經常說大數據的量大,它不是因,它是果,是因為我們在業務過程當中,能把業務進程的每一個細節數據都收集起來,所以最后它產生的結果是量很大。
一個相對比較小的媒體或者平臺,他可能一次收集的量不足夠大,但是如果我們去樹立這樣的意識。我們從我們的產品上線第一天開始,就收集這樣的過程數據,一直延續下去,7×24小時的不間斷的收集,我們還是可以積累相當大的數據的。大數據,并不在于它的量大,在于我們反映出的細節變化,所以量大不是大數據的比有特征。這是我的觀點,所以這是講大數據的。
那我們來看一下這個用戶行為的過程,它的數據長什么樣?我們來看幾類,這幾類都是締元信公司,我們每天在互聯網上通過為客戶提供服務收集回來的。
首先第一個,也是最傳統的,就是頁面訪問的數據,我不去解讀這一串代碼里面的含義,它基本上包含了我們對這個用戶所點擊的頁面,對這個用戶的時間等等維度的一些信息,當然這樣的數據需要處理以后才可以用。所以大數據的第二步我們是需要數據平臺的,這是后話,這是一類。第二類是我們在移動端的所有產品的數據,這就是一條行為數據。
第三類我們看用戶在各個頁面的位置點擊的數據。視頻播放,視頻播放的數據,我們可以收集到,我們可以采集到,他什么時候停的,是不是有緩沖。
鼠標軌跡,就是用戶用鼠標在頁面上滑動這個軌跡。當然如果從移動端的話,可能就變成手指的軌跡,我在選哪個,我的手指更多的是停留在什么地方?這個數據更重要是看,我們頁面內容,對用戶的吸引程度。
最后是廣告點擊,對吧?這個廣告給多少人看了,有多少人點擊了,甚至包括如果我們的數據采集范圍足夠大的話,這個廣告被用戶看完、點完,進入目標網站他的種種行為,可以把這樣的數據串起來分析。
除了這些以外還有更多的數據,我們看一下,基本上只要是我們在線狀況的所有交互行為的記錄,甚至包括現在的一些可穿戴設備,可能它通過特別的機制,可以記錄你的情緒的,可能未來我們每個人的喜怒哀樂這樣的情緒很容易的被采集下來。
當然我們展望未來進一步發展,大家可能也聽到過這個詞,現在有一個詞既不叫互聯網也不叫移動互聯網,也不叫物聯網,叫什么?叫萬聯網。如果在這樣的狀態下,我們看從現在我們已經不能離開的,變成了我們自己身體一部分的各種手持的移動的終端,到正在流行起來的可穿戴設備,下一步發展會是什么?下一步發展會是汽車也會成為一個上網終端。行業里面有人形容,說特斯拉不是汽車,是安裝了四個輪子的iPad,所以汽車未來可能也會成為上網終端,到我們家居環境的所有的物體,到我們所生活的城市的所有的設施,最后到整個地球。
我們看所有我們人類生存環境的這樣的一些設備,就處于在線的狀態,當然在這樣的一個大的,在線情景下的話,我們說所有的事務都是數據化的,甚至最終也許我們人也會數據化,我們人本身也會成為一個上網終端。那這是技術未來的趨勢,我們不在這里做更展開的想象,我是比較相信這個的,這一天終會到來的,就像美國科幻片,最后是機器人把自然人趕在某一個角落,苦苦的掙扎,這個世界被機器人占住了。
這位號稱互聯網風水先生的老先生,他從十幾年前就開始語言技術的改變,之所以十幾年后在中國受到重視的話,是因為十幾年以前他對技術發展的未來的預見,現在都已經變成現實了。
這一段話是他前幾天我在網上看到的,他在斯坦福大學的,又是一個預言,預言技術會進一步怎么改造我們這個社會。這里面我摘了兩句話,第一個“未來你不管做什么,你做的都是數據。數據是要流轉才能產生價值的。”這個流轉是什么?流轉就是交換和應用,因為它是要用起來它才會流轉。所以這是我們看相對比較超前,也比較精辟的一個總結。
所以在剛才前面講了,在這樣的大的含量下,企業要怎么辦?或者說我們現在的網絡媒體,我們尤其是傳統媒體,在整個轉型過程當中,要怎么辦?第二個的話我們說是幡動,我們企業要做什么樣的事情應對這個挑戰?抓住這個機會。我也寫了一個注解,這個是我自己總結的,我們自己看這二十年來,工業發展史我們就不去分析了,我們就看這十幾年,將近二十年的互聯網發展史,每一次的技術革命都讓一些既得優勢,就是在這個時候成功的企業,重新歸零,所有人又站在同一個起跑線上。最后的贏者是什么?是面向未來的人。這句話聽起來似乎很抽象很拗口。
我們拿一個例子看一下,這是中國的網絡媒體一個演化的過程,我把它分成三個大的階段。
第一個階段是圖文時代,這個時代的主要特點是圖文傳播,專業制作和傳播,還是像傳統媒體一樣,我有編輯團隊,我有媒體平臺,做一對多的單向傳播。這個時代最成功的模式就是門戶,綜合門戶,我們說四大門戶、五大門戶這是最成功的。當然我們傳統媒體,我們國內的傳統媒體也是在這個時代,進入互聯網行業對吧?
第二個階段我們叫社會化和視頻化的階段,它的特點是用戶制作和分享為主。
這個階段之后就到了我們現在所處的階段,移動化、自媒體化、電商化。我說自媒體的概念,大家不要說我是說以個人為單位的,或者是邏輯思維叫自媒體,不是的。我們每一個傳統媒體,在互聯網通過微信、微博這樣的社會化平臺,在傳播我們的時候,我們每一個傳統媒體,作為一個擁有品牌標識的這樣的媒體,它也是自媒體。這個區別跟1.0時代,以門戶的頁面模式傳播的一個最大的區別,是我們的品牌被保存下來了。實際上在1.0時代,用戶通過門戶網站去看新聞的時候,他是不關心這條新聞是誰生產的。他在新浪上看到了國際在線的一條新聞,他覺得寫的挺好的,他會把這朵花給誰?給新浪的,他會認為新浪上面有好內容,不會認為是國際在線發的。所以我認為傳統媒體的品牌是被削減的,大家越來越不知道你是一個媒體,大家會認為新浪是一個媒體。能讓我們傳統媒體以自由品牌的形式,在互聯網上做這種傳播,或者去運營自己的媒體。所以在這個意義上來講,社會化平臺,其實是救了我們傳統媒體。
當然美國的情況跟中國不一樣,不像中國綜合品牌這么集中,所以很多的傳統媒體,在互聯網上的認知度還是比較高的,但中國這一點不一樣,這是中國的特色。所以我們看整個這將近二十年,看看有哪些逐漸被淘汰了,這個淘汰不是死的概念,要不然就理解錯了,所謂的淘汰,它原來可能是市場的影響很大,站在市場的最高點,慢慢的退到了相對比較低的位置。我們看可能比較熟悉的門戶網站,像TOM網現在很少有人提起來了,我們也很難聽到它的聲音了。
這些垂直網站在90年代都是風頭慢慢的,到今天我們看已經沒有他們的力量了。飾品分享網,我們看土豆網,當然人家跟優酷合并了也挺好的。我們看哪些網站是趁著技術革新,技術變革的大勢它們脫穎而出。這個很有意思,百度在搶誰的市場份額?天涯對不對?百度貼吧搶的是天涯的份額。
我們碰到很多傳統媒體,或者是網絡媒體,現在正在運營的這些傳統媒體的網絡媒體,很多人很悲觀,就覺得現在這個商業性網站,他們的市場影響力,他們的動作這么大,市場上好像沒有我們的機會。我們先跳開操作層面的問題,從本質上來講,每一個技術變革,對每一個人都是有機會的,只不過就是你有沒有能力抓住這個機會?
展開講我們應該怎么應用大數據抓住這個機會的同時,我們先典型的分享三個案例。第一個案例是我們給我們的客戶做的,用大數據來預測媒體用戶和廣告的適配性。我們作為一個媒體平臺,我們應該去找什么樣的廣告,廣告效果才好,我們的用戶也愿意看。
我舉一個例子,我在行業里也講了有一年多了,但是還是挺有典型意義的。我們這個客戶是一個紅酒的的零售商。他的銷售就是靠在網上做廣告推廣,帶來用戶到他的平臺上來買紅酒,他之前用傳統的方法做市場研究,結論是愛喝紅酒的人,一般都是什么呢?都是時尚人士,這個結論出來以后,他基本上就是找時尚類網站投廣告,這個廣告平均的用戶轉化率是0.53%,在這之前也覺得不錯了,說實話確實也不錯,因為轉化率要到這么高也確實不容易。后來一年多以前,我們給他提供數據挖掘服務,通過對用戶行為的挖掘,發現經常買紅酒的用戶,最愛看的是軍事網站,為什么不管,表現出來的相關性就是這樣的。這個里面就落到了,很多說大數據的時候,大數據主要是分析相關性,我相信第一步就是這樣的,這就是一個相關性典型分析的案例。
當時出來結果客戶也半信半疑,我們就說試一下吧,我們把我們的一個客戶,媒體客戶有軍事頻道的介紹給這個廣告客戶,讓他把廣告投到這個媒體這里。結果讓所有的人大跌眼鏡,轉化率高達9.01%,也就是把他原諒的方案轉化率高出了17倍。我們可以通過大數據的挖掘,去預測一個媒體,它和商業客戶的適配性,這樣來指導媒體去有針對性的開發客戶,最大的去發揮媒體的價值,和他自己客戶的服務的能力,機遇這個的話,我們就做了一個產品,叫網站用戶分析畫像,這個稍候會介紹的。這是一個典型的通過大數據挖掘,應用到需體這一端,當然同時也可以幫助廣告主更高的找到他的渠道,兩端的一個例子。
第二個例子就是我們今天發的報告,今天上午大家開大會的時候,都在桌子上看到了我們這份報告。
這個報告的話我想稍微展開解釋一下,它是怎么做出來的?它的數據可靠不可靠?這個報告我們叫大數據分析網站內容的傳統影響力,我們是以百度新聞為線索,因為百度收錄的新聞是主流的主體的,如果沒有被百度收集的話,談不上這個新聞有影響力度。把帶有發稿來源的新聞,把它抓回來,抓回來以后,去對每一個頁面,對每一條新聞,用我們的知識庫去給它打上標簽,它是數一哪一類的?是屬于財經的,還是屬于港澳臺的,還是屬于社會新聞,大家看到的等等的,這個是打標簽。再疊加上我們平臺所覆蓋的網站,這些新聞在我們所覆蓋的網站所產生的流量。我們的平臺因為覆蓋了國內的重要的商業媒體網站,大家能數得出來的這些大的媒體網站,他們的數據都在我們的平臺上,所以這個瀏覽量的數據是有代表性的。
通過這樣的數據處理以后,我們用了兩個指標,這篇文章的轉載規模,反映了傳播力,這篇文章被用戶瀏覽的數量,反映了這個網站對網民的影響力。這個里面有差別的,我們知道可能在原來傳統的報紙的時候,因為沒有這個條件和能力去了解,用戶把報紙買回去以后,具體看了哪個板塊。所以我們通常把我們媒體的業績,落在哪里?落在發行量是吧?你的發行大的話就是做的好,當然傳統的要花錢的話,比其它的也或多或少可以說明這一點。但是因為在互聯網上,我們的信息傳統是以一條新聞為單位的。所以我們能夠知道每條新聞被多少用戶看了,所以你的傳播量大,并不代表你的效果好。說我這篇文章一發出去,有很多的媒體都轉載了,但是用戶真的看了嗎?不一定。
我給大家舉一個例子,這個事情發生的特別早,可能在五六年以上。有一家大的保險公司,他們的高管出了什么事兒?工資事件大家還記得嗎?這家保險公司的公關公司是梅濤的朋友,知道我們跟網站的關系好,找我們幫他鏟稿,因為是朋友嘛。我們就說你把你想刪的內容,把那些鏈接發過來我們看看,發過來之后當時一共是120條。這120條里面有60%,就是將近70條左右的話,是在我們覆蓋的這些網站上有數據的,我們把這60多條放到我們的平臺上跑了一下,把它的瀏覽量跑出來。最后發現PV大于10的鏈接一共才多少條?一共我記得好像才十幾條不到二十條,這個就是所謂的傳播量和影響力的區別。當然我們后來反饋給這個公關公司的建議是,其實這個20條你就去處理了,剩下的100條你是不用管的,因為它一共才產生了一到幾個PV,尤其是在博客上,那些PV作者多點幾個就出來了,他雖然發了但是并不產生影響力。這是篇報告要傳遞給市場的主要的信息,當然這個報告還是有不足的地方,我們只是在Web1.0的網站上做的一個評價。未來我們希望建立一個模型,從傳播量、瀏覽量,包括在社會化媒體的傳播情況,包括在移動端,甚至是網民對這個網站的評論,我們都可以收集回來,建立一個比較完善的模型。因為我們的傳統媒體大部分都是做原創內容的,我們的內容在互聯網上的傳播效果。
第三個案例是我介紹六家,其中有兩家是國內的,有四家是美國的。
有些已經比較有年頭了,比如說潘多拉,它已經火了很多年了,到現在還是美國最大的音樂網站。因為版權都是唱片公司的,它做了一件事情,就是給每一首歌打了非常細致的標簽,而且是不同維度的,把這個標簽體系建立起來以后。它就可以根據這個用戶的歷史行為,他以前愛看什么,做什么?做一些個性化的推薦,讓每一個用戶用潘多拉的時候,都可以以最快的速度找到自己想要的音樂,聽到自己想聽的歌。它的業務的本身的核心就干了這樣的一件事實,打標簽這件事情就是一個大數據處理的關鍵環節。類似的其實國內已經有了,類似的國內的網易云音樂,國內市場的占有率很高/,他們怎么做的?就是像潘多拉做的。說是網易為什么做云音樂?說是丁磊愛聽音樂,但是所有的平臺都不能滿足他的需求,那我干脆自己做一個吧。這個代表什么呢?就是用戶體驗的代表,但是丁磊的體驗來做的產品,它的評價一定是好的。
再一個案例,大家也都知道,今年沸沸揚揚的今日頭條,它自己不生產內容。它的廣告詞“我們是新聞的搬運工”它不是簡單的把新聞扒了下來,一樣的做了什么事情?它的底層是依托每一個用戶在新浪微博上的行為,它為每一個人建立了個性偏好的一個組合。用今日頭條客戶端的用戶,他的偏好,它給他推送他可能感興趣的新聞,最后也是落在個性化推薦。就是第一時間讓用戶,獲得他想要的信息,這是今日頭條。
那第三個網站,是美國的一個汽車網站TRUECar,這個網站的話非常有意思。整個網站的話,它就做一件事情,它做什么事情?它做價格預測。它管什么呢?管每一個想買車的用戶最后一個環節,就是我已經選好我要買哪款車了,最后哪一個4S店,哪一個經銷商給的價格最低,就拿著這個價格跟經銷商談,然后把車買了。它是怎么做到可以做價格預測的?它是把全美汽車經銷商的銷售數據庫給買回來,買回來在這個銷售數據庫上建了一個什么?建了一個數學模型,這個數學模型的話會告訴你,當然前提條件是我在什么地方,我要買什么車。只要用戶輸入這兩個條件,比如說我在洛杉磯的什么區,然后我想買一個帕薩特,輸進去以后它會給你一個架構走勢的圖表,這個圖表告訴你,在你所在的這個區域,這一款車的最低價是多少。最早的時候消費者是拿著這個價格,去跟經銷商砍價。
后來這個網站上線半年,半年的話,美國的這些經銷商,整個汽車行業就被掀翻了,所以精要上就聯合起來跟它打仗,跟它講你不能這樣做的,你這樣做我們活不下去了。所以半年以后這個網站調整了策略,一個是它不給最低價了,在平均價和最低價之間,隨機給出個中間價,因為對于消費者來說能夠買到中間價還是不錯的,同時滿足了消費者的需求,同時把后端跟美國的汽車經銷商聯系起來了,把用戶導給經銷商,這個價格用戶選中了,就把這個用戶帶給經銷商,讓經銷商實現銷售。它怎么獲益?它怎么收錢?它就跟經銷商分成,一個消費者只要他買成了,經銷商給這個網站200美元,就按銷售線索來收費。這個網站在今年8月份上市,在納斯達克,三個月的時間股票就翻了一倍,就成了今年納斯的明星。業務的核心是什么?是數據分析。
同樣另外一個跟它類似的做房地產信息的網站Zillow,有點類似國內的那個搜房。但是它是怎么起家的?因為它很新,Zillow是把美國全國各地的房產價格收集起來,幫助用戶做房子價值評估。他們評估過白宮的價值,好像是3億美元。每一個消費者,可以想買房的時候,可以通過選中的這個房子,然后用Zillow給的一個叫價值評估器去算一下,他買的這個房子值多少錢。反過來如果我想賣房的,我也一樣的用這個價值評估器能知道我的這個房子可以賣多少錢。這樣它就把我們看著簡單的信息發布,就是我想買房,我想以多少錢賣,都是很粗放的放在網上的,它就把這些信息組織起來了。我們說Zillow和TRUECAR業務核心就是底層的數據庫,當然Zillow現在是美國最大的房地產運營商,今年還把第二名給并購了,也是和它一樣的是納斯達克上市公司。
第五個是考拉,考拉是中國國內的一款網絡電臺,做車載電臺服務的一個網站,是一個應用,應該說是一個客戶端應用。實際上也很簡單,它做的事情跟今日頭條,跟這個潘多拉是一樣的,就是潘多拉是對音樂做詳細的分類,今日頭條的話是對新聞內容做詳細分類。考拉是對電臺節目做詳細分類。然后通過詳細分類,研究用戶和這些內容之間的規律和關系,實現個性化推薦。我們說互聯網信息服務的終極形式就是千人千面,我想要什么你就可以給我什么。
最后我講一下NETFLIX,它是最末端的分發階段,后來它想要做節目。要往上游,本身這個動向在美國和中國都是一樣的,我們現在有很多的節目,網絡人。NETFLIX為什么拿出來說,兩三年以前他們拍了一個熱門的電視劇叫《紙牌屋》,《紙牌屋》在娛樂圈火起來之前,是在大數據圈子里火過的,他們當時號稱是用了大數據來做決策的。怎么用的?它是首先決定拍什么的時候,是看了用戶的瀏覽、點播和下載行為的數據,它發現BBC在1990年拍的電視劇就叫《紙牌屋》它要翻開。他發現愛看這個劇的用戶,喜歡大衛·芬奇(音)這個導演,就請他來拍。第三個發現愛看這個劇的用戶還愛看一個演員的電影,所以就請來這個演員。這個拍完之后,會有多少的受眾規模,是不是可以計算出來。最小規模會是什么?會是同時喜歡這三個的,最大規模是所有喜歡這三個的。這個是一個典型的,我這個事兒還沒有做呢,我通過數據來預測就可以知道這個效果。果然《紙牌屋》一上線大火。當然在中國火還是有原因的,如果中國沒有發禁令還沒有現在這么火。所以政策上經常會有出發點和結果不一致的事情。
前面講的這些例子,我們這個環節講的是企業應該怎么用數據?我們講的是怎么用?為什么要用數據?因為我們要解決的問題,這些問題是什么?我們看三個要素,就是所有的互聯網上的好的產品都具備這三個要素,所有沒做成功的產品,都是因為在這三個方面出了問題。
我在說執行,不是說戰略定位,那些就更復雜。首先第一個要素的話,就是這個網站能不能實時相應客戶需求,客戶提了這個要求,你半個月再找客戶,客戶都跑了。第三個就是產品的用戶體驗,用戶體驗是不是很好?我們這八年來也服務了,一些傳統媒體轉型做新媒體,我想這個環節是我們很多以前做傳統媒體的運營的從業人員,就是所謂的網絡媒體,已經不是簡單的內容就好行了。然后除了內容好以外,更重要的是你的互聯網上,你用來去承載你內容的那個產品,用戶操作起來是不是很方便?
我說一個最最簡單的例子。這兩年我們的關注可能情況有變化,但是這個例子,大家應該會很有感觸。我們曾經服務的一些網站,號稱有獨一無二的內容資源。但是網站做起來以后,用戶登錄到它的首頁,首頁打開就要三分鐘,這就是一個典型的不考慮用戶體驗的。這種情況下你內容再好,用戶都看不到,所以你不可能把網站做好的,這是一個以前非常普遍的,最典型的。
第三個的話就是過程管理透明化,這個過程管理不是說我們總編輯,或者是網站的總裁要做這個過程管理。所謂的過程管理是指我們的業務過程,具體的業務負責人員,要知道我的業務過程是怎么走過來的?每一個環節的效果是什么樣?這個里面的話,可能比較典型的,比如說我們現在很多的網站,也用了流量統計的工具,無論是自己開發的,還是用第三方的,大部分的網站把這個流量統計數據當做一個簡單的結果報表。然后只允許網站里面的幾個核心人員掌握這個數據,很多一線編輯他發的文章,他發的頁面,究竟有多少用戶看了,是不知道的。對一線人員是黑箱操作,所以他也不知道應該怎么做才能更好。
所以在這個意義上來講,我們講大數據應用,就是過程管理要透明化。這個透明化也不是說對外講的,我們天天發布要告訴用戶,我們網站有多少人來看怎么樣的。但是我們在網站內部的每一個崗位的操作人員,對他自己所負責的這塊事情,他是需要掌握數據的。
怎么去解決這三個問題?或者是實現這三個要素的話,就是靠大數據。我們下面進入怎么用大數據?這是我們提出來的一站式數據化運營解決方案?
整個解決方案分三層,我們怎么幫助網站?傳統媒體在做新媒體的時候,怎么把數據用好,用到位?用數據來解決問題。
第一個是系統層,我們自己的大數據平臺,系統層網站是不需要考慮去建系統的。第二層是數據層,數據層是我們會幫助每一個網站去定制它的數據管理系統。再之上的話是應用層,應用稱我們又分三層。第一層是做過程的精細化管理。第二層是過程控制,去幫助網站把它自己的每一個環節的價值做到最大化,同時發現的問題去提出策略,怎么去修改。第三層是基于數據的創新應用,之前如果沒有數據這個服務我們沒有辦法做到的,現在基于數據我們可以去做一些創新的產品,然后去提升網民的用戶體驗。
我展開講一下,第一層不講了,因為第一層的話大家只要用就行了。締元信來講的話,我們在這個行業已經做了八年了,在沒有這個概念的時候,我們就在做大數據。我們看一下定制的網站數據管理系統,每一個網站有自己的數據管理系統,這個怎么實現?
首先是在媒體的各個業務單元,現在領導要講融合媒體,基本上現在的每一個媒體,就是有多種形態的產品,有網站、客戶端、手機站,甚至有些媒體有電視,甚至還有紙質媒體。這些媒體的各個業務單元去采集用戶行為數據,然后的話是跟締元信的公有的數據管理系統打通。打通干兩件事情,第一是把我們不同單元的用戶,給他識別出來是一個唯一用戶。因為一個可能好的媒體,他的用戶既用它的網站,又用它的客戶端,甚至還看它的報紙,這是好的媒體。所以我們怎么樣把不同業務單元的看似是不同的人,表明出來認出它是同一個人,這是一個事情,第二件事情的話,就是因為我們的平臺上,可能有這些用戶,在我們媒體之外的很多行為。所以我們會把這些信息給補充到網站的數據管理系統里面,就是獲得用戶的補充信息。最后的話,形成我們網站自己的數據管理系統,基于這個數據管理系統,我們就可以靈活的調用數據,去支持我們的業務。它的格式基本上是以人為核心,能展開這個人我們能夠收集到的跟這個人相關的,能夠判斷他的偏好的信息,做成標簽。
我們看實例,這就是一個網站,這個網站一共有153萬用戶,這些用戶的話,從整體上來看,他是一個什么樣的信息狀況?他的地域分布,他的購買力,他的興趣,他的年齡,他的職業。我們還會給這些網站的用戶賦予興趣的標簽,比如說喜歡體育的,或者是對教育類感興趣的等等這些,這些就可以用量幫助我們的網站,做內容的精細化調整,和精準營銷服務,這是一個。
我們也可以什么呢?我們也可以了解特定用戶的情況,我們可以輸入條件,比如說我們可以按照某一個特別的應用方向去輸入條件,輸入以后我們就可以得到一個,滿足這個條件的用戶一共有多少?我們可以進去看每一個用戶的背景情況,就跟一個人的檔案似的,這個用戶的唯一標識,他的個性偏好,我們就可以很清楚的調用出來。數據管理的過程就是什么?就是一個媒體發現自己的過程。因為發現自己是怎么發現?通過了解其認識,我們服務的對象來發現自己,這是底層的系統。
三層應用我也大概講一下,第一個是對運行的結果實時監測,我們可以看各種報表來看我們的業務情況。第二層我們看,更重要的可能現在大部分的網站,還是停留在報表階段,我要知道我大概的個運營的結果情況。實際上數據應用更重要的是什么?更重要的是用數據工作分析問題、發現問題,最后解決問題。這個環節我們看,我們可以做哪些事情?這是對一個網站,用戶進來以后的路徑做分析。這個分析的話,讓我們發現,我們網站的頁面鏈接之間的結構是不是合理的?
進一步的話,我們可以對頁面的板塊進行分析,看看哪一個板塊的導流的效果很好,一樣的可以通過首頁或者是正尾頁分析。還有我們可以對用戶點擊效果分析,我們通過改版以前發現問題,通過改版以后看我們的改版效果。在營銷這個環節的話,我們可以對我們的用戶,進行分群畫像,然后來做預判,我們這樣的頻道或者我們這個內容,適合推什么樣的廣告?再根據這個去發展廣告主。我們看一下例子,這是全站的。
對這個網站來講,最后我們給的結論它的營銷策劃方向是什么樣的?它適合的目標廣告主是誰?我們也可以倒過來找,說我現在就想要時尚類的人群,他的表現是什么樣的?我們可以去設定條件查某一類特定人群,分析出來以后,告訴時尚類人群,在這個網站適合的廣告是服飾。進一步我們還可以對網站的廣告位,去做細致的用戶畫像分析。最后來給出,對這樣的廣告主,你的廣告位資源應該怎么來組合?調配策略是什么。除了營銷以外,網站也會做很多的市場推廣,市場推廣這個環節,我們一樣有數據的分析工具去幫助優化推廣環節。
最后我們看一下基于數據的創新應用,第三個層次,或者是更高級的大數據應用。我們看這個例子,會有越來越多的創新應用會產生,我們看一下實際例子,這個是我們跟新浪汽車做的,我們叫數據新聞生成器。
大家知道這兩年大數據在媒體端的熱點,就是做數據新聞,怎么做?這是我們給新浪提供的生成器。大家看一下結果,很快的就某一個主題,把這個數據調出來,形成一個可傳播的新聞稿。我們昨天看我們市場部的小編輯,已經把艾伯拉(音)的新聞稿做出來了。
更典型的應用是個性推薦。因為我那兩天在找互聯網公司的財報,它給我推薦的一個是跟IT相關,另外一個是跟財報相關,還是比較準的。我們把公有的締元信數據,輸送給新浪,支持好它做這樣的推薦。這是新浪博客在我的微博上推的廣告,它判斷我的購買力還可以,給我推的是奢侈品牌。底層基于什么?基于新浪,和我們輸送給新浪,對我這個人偏好的判斷。
最后幾分鐘講一下最重要的,我們剛才講了,風動幡動,但是都不如心動。心動是指我們作為媒體的決策人,所應該具有的思想意識就叫心動,如果我們要改變結果首先要改變戰略,但是如果要改變戰略,首先要改變思想。通常說不破不立,我們要破的是什么?我們要立的是什么?我歸納出四個重要的因素,前兩個因素跟網站的運營,和網站本身對互聯網的理解相關,后兩個因素的話是對網站、數據、大數據的認識相關。
第一個要破的是把我們自己定位成內容生產者,變成我們是提供產品和服務的,就是一定要有產品和服務意識。第二個的話,就是網站運營從項目思維,要轉變成系統思維,所有的互聯網產品都是一個有自有生態系統。所以一定要有頂層設計,而不僅僅是說把這事做了。第三個要破的就是把數據當工具來看,要怎么樣?要有數據信仰。就跟締元信一樣,我們對我們招兩的每一個新員工說,如果你相信數據可以改變世界,你適合在我們公司,如果你不相信,你最好找別的工作。因為要有數據信仰,我們才會在戰略上重視數據,才會在組織架構上保證讓數據真正的在你的業務當中去運行起來。
比如說數據部門,很多媒體的數據部門是一個職能部門,是一個輔助性部門,跟辦公室行政部門沒有區別。但是數據部門一定要是戰略部門,數據的應用一定要是一把手工程。這個很難,但是必須做。
我們用一個典型的例子,我們現在看BAT三家,現在在大數據領域誰走的最快?毋庸置疑是阿里,為什么?是因為阿里在戰略部門,重視把自己各個業務單元的數據,收集回來形成了統一的數據管理平臺,我們看其它兩家,目前數據各自為戰,自己的數據還是一個孤島狀態。很快大家可以看到,在這個方向上,已經會被拉開距離。
最后就是數據開放的意識,我們說數據是資產,我們自己的平臺上只能起到保值的作用,但是起不到增值的作用。
要講一些數據之外的事情,新媒體成功,其實有比數據更重要的事情,就是你的戰略。功夫在詩外,講的戰略。第二個是十年磨一劍,講的是對過程要也積累。最后一個就是數據。
我以這個模型為結束,客戶很多的業務問題,其實不是操作層面的問題,而是自己在戰略和策略上還沒有想清楚的問題。所以我們根據我們對互聯網運營的經驗,把一個網站一個如果你做成功,我們拉了出來列了一個清單。我經常說,如果一個網站能夠把這個表格上的所有問題都解決了,有答案,你這個網站沒有理由不成功。這個PPT可以供大家參考,如果有問題的話,我們也可以以其它的形式再做交流。
我很愿意把我的價值給行業里發揮出來,今天占用的時間確實太長了,不好意思,但是我還是希望我的分享對大家有益。