
機器學習(Machine Learning)是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域。不久前,《紐約時報》報道了微軟將機器學習應用于新業務。Lightspeed(光速創投)美國投資總監Jeremy Liew也介紹了“大數據加機器學習”重塑銀行信貸業的例子。
應用機器學習技術,軟件和服務都是盈利點
在下一個Office版本中,Excel將可以合并處理大量的數據。比如,能夠掃描1200萬條Twitter消息,然后生成一個圖表,告訴你哪一個奧斯卡提名者被人們談論得最多。Outlook新版本添加的功能可以評估用戶的電郵閱讀習慣,判斷哪些郵件是用戶想去閱讀的。微軟的機器學習軟件將能夠對公司電腦系統進行抓取,就像必應搜索引擎抓取互聯網上的網頁和鏈接一樣。
來自傳感器、連接的設備和云計算中心的數據大爆發造就了大數據產業。計算機要從每天生成的海量中找到規律和模式。長期來看,微軟希望能夠將更多的機器學習技術運用到它的云計算平臺Azure中去,比如租賃數據源和算法讓企業設計自己的數據預測引擎。微軟最終可以通過軟件服務收費,而不是僅僅銷售軟件。
微軟有一些創業公司所沒有的東西:巨大的資金儲備——上一季度末的財報顯示,現金和短期投資一項為670億美元——同時有能力在一個大項目上投入十年、甚至二十年的時間。Gartner的資深研究員David Smith說,“微軟的資源太多了,Windows、IE瀏覽器、Skype、必應搜索等等,他們能做許多事。數據分析將會是他們的下一個大生意。”
碎片化關聯,“另類信貸”模式顯現
一些初創公司用海量數據挖掘和算法來做一些貸款業務。
Wonga就是一家剛剛興起的替代貸款的初創公司。投資機構Accel的So
nali De Rycker是Wonga的董事會成員,他介紹說:“他們大量的使用了社交媒體和其他的網絡工具,但這些都是絕對想不到的。而這正是他們的奇跡所在。”
問題的關鍵在于算法,它怎么把你的郵政編碼,你的車的顏色,你的按揭是多少,它怎么能將你這些碎片化的東西關聯起來。 這些都是Wonga對于它過去客戶的各種碎片化信息的數據堆積和整理,這非常關鍵。在Accel在2009年進入Wonga董事會的時候,Wonga已經 有了10萬個貸款案例。這10萬條數據信息不斷集成和歸類變成了一個日益增加的信息網絡。其中每個貸款人都擁有6000到8000條數據。
“你用大量的數據串成了一個故事。我們愿意為這些數據付費,因為我們需要它。我們可以通過上千種組合來判斷做某件事是對的,還是錯的。”
伴隨大量的數據來源和強大的大數據分析工具,
這也意味著它可以比其他發薪日貸款機構可以以更低的利率貸款。機器學習的依據就是不良貸款,所以失敗的次數越多,你交的學費越多,同樣的你的模型就會越完善。
大數據時代有了更多復雜的商業模式,但目前只是表面。在接下來的幾年里在這個領域里將會看到更多的創新點。