為了防止信用卡盜刷 機器學習算法認出你是誰
盜刷信用卡風險已經成為困擾全球銀行信用卡部門的難題之一。僅以美國為例,美聯儲的支付調查報道顯示,2012年全美信用卡支付總金額達到260億美元,這其中未經授權的信用卡支付,也就是盜刷信用卡的金額高達61億美元。
對銀行而言,衡量信用卡交易的風險非常困難。要實現這個目標必須快速確定哪些交易是合法授權,哪些交易是盜刷的。那么這些工作又是如何實現的呢?
站在消費者的立場來看,檢測信用卡盜刷的過程似乎很「神奇」,這種檢測幾乎是瞬時發生的,背后涉及到一系列復雜的技術,從金融到經濟到法律再到信息科學。當然,有些信用卡盜刷的檢測很簡單,比如,當機器發現信用卡刷卡地的郵編與發卡地的郵編不符時會發出警告。
傳統的信用卡檢測需要大量人力參與到海量數據的分析判斷上,算法只會對一筆交易發出警告,最后人類審核員會打電話確認這筆交易是否涉嫌信用卡盜刷。現在,由于交易量激增,各大銀行的信用卡部門開始依靠大數據,并通過機器學習和云計算的方法快速甄別未經授權的信用卡交易。
用于信用卡檢測的機器學習算法首先將被海量正常的交易數據和持卡人數據進行訓練。交易結果會成為機器理解交易的一個重要維度,比如一個正常人可能每周買一次電、每兩周去一趟購物中心等等,這些交易結果將成為正常交易的模型。
接下來,機器將接受實時交易數據的考驗,并給出該交易是否不合法的概率,比如97%,如果檢測系統設置每筆交易不合法的概率不能高于95%,那么所有這些交易將被拒絕接受付款,換句話說,交易不會成功。
這個算法考慮的因素很多,包括刷卡供應商的信任度、插卡讓購買行為(時空維度)、IP地址等等,考慮的因素越多,其構建的模型也越準確。
這個檢測的過程幾乎是實時的,這也是人類工作者無法達到的檢測速度。但整個流程中還是需要人類的參與,包括人類對算法判斷的審核以及隨后的信用卡欺詐跟蹤等等。
金融交易過程中的數據非常大,比如目前PayPal要處理1億690萬用戶的1.1PB數據。但對機器學習而言,越多的數據意味著越能提升自身的算法準確度,從而更好地識別盜刷信用卡的事件。海量數據對于銀行IT系統的硬件要求非常高,數據的存儲、讀取和分析,都成為巨大的IT開支。
目前,銀行的信用卡部門開始使用云計算作為處理海量數據的方式,云計算彈性可伸縮的特性能夠機器學習算法運行的效率,有效應對諸如雙11等刷卡高峰期時的信用卡檢測
圍繞信用卡盜刷和反盜刷的戰爭一直在持續,借助于機器學習、大數據和云計算以及今后可以實現的區塊鏈技術,未來我們的錢包和卡包會越來越安全。
機器之心原創出品,編輯:趙賽坡。