<track id="653sp"><div id="653sp"></div></track>

<track id="653sp"><span id="653sp"></span></track>
<track id="653sp"></track>

  • <tbody id="653sp"><div id="653sp"></div></tbody>

      行業動態

      在風控的領域,哪些技術是純噱頭?怎樣才能落地真正運用?
      (2017/6/23)

       

      風控領域,大數據等一些先進技術的應用場景和方向在哪里?


      在一本財經舉辦的風控閉門課程上, ZrobotCEO喬楊表示,技術第一步,是實現自動化,減少人工主管臆斷。


      他從營銷、反欺詐、催收等多個領域,介紹如何進行風控模型開發、搭建。


      以下是他現場分享的部分干貨。


      在正式分享前,我們需要討論確定兩個觀點:


      一個是模型開發。目前在國內,包括BAT,都沒有一個完善的模型開發標準流程。


      一個完整的開發模型流程,需要滿足以下要素:

      這些東西,其實在國內還不規范。


      另一個是,在風控領域,大數據等一些先進技術的應用場景和方向在哪里。


      首先,要能做到自動化,盡量減少人工的干預,減少主管臆斷。


      其次,通過大數據能實現“差異化”,做到客制化產品設計,客戶畫像補全,客戶需求的深度挖掘。


      再次,就是做到精準度,這些需要模型驅動,包括交易成本評估、差異化定價、反欺詐等。


      最后,是創新性的評估。比如,現在行業最大的一個瓶頸,是底層數據不能共享,如何實現數據安全的共享。



      01 基于試驗設計的營銷相應策略


      現在營銷有兩種方式:一個是覆蓋式營銷,主要是借助電視、廣播、報紙德國傳統媒介,他的優勢是覆蓋面廣,單成本非常高,但營銷效果,比如我們把轉化率做為評估,它是非常難以量化評估。


      另一個是精準營銷,你的觸達方式,是電銷、運營商的網運營商的網絡或者是社交網絡傳播,他可以根據人群的特點需求,做一個定制化的投放,定制化的投放最大好處,他可以做到極致化,可能是千人千面這么一個營銷方式,那么每個人需求是不一樣,他的消費能力能力是不一樣,而且他最大的優勢,他的效果可以做量化的。


      我們經常會面臨三類場景:


      一是,你面向眾多營銷對象,你如何選取需要觸達的目標客戶,提高你的營銷響應率。


      二是,針對不同的客戶,怎么選取合適的營銷渠道,降低過渡成本。


      三是,在營銷資源有限的情況下,如何選擇合適的產品,做個性化投放,這就是要基于你對這個客戶的精準理解。


      我們是提倡“test&learn”的方式,就是你對目標客群的理解,不基于你的營銷人員,他完全是通過我們實驗設計,通過我們的數據來說話,那通過,營銷實驗的方式,你最小的成本來測試,那么最終你可以通過你測試到的基本數據來建模,來準確判斷用戶的一個畫像,可以精準預估轉化率。

      02 第一方欺詐


      欺詐分為三種:


      第一方欺詐,是客戶本人是欺詐的實施者,他進行消費的時候沒有還款欲望,提供虛假的信息;或者刻意提高自己的信用體系,不斷地提高信用額度,當自己的信用額度達到一定程度以后,就忽然爆發。


      第二方欺詐,是非常不常見的,它犯罪主體是受害人的親戚或者公司的雇員,通常被當作第三方欺詐處理。


      第三方欺詐,客戶是受害人,不主動實施欺詐,欺詐方式包括身份盜用或賬號盜用。


      第一方欺詐分為幾類:


      一是深度欺詐,用自己的身份申請貸款,但沒有償還意愿。


      二是first payment default,這在現金貸首輪是非常普遍的,比如,第一天首輪客戶達到30%,第二天可能降到20%,這批客戶有好利潤,但欺詐的頻率是非常高的。


      三是余額欺詐(bust-out)。


      國內平臺都有自己的提額策略,一個增長性的收信方式,一種方式是客戶主動提出申請;另一種是平臺通過判斷策略判斷用戶是否達到提額的要求,做一個被動提額。只要存在提額的空間,就可以給欺詐份子一個動機。


      現金貸用戶經常會遇到,有些用戶會借了還,但不是在還款到期時還,可能借了三四天之后就還了。這里面有一部分人,就是在測試,他們通過不停的提前還款、按時還款,把額度在很短時間內刷到他認為比較高的階段,他可能一次把錢取出來,就消失了。


      第四種是空頭支票,這在國外比較常見,但在國內,大家不接受支票付款的,所以這種欺詐方式還未出現。


      國內,風控還處在校驗階段,通過身份驗證、識別,在前端防范欺詐。比如你要求用戶提供銀行卡流水,三要素、六要素驗證,甚至是眨眼等活體驗證,這都是有可能被攻破的。所以通過交驗的方式,是目前國內是比較普遍使用的方式。


      在無意償還的這一塊,有效的方式就是黑名單,進一步做風險信用評級,用戶畫像。但針對還款意愿的判斷是非常難的。


      first payment default識別難度在于數據較少,判斷周期長,但耗費大量催收資源,主要也以黑名單判定為主。


      余額欺詐,可用會在多家借貸機構同時發生,如果能掌握多頭申請的信息,可以對余額欺詐做一個前期的保障。

      進入欺詐期,用戶先是正常消費、按時還款,之后多家同時申請調高額度,會短時間內高頻消費,最終消失。


      余額欺詐,在實施欺詐之前,假裝自己是好人,正常消費、正常還款,在初中期,90%正常交易比較多,高危交易、大額交易比較少,后期交易行為發生明顯變化,大額交易明顯增多。


      判斷用戶交易的真實性,需要非常大的計算量,對系統、預算的要求非常高,比如信用卡的,要求在毫秒進行判斷。


      交易監控,需要監控是否有高頻小額交易、大額異常交易。


      余額欺詐,會頻繁的申請額度提升,最有效的是建立惡意提額識別模型,設置惡意提額識別策略,在實施大額提現時,平臺能攔截異常交易。


      另外可以結合其他維度進行監控,社交網絡、網上瀏覽數據、其他行為數據等。



      03 常見的欺詐類型及防控措施


      第三方申請欺詐,有賬戶盜用、資料造假,惡意違約;交易欺詐,包括賬戶冒用、養卡、套現。他們的防控難度和危害程度,都比較急迫。


      具體要如何防范呢?


      1 最常用的方法是建立“漫網”體系識別,通過多元數據交叉比對,搭建模型建立精準的客戶畫像。


      “漫網”體系識別是我們內部提出來的一個概念,是通過機器分析社交網絡額度一個方式,通過地址關聯,設備關聯等建立網絡圖譜,當建立起來全網關聯后,你看到的不是欺詐的個體,而是一個消費群落,可以快速定位欺詐團伙行為。


      2 多種數據來源的交叉對比,包括地址、移動設備行為等各種用戶信息進行交叉對比,產生置信度。


      3 模型的方式,建立精準的客戶畫像,這被認為是最有效的,通過身份特質、購物歷史、交易特征,構建千人千面的模型,可以根據交易進行畫像對比,符合就通過。

      客戶畫像模型構建分為三個部分:


      第一,用戶檔案,與傳統風險模型不同,為每一個客戶建立一套專有的行為檔案。


      第二,數據光滑,當客戶自身的歷史行為不足以支撐是,需要用行為近似的數據進行補充。


      第三,時間衰減,對于我們服務的年輕客群,變化非?,需要及時更新行為檔案。



      04 反欺詐


      在整個信貸授信環節,身份驗證,欺詐識別,信用評估和后期的風險預警,每個環節都有技術突破。


      比如,在批量注冊識別領域,通過用戶行為模式分析,尤其是相似性分析,比如多頭申請、關系網絡、高相似信息等,有效區分機器注冊用戶和正常使用客戶,最大限度減少對正?蛻舻挠绊懞蛿r截無效客戶。


      最大的劣勢在于,很可能誤傷,需要極強的場景理解能力和豐富的業務經驗,能利用流式處理技術,實時判斷客戶在注冊及使用流程的異,F象。


      舉個例子,判斷客戶是否屬于批量注冊,可以通過路徑分析的方式。比如網頁跳轉路徑、網頁類型與停留時間等。


      第一,是刷單識別。


      通過多個維度,可以識別刷單團體。比如通過商戶和客戶兩個維度,進行信用評估,建立商戶之間,客戶之間,以及商戶與客戶之間的關聯關系,有效提升團體刷單的識別率。進一步,可以由點帶面發現整個可疑集團,并減少對正常用戶的影響和購物體驗。


      需要制定一個懲罰機制,對刷單的嚴重程度,進行差異化處理。


      第二,是漫網擴散,構建一個關系網絡。


      這是基于個體之間,多樣性的關聯方式,關聯頻率等信息,有篩選的建立關系網絡,同時根據已知的黑名單,建立有效的傳染規則與免疫規則,實現涉黑程度的量化度量,提升黑產團伙識別率。


      根據已知的黑名單,建立有效的傳染規則與免疫規則,實現涉黑程度的量化度量。


      最終,以圖譜的形式,實現關系網絡可視化,方便業務人員對關系網絡整體進行把控。


      第三,是中介識別,就是根據用戶在網絡中留下的言論信息,來判斷該用戶是否具有中介特征,這是對黑名單模型的補充。


      信貸中介識別的難點在于,對于黑產一些隱蔽的代稱,無法進行有效地識別。比如,聊天記錄和論壇言論是零散的,針對多人對話需要進行結合上下文的語義理解,對文本和詞性的辨識度要求很高。


      中介識別基本建模步驟:


      1 在人工指導下,針對網絡進行有效爬取,建立結構化數據庫。


      2 利用監督學習,針對爬取素材進行語義分析和情感分析。


      3 實現自動化網絡爬取和語義分析。

      主要采用的標注模型有二元文法(bigram),基于字符的隱馬爾科夫模型(HMM),詞三元文法(word Trigram)和字符三元文法等。



      05 催收策略


      首先明確,催收關鍵目標,包括早起催收、后期催收、保全。

      催收,需要催收模型的支持,通過對客戶“排序”,統計建模,來幫助進行業務決策。統計建模的優勢在于客觀、準確、公平、穩健、法律合規。


      模型開發需要對歷史信息和當前信息,進行分析和預測,主要是預測未來表現的


      催收模型可以使用的數據來源有:金融機構自身數據、征信數據(人行征信或第三方征信)、客戶針對催收反饋數據、其他外部數據等。


      催收模型搭建同時,還需要制定催收策略。


      催收策略是一個不斷循環,自適應優化的過程,需要不斷收集反饋信息,并調整策略。設計策略的時候,需要關注“什么時候,由誰,對哪些賬戶,采取何種催收方式”,他最終是一個資源配置效率的問題,有限的資源如何做到最好。


      催收策略嚴重依賴于系統,在評分與策略之外,強大、高效、符合業務需求的系統  是重要的基礎條件。


      催收需要考慮三個維度,催收賬戶分類、產品分類、催收行動信息。


      催收賬戶分類,包括新帳戶、首次還款逾期帳戶、聯系方式或地址失聯、習慣性逾期、違背還款承諾等。


      催收行動信息,包括逾期期數、天數,還款承諾,還款承諾未兌現等。


      另一點需要講的是,催收需要結合有效結合賬戶數和金額的考慮。一個公式是,Balance at Risk 風險余額= Probability of Bad 壞賬概率(評分) * Balance余額。

      而在催收行動考量時,需要將催收工作可能得到的客戶反饋考慮在內,通過行動細分對催收工作及客戶反饋進行細分,進一步完善策略。


      這里要提到催收對象的“敏感度”,即采取一定的催收行動后,客戶反應如何,依據其”反應情況”和”敏感度”采取不同催收行動。

      轉自一本財經