風控必備的評分卡模型,TempoAI 10分鐘搞定
2020-09-18 15:44:33
次
8月20日,央行發布了《2020年第二季度支付體系運行總體情況》,數據顯示,截至第二季度末,信用卡逾期半年未償信貸總額838.84億元,占信用卡應償信貸余額的1.17%。與一季度相比,信用卡逾期總額出現小幅下滑,這與銀行在二季度采取嚴格的風控措施有關。為了應對信用卡帶來的大規模逾期,多家銀行在二季度開始加大信用卡整頓力度,而評分卡模型正是銀行最常見的金融風控工具之一。
什么是評分卡模型
評分卡模型又叫做信用評分卡模型,最早由美國信用評分巨頭FICO公司于20世紀60年代推出,在信用風險評估以及金融風險控制領域中廣泛使用。銀行利用評分卡模型對客戶的信用歷史數據的多個特征進行打分,得到不同等級的信用評分,從而判斷客戶的優質程度,據此決定是否準予授信以及授信的額度和利率。
傳統的信貸風控主要靠資深從業人員依靠自身的經驗設置的專家規則,相較而言,評分卡模型的使用具有很明顯的優點。
首先,判斷快速。系統只需要按照評分卡逐項打分,最后通過相應的公式計算出總分,即可準確判斷出是否為客戶授信以及額度和利率;
其次,客觀透明。評分卡模型的標準是統一的,無論是客戶還是風險審核人員,都可以通過評分卡一眼看出評分結果和評判依據;
最后,應用范圍廣。由于評分卡的評分項是客觀計算,其得出的分數具有廣泛的參考性和適用性。例如,生活中常見的支付寶芝麻信用分,就是依據評分卡模型計算得出。
評分卡模型建模過程復雜且耗時
隨著信貸業務規模不斷擴大,客戶行為的數據呈現出爆炸式的增長,金融機構對風控工作的要求也逐漸提升,評分卡模型也變得越來越復雜。金融機構需要耗費更多的精力與時間去升級和維護評分卡模型以滿足風險控制的需求。
在傳統的評分卡模型建模過程中,金融機構的IT算法人員需要與業務人員進行溝通,算法人員了解業務之后,通過編寫代碼來實現數據獲取、數據預處理、變量篩選、算法實現、模型開發評估、評分轉換等一系列流程,不斷驗證準確度,優化參數,最終生成評分卡模型。
評分卡模型構建流程
- 數據認知:基于實際業務場景理解數據內容,發現數據與研究問題的關系。
- 數據處理:對原始數據進行處理,包括不同數據源間的數據合并、數據規整化處理、缺失值處理等環節。
- 特征選擇:利用特征選擇方法,篩選出預測能力強的有效特征,合理降低特征總維度。
- 特征分箱:對特征自變量進行離散化分箱處理。
- WOE轉換:特征分箱處理后,將變量進行WOE編碼轉換。
- 模型建立:結合樣本數據建立模型及模型參數輸出過程。
- 模型評估:利用評估指標對模型效果進行評價。
- 評分轉換:將模型概率轉換為直觀評分以及生成評分卡。
10分鐘搞定評分卡模型建模
TempoAI 的金融板塊包含了評分卡和PSI(Population Stability Index)指標計算兩大算子,在建立評分卡模型時,只需將平臺封裝好的相關算子拖入建模流程中,無需編寫代碼,就能輕松、快速完成模型的建立,解決了金融機構在評分卡模型構建中難度大、周期長的問題。
評分卡模型構建流程
第一步:導入數據。使用數據管理下的數據輸入節點讀取評分卡數據集,包括客戶的基本信息、賬戶屬性、消費行為、還款行為等。
數據導入頁面
第二步:數據過濾。選擇數據過濾節點,進行條件設置,去除掉、缺失值以及異常值數據,完成行數據的過濾和篩選。
數據過濾設置頁面
第三步:WOE編碼。選擇WOE(Weight of Evidence)編碼節點對數值型字段進行分箱編碼處理,根據違約與正常客戶的比例計算不同字段區間的WOE值,根據WOE值計算每個字段IV值,根據IV值選擇比較重要的字段參與建模。
WOE編碼頁面
第四步:邏輯回歸分類算法。選擇邏輯回歸分類算法,設置自變量為WOE編碼后的字段進行建模。
邏輯回歸分類算法
第五步:評分卡。選擇評分卡節點,讀取WOE模型、分類模型和數據集,得到客戶的評分。
評分卡節點配置界面
第五步:PSI指標計算。通過計算實際數據集和期望數據集不同得分區間的樣本比例,根據PSI值的大小判斷模型的穩定性和變量的穩定性,從而判斷該變量是否需要加入模型,以及模型是否需要更新。
PSI指標計算配置界面
至此,評分卡模型的整個建模過程就完成了。
評分卡模型的算法原理雖然不是特別復雜,但在風控領域中有著不可替代的地位。隨著消費金融領域的不斷擴展,不僅銀行,越來越多的金融機構,尤其是小額信貸企業也開始利用評分卡模型完善風控制度。
在過去,評分卡模型建模技術一直掌握在大型金融機構的少數人手里。TempoAI通過內置專門的金融分析算法,封裝WOE編碼以及評分卡、PSI指標計算等算法,將評分卡模型建模時間從1-2個月縮短到了數小時,有經驗的IT人員10分鐘即可完成整個建模過程,不僅大幅提升了建模的工作效率,而且圖形化、拖拽式的建模方式對人員的技術要求大大下降,不再需要經過專業訓練的數據科學家,普通的業務人員也能夠獨立完成評分卡模型的構建,直接進行風控決策。
TempoAI始終秉持“智能、互動、增值”的設計理念,為企業級用戶提供自助式、自動化、智能化的分析模型構建服務,完整的覆蓋數據接入、模型構建、流程洞察、成果部署等數據價值發現全過程,支持9大類分析場景算法、120+種分布式算法、5種獨創算法、5種深度學習算法及4種以上集成學習算法,幫助500+行業頭部企業實現1300+AI場景應用落地,涵蓋能源、制造、金融、教育、政務、通信、零售等多個領域,解決企業AI落地難題,促進企業“全民數據科學家”的數據運營文化建設。