构建信用卡客户风险识别模型 + python 数据分析 + 图解

构建信用卡客户风险识别模型

需求说明:

为了推进信用卡业务良性发展减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作。某银行研究的风险识别模型随时间推移不再适应业务发展需求,需要重新进行风险识别模型构建。

实验目标

(1) 掌握异常值的识别与处理方法。

(2) 构建信用卡用户风险分析关键特征。

(3) 掌握 K-Means 聚类算法的应用。

(4) 掌握聚类算法结果分析的方法。

实验内容

为了推进信用卡业务良性发展,减少坏账风险,台湾各大银行都进行了信用卡客户风险

识别相关工作,建立了相应的客户风险识别模型。某银行因旧的风险识别模型随时间推移,不再适应业务发展需求,需要重新进行风险识别模型构建。

(一)处理信用卡数据异常值

实验步骤

(1) 读取信用卡数据。

(2) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1,瑕疵户为 2 的记录。

(3) 丢弃呆账,强制停卡,退票为 1,拒往记录为 2 的记录。

(4) 丢弃频率为 5,刷卡金额不等于 1 的数据。

(二)  特征选取

特征的轩主主要是以下三个方面。

1. 根据特征瑕疵户,逾期,呆账,强制停卡,退票,拒往记录构建历史行为特征。

2. 根据特征借款余额,个人月收入,个人月开销,家庭月收入和月刷卡金额,构建出经济风险情况特征。

3. 根据特征职业,年龄,住家,构建出收入风险情况特征

4. 将历史行为特征,经济风险情况特征以及风险情况特征分别进行降维

(三)构建模型

构建K-Means聚类模型,聚类数为5。

训练模型,求出聚类中心、每类的用户数目。

结果分析

通过观察SSE与k的取值尝试找出合适的k值

雷达图

(一类客户)

                  

(二类客户)

                  

(三类客户)

                

(四类客户)

                

(五类客户)

                

(雷达图)

                

根据H(历史行为)E(经济风险)I(收入风险)数据,我们可以对客户进行评价分析。

客户聚类HEI图

               

HEI图

客户价值排名图

                  

客户特征图

                 

客户价值分析

我们重点关注的是H,E,I,从HEI图中可以看到:

1、一类客户 [blue]   E I 很高,H也不低,可以看做是重要保持客户

2、二类客户[black]   可以看做是重要发展客户

3、三类客户[yellow]  重要挽留客户,原因:H很高,可以看做是重要的挽留客户,因为历史行为很高, 但是E和I较低

4、四类客户[red]    E特别高,其余都较低,可以看作是一般客户

5、五类客户[green]  低价值客户

以下再结合具体的特征定义五个等级的客户类别,针对不同等级的客户,采取相应的营销手段和策略,为信用卡客户风险的客户群管理提供参考(既业务分析)。

我是呵呵哒!

一个喜欢编程的程序猿!

数据网上可以找到,如果需要代码或者疑问请留言!