构建信用卡客户风险识别模型 + python 数据分析 + 图解
构建信用卡客户风险识别模型
需求说明:
为了推进信用卡业务良性发展减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作。某银行研究的风险识别模型随时间推移不再适应业务发展需求,需要重新进行风险识别模型构建。
实验目标
(1) 掌握异常值的识别与处理方法。
(2) 构建信用卡用户风险分析关键特征。
(3) 掌握 K-Means 聚类算法的应用。
(4) 掌握聚类算法结果分析的方法。
实验内容
为了推进信用卡业务良性发展,减少坏账风险,台湾各大银行都进行了信用卡客户风险
识别相关工作,建立了相应的客户风险识别模型。某银行因旧的风险识别模型随时间推移,不再适应业务发展需求,需要重新进行风险识别模型构建。
(一)处理信用卡数据异常值
实验步骤
(1) 读取信用卡数据。
(2) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1,瑕疵户为 2 的记录。
(3) 丢弃呆账,强制停卡,退票为 1,拒往记录为 2 的记录。
(4) 丢弃频率为 5,刷卡金额不等于 1 的数据。
(二) 特征选取
特征的轩主主要是以下三个方面。
1. 根据特征瑕疵户,逾期,呆账,强制停卡,退票,拒往记录构建历史行为特征。
2. 根据特征借款余额,个人月收入,个人月开销,家庭月收入和月刷卡金额,构建出经济风险情况特征。
3. 根据特征职业,年龄,住家,构建出收入风险情况特征
4. 将历史行为特征,经济风险情况特征以及风险情况特征分别进行降维
(三)构建模型
构建K-Means聚类模型,聚类数为5。
训练模型,求出聚类中心、每类的用户数目。
结果分析
通过观察SSE与k的取值尝试找出合适的k值
雷达图
(一类客户)
(二类客户)
(三类客户)
(四类客户)
(五类客户)
(雷达图)
根据H(历史行为)E(经济风险)I(收入风险)数据,我们可以对客户进行评价分析。
客户聚类HEI图
HEI图
客户价值排名图
客户特征图
客户价值分析
我们重点关注的是H,E,I,从HEI图中可以看到:
1、一类客户 [blue] E I 很高,H也不低,可以看做是重要保持客户
2、二类客户[black] 可以看做是重要发展客户
3、三类客户[yellow] 重要挽留客户,原因:H很高,可以看做是重要的挽留客户,因为历史行为很高, 但是E和I较低
4、四类客户[red] E特别高,其余都较低,可以看作是一般客户
5、五类客户[green] 低价值客户
以下再结合具体的特征定义五个等级的客户类别,针对不同等级的客户,采取相应的营销手段和策略,为信用卡客户风险的客户群管理提供参考(既业务分析)。
我是呵呵哒!
一个喜欢编程的程序猿!
数据网上可以找到,如果需要代码或者疑问请留言!