拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

悬浮侠
• 阅读 1676

原文链接:使用SAS代写EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

标签:

  • 数据挖掘
  • 风险管理
  • 技巧和窍门

信用记分卡一直是信用评分的标准模型,因为它们易于理解,使您能够轻松评分新数据-即计算新客户的信用评分。本文将指导您完成使用Credit Scoring for SAS® EnterpriseMiner™开发的信用记分卡的基本步骤,这是我将在信用评分中发布的一系列技巧中的第一个。

建立记分卡用于构建信用记分卡的基本流程图中的节点包括:输入数据源,数据分区,交互式分组和记分卡。在本例中,您可以使用SAS Enterprise Miner的“帮助”菜单中提供的德语信用数据集。单击Help-> Generate Sample Data Source - > German Credit。该数据集具有二元目标good\_bad,其指示客户是否默认其每月付款(指定为值'BAD'),以及与作为输入或特征的人口统计和信用局相关的若干其他变量。

拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

交互式分组节点简而言之,交互式分组节点是一个非常灵活的工具,用于对变量进行分箱或分组。这个节点:

  • 使用您可以轻松调整的选项来分类输入变量
  • 计算每个输入变量的箱的证据权重
  • 计算基尼和信息值,并拒绝具有这些统计值的低值的输入变量

在幕后运行的过程可以根据您可以轻松定制的某些约束找到相对于目标的输入的最佳分级。确保使用节点的交互式应用程序直观地确认事件计数和证据权重趋势对您的分箱有意义。如有必要,您可以合并箱,创建新组或手动调整证据权重。

拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

手动调整证据权重

对于某些变量输入,您可能需要手动调整证据权重(WOE)。例如,可变采用总结了信用申请人在当前工作中受雇的年数。一般而言,当前工作的年数往往与信用违约成反比。对于该数据集,证据权重不会因第1组至第5组单调减少这一事实可能是由于多种原因。例如,这个数据集可能是样本偏向的,因为许多使用<2的应用程序是手动选择或“挑选”,并且它们的良好行为反映在低事件数和低权重证据中。要防止此样本偏差影响您的记分卡,您可以使用交互式应用程序中“分组”选项卡的“粗略详细信息”视图上的“手动WOE”列。对于组1,将WOE从0.1283更改为0.7,对于组2,将WOE从-0.13131更改为-0.5。新的WOE和信息值被重新计算为新信息值。

拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

记分卡节点对使用“交互式分组”节点找到的箱或组感到满意后,运行“记分卡”节点以使用分组输入对逻辑回归进行建模。然后,它将创建每个输入组或属性的赔率的预测日志的线性变换,使其更易于解释。

默认情况下,每增加20个得分点,事件的几率就会翻倍。您正在建模的事件是付款默认值,这意味着例如,与得分为150的应用程序相比,得分为130分的应用程序的违约几率要高一倍。

在结果中,有几个有用的图表和表格,包括记分卡,分数分布,KS图,权衡图和许多其他。

拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

输出变量和不利特征请注意,从导出的数据集中,记分卡节点会创建多个变量。带有前缀SCR\_的变量是记分卡中每个变量的记分卡点,SCORECARD\_POINTS是每个应用程序的总点数。

拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

当您指定记分卡属性生成报告=是以输出不良特征时,您的结果还将包括每个观察结果降低得分最多的变量。您最多可以选择5种不利特征。作为如何解释此列的示例,对于下面数据集的第一次观察,扣除了14个得分点,因为贷款的目的标记为1,3,8,缺失或未知。

拓端tecdat|使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
3年前
java抓取豆瓣电影数据,分析电影评分,生成统计图表
    最近花时间学习了一下使用Java获取网站数据的方法,自己也亲自动手实践一下;共获取3000数据,去除重复的数据剩余2000,使用JFreeChart根据电影评分做出几张简单的统计图。电影评分统计图:JFreeChart生成图片!(https://static.
Wesley13 Wesley13
3年前
SAS统计初学1
卡方检验;卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以
菜园前端 菜园前端
2年前
3D 城市模型来喽!!!感兴趣的进来了解一下
原文链接:3D城市模型预览地址:https://3d.noxussj.top/设备要求建议使用19201080分辨率进行访问。当前应用对电脑性能要求较高,特别是显卡。如果打开后没有60fps就代表你的电脑跑不动了。介绍3D可视化城市模型,使用的技术栈有vu
黎明之道 黎明之道
4年前
天池比赛数据挖掘心电图赛题理解
Datawhale零基础入门数据挖掘Task1赛题理解Task1赛题理解比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction1.1学习目标理解赛题数据和目标,清楚评分体系。完成相应报名,下载数据和结果提交打卡(可提交示例结果),熟悉比赛
黎明之道 黎明之道
4年前
天池比赛数据挖掘心电图模型调参
Task4建模与调参4.1学习目标学习机器学习模型的建模过程与调参流程完成相应学习打卡任务4.2内容介绍逻辑回归模型:理解逻辑回归模型;逻辑回归模型的应用;逻辑回归的优缺点;树模型:理解树模型;树模型的应用;树模型的优缺点;集成模型基于bagging思想的集成
黎明之道 黎明之道
4年前
天池比赛数据挖掘心电图模型融合
Task5:模型融合5.1学习目标学习融合策略完成相应学习打卡任务5.2内容介绍https://mlwave.com/kaggleensemblingguide/https://github.com/MLWave/KaggleEnsembleGuide模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。1
Stella981 Stella981
3年前
Sass预编译
sass基于Ruby       ruby的模块管理器叫gem 正规的安装方式是geminstallsass        调用命令  sass  sass文件  css文件webpack编译sass    需要的模块styleloader cssloader sas
Stella981 Stella981
3年前
SAS导入txt数据
众所周知,在我们进行数据处理分析的时候,不会是一直自己手动输入,这就要求从外部读取数据了。下边我们讲解从txt文件中将数据读取出来。我们读取的txt文件如下college\_inf.txt:depart_idnameagemajorlocationA101|cy|22|software1|beijing|B10
专注IP定位 专注IP定位
3年前
如何进行数据挖掘?
数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:KnowledgeDiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Associationrulelearning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统
CRISP-DM的应用与理解
CRISPDM是一个数据挖掘项目规划的开放标准流程框架模型,主要分为业务理解、数据理解、数据准备、建模、评估、部署六个阶段。