一、项目简述
(一)项目目标
基于WOE转换及逻辑回归模型制作一张反映贷款人信用风险水平的信用评分卡。
(二)数据来源
数据来自Kaggle的cs-training.csv样本,该样本有15万条的个人消费类贷款数据。 数据下载地址
(三)数据说明
变量名(原始)为文件中变量名,由于原始变量名较长,所以就转换成较短的y、x1、x2…代替。
这是最好的时代,也是最坏的时代
CART算法(Classification And Regression Tree,分类和回归树)是决策树的一种,由Leo Breiman, Jerome Friedman, Richard Olshen与Charles Stone于1984年提出,既可用于分类也可用于回归。本文将主要介绍用于分类的CART算法的R语言实现。
逻辑回归(Logistic Regression)模型和线性回归非常相似,可以说就是在逻辑回归的基础上加上了一步逻辑转换,也就是因为这个转换,使逻辑回归模型非常适用于二分类问题的概率预测。本文主要详述逻辑回归模型的基础以及逻辑回归模型的R语言实现。
贝叶斯分类算法是统计学的一种分类方法,它是一类利用贝叶斯定理为基础进行分类的算法。在许多场合,贝叶斯分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。本文主要介绍贝叶斯分类算法中最简单的一种:朴素贝叶斯算法(Naive Bayesian Model,NBM)的基础以及R语言实现。