大枫的个人博客

这是最好的时代,也是最坏的时代

  • 首页
  • 归档

信用评分卡模型_基于R语言

发表于 2017-05-30

一、项目简述

(一)项目目标

基于WOE转换及逻辑回归模型制作一张反映贷款人信用风险水平的信用评分卡。

(二)数据来源

数据来自Kaggle的cs-training.csv样本,该样本有15万条的个人消费类贷款数据。 数据下载地址

(三)数据说明

变量名(原始)为文件中变量名,由于原始变量名较长,所以就转换成较短的y、x1、x2…代替。

阅读全文 »

CART算法实现_基于R语言

发表于 2017-03-02

CART算法(Classification And Regression Tree,分类和回归树)是决策树的一种,由Leo Breiman, Jerome Friedman, Richard Olshen与Charles Stone于1984年提出,既可用于分类也可用于回归。本文将主要介绍用于分类的CART算法的R语言实现。

阅读全文 »

逻辑回归算法实现_基于R语言

发表于 2016-12-07

逻辑回归(Logistic Regression)模型和线性回归非常相似,可以说就是在逻辑回归的基础上加上了一步逻辑转换,也就是因为这个转换,使逻辑回归模型非常适用于二分类问题的概率预测。本文主要详述逻辑回归模型的基础以及逻辑回归模型的R语言实现。

阅读全文 »

朴素贝叶斯算法实现_基于R语言

发表于 2016-11-27

贝叶斯分类算法是统计学的一种分类方法,它是一类利用贝叶斯定理为基础进行分类的算法。在许多场合,贝叶斯分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。本文主要介绍贝叶斯分类算法中最简单的一种:朴素贝叶斯算法(Naive Bayesian Model,NBM)的基础以及R语言实现。

阅读全文 »

kNN算法实现_基于R语言

发表于 2016-10-27

“k最近邻算法(k-Nearest Neighbor,kNN)分类算法是机器学习算法中最简单的算法之一,所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。”——kNN算法_百科

阅读全文 »

大枫

这是最好的时代,也是最坏的时代

5 日志
9 标签
© 2020 大枫
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4