这本书主要描述的是消费信贷的情况,企业贷款不在描写的范围之中
信用评分(credit scoring):决策是否给某个申请人贷款,信用评分评估的不是消费者的个人信誉,信用评分不是一个人的特征,而是贷款人对借款人评估,反映了借贷双方的情况
行为评分(behavior scoring):决策如果管理现有客户,是否给他们增加信用额度
评分卡(scoring card): 对不同的特征赋予不同的分数
信用评分的哲学基础是实用主义和经验主义,目的是预测风险而不是解释风险
信用评分实践(practice)概要
1.评分前的信用评估
靠的信贷审批人员对申请人员的主管判断,这种做法没有统一标准而且效率低下。消费信贷的兴起,必须加速信贷审批的处理,特别是信用卡的兴起,有些机构每天要处理几千笔的信用卡申请,靠人工审批变得不现实。
2.评分卡
评分卡拥有一些特征变量,每个特征变量都不同的值,针对不同的特征变量值设定分数,然后针对不同申请人对应的特征变量值累计总分数。贷款机构一般会设定一个及格线,或者一个参考分数线范围,或者结合征信局信用报告的其他判别标准
3.信用评分咨询机构
评分开发商已经更愿意同放贷机构联合开发软件
4.验证评分卡的有效性
在使用评分卡系统之前,必须验证其有效性
5.人工修正和人工干预
原因可能是申请表信息错误,有些贷款机构制定的流程就有专门一个分数区域需要人工审核,或者现实情况与评分卡设定的前提已经有变化
6.监测和跟踪
评估一组账户的表现情况是否与评分系统预测的情况一致,并进行相应的纠正或者扩大评估面增加盈利性
建立评分卡的统计方法
判别分析(Discriminent Analysis):决策论(Decision Theory)
决策条件:当一个客户划分到好客户带来的损失<=划分到差客户带来的损失则将这个客户划分到好客户中,即申请通过,用公式表示是 D*P(x|B)*PB<=L*P(x|G)*PG , 经过条件概率公式(贝叶斯定理)变形后,得到AG的集合表达式:
AG={x| D/L <= q(G|x)/q(B/x) } -----------------4.8
即只要满足D除以L 小于等于有该特征项是好客户的概率除以有该特征项是差客户的概率 的这些特征项 就可以作为申请决策的判断依据特征项。
以上这种方法的弊端在于D和L都是未知的,并且还假定了每个客户的D,L都是相同的,这也不符合现实情况,从统计学的角度只能用D和L的期望值来代替。
为了解决以上问题可以从另一个判断依据来推导,即不从最小化损失的角度,而是让犯一种错误的概率在可接受水平,然后使得犯另一类错误的概率最小。信贷决策一般会将申请通过率在一个可接受的水平,然后使得差客户错误地划分为好客户的概率最小。
若接受申请的百分比(接受比率)设定为α,则
∑p(x|G)PG + ∑p(x|B)PB = α (x∈AG)
目前α是固定值,需要使得∑p(x|B)PB 最小化,p(x|B)PB记为b(x),p(x)满足如下等式
∑p(x)=α (x∈AG)
利用拉格朗日乘子法可以得到AG集合:
AG={x| (1-c)/c <= q(G|x)/q(B/x) }, ---------4.11
这个不等式同之前方法得到的不等式是一致的,只是c,D,L取值的变化
4.11式如何应用??
这个不等式对于特征变量值是连续时也是成立的,不等式如下
AG={x|D*PB/L*PG <= f(x|G)/f(x|B) } ---------4.13
其中f(x|G),f(x|B) 是条件概率密度函数
1.单变量正太情形
假设特征变量值有一个,并且是连续的,且f(x|G) 是均值μG方差σ2正太分布,从4.13式子中可以推导出
“如果x越大不等式越成立,即x值足够大则接受申请”
2.协方差相等的多元正太情形
一个特征变量显然不是现实情况,更真实的例子是申请信息中有p个特征变量,他们在好客户和差客户中的分布密度都是多元正太分布,这种情况下可以推导出一个线性评分准则(Linear Scoring Rule),成为线性判别函数(4.16式) (Linear Discriminant Function)
分布密度的均值和协方差矩阵是无法得知的,一般用样本均值mG,mB,样本协方差矩阵S代替,4.16会变形为4.17式(中文版的4.17式有错误,请参考英文版)
如何应用这个线性判别函数??
3.协方差不等的多元正太情形
这种情况的结果会得到一个二次函数,这似乎是一个更一般的决策准则,但Reichert Cho和G.M.Wagner在1983年证明了二次函数决策准则还不如线性准则稳健。
判别分析:将两组分开
Y=w1X1 + w2X2 + ... + wpXp是针对特征变量X1,X2,...Xp的任意一个线性组合
Fisher提出当两组的样本方差相等时,一个敏感的分离度指标是
M=两个样本均值的距离/每组样本方差的平方根
让M最大化,可以得到结论:
wT 正比于 1/S * (mG-mB)T --- 公式4.21
wT是一个特征量系数矩阵,S是样本方差,mG是好客户的均值,mB是坏客户的均值
判别分析:线性回归
设线性函数pi=w0+xi1w1+xi2w2+...+xipwp,对这个线性函数进行线性回归。pi是第i个申请人违约的概率,那么对于nG个好客户来说,pi=0,对于nB个差客户来说,pi=1。(这个地方原书和中文书都貌似搞反了,前者写成pi=1,后者写成pi=0)
从寻找特征变量最优特征变量组合的角度来寻找结论,结论是
SwT=c(mG - mB)T
这个公式和4.21式子是一样的
Logistic回归
将概率pi对数化变形成log(pi/(1-pi)) ,这样再进行回归分析。
这种方法和线性回归的分类结果差异非常小,因为log(p/1-p)的曲线与ap+b在p=0.5附近是很接近的,而p靠近0或这1时两种差别会很大,但现实情况往往p不会靠近0或者1
相关推荐
- 在垃圾邮件过滤、客户流失预测、信用评分等多个领域有着广泛的应用。 - 例如,通过分析用户的购买历史和行为模式,可以有效地推荐个性化商品。 - **聚类算法的应用**: - 在市场细分、异常检测等方面发挥作用...
- 信用评分预测:使用逻辑回归或决策树预测贷款违约风险。 - 图像分类:利用CNN进行图像识别,如MNIST手写数字识别。 - 推荐系统:协同过滤、基于内容的推荐等方法实现个性化推荐。 9. **代码笔记**: "kwan...
cole_02_0507
内容概要:南京邮电大学工程硕士研究的无线传感器网络路由技术。通过对无线传感器网络路由协议的历史和研究现状进行了详细探讨,着重介绍了SPIN、LEACH、TEEN、pEGASIS等常见协议的特点、优势与局限性。文中分析了现有路由协议中的能量管理和网络覆盖问题,并提出了一种结合最大覆盖模型的改进型能量LEACH协议来应对这些问题。该研究旨在提高无线传感网络能量效率和覆盖效果,从而拓展其在各行业尤其是环境监测和军事安全领域的大规模应用。 适合人群:本篇文章主要面向具有无线传感网路研究背景或对此有兴趣的研究人员、工程师和技术爱好者,特别是在能源消耗控制上有较高需求的应用开发者。 使用场景及目标:①帮助理解和选择合适的无线传感器网络路由技术;②指导开发新路由协议时关注的关键要素;③为企业实施物联网相关项目提供理论支撑。 其他说明:文章强调了优化算法对于改善系统性能的重要性,并展示了具体的实施方案。通过仿真实验对不同协议的效果进行了验证,体现了科学研究的严谨态度与实践导向。
【东海期货-2025研报】东海贵金属周度策略:金价高位回落,阶段性回调趋势初现.pdf
【资源介绍】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,也可以作为小白实战演练和初期项目立项演示的重要参考借鉴资料。 3、本资源作为“学习资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研和多多调试实践。 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip 图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程,简化了深度学习项目的数据准备工作).zip
diminico_02_0709
agenda_3cd_01_0716
目录: 第1章 Linux命令入门及VIM编辑器 第2章Python基础 第3章Python面向对象编程 第4章数据结构与算法 第5章UDP与TCP通信 第6章多进程编程 第7章多线程编程 第8章协程 第9章正则表达式 第10章 Http协议 Web服务器并发服务器 第11章网络通信过程 第12章 Python提高1 第13章 Python提高2 第14章 Mysq|基本使用 第15章 Mysq|查询 第16章Mysql与Python交互 第17章Mysql高级 第18章WSGI-miniWeb框架 第19章闭包装饰器 第20章 mini-web框架 添加路由-MySQL功能 第21章 mini-web框架 添加log日志路由支持正则 第22章元类与ORM-面向接口编程
diminico_02_1108
基于人工智能大模型技术的果蔬农技知识智能问答系统.pdf
diminico_02_0307
dawe_3cd_01_0717
anslow_3ck_01_0319
C#全自动多线程上位机源码编程:替代传统PLC触摸屏、以太网通信,强大功能多级页签,支持西门子PLC和OPC,安装KepserverEx5,链接其他数据库,C#多线程自动化工控屏幕上位机源码编程系统:功能强大,多级页签,通信灵活,兼容多种配置与数据库连接,C#全自动多线程上位机源码编程 0, 纯源代码。 1, 替代传统plc搭载的触摸屏。 2, 工控屏幕一体机直接和plc通信。 3, 功能强大,多级页签。 4, 可以自由设定串口或以太网通信。 5, 主页。 6, 报警页。 7, 手动调试页。 8, 参数设定页。 9, 历史查询页。 10,系统设定页。 11, 赠送所有控件。 12,使用的西门子Plc。 13,注册opcdaauto.dll组件,用于使用opc。 15,安装kepserverEx5。 16,可以链接其他数据库。 ,核心关键词: C#; 全自动多线程; 上位机源码编程; 纯源代码; PLC替代; 通信; 强大功能; 多级页签; 串口或以太网通信; 主页; 报警页; 手动调试页; 参数设定页; 历史查询页; 系统设定页; 控件赠送; 西门子PLC; OPC
内容概要:本文详细介绍了移动应用开发的全过程,从创意构思和需求分析开始,依次阐述了原型设计、技术选型、前后端开发、测试优化、上线准备到最后的推广和后续维护,帮助读者深入了解和掌握各个环节的要点和最佳实践,特别注重实际操作中的问题和解决方法。文章不仅涵盖技术层面的内容,还包括市场营销和社会影响等方面的探讨。 适合人群:移动应用开发初学者和有一定经验的开发者,想要了解移动应用从构想直到推向市场全部过程的专业人士。 使用场景及目标:指导新创企业和个体开发者从零开始制作自己的应用程序,提供系统的理论知识以及实用技能指导。 阅读建议:本文适合分章节细读,尤其对于每个关键阶段,可以结合具体的案例研究深入理解;在实践应用时应注意参考文中提到的实际开发中容易碰到的问题及其解决方案。
axios-min.js
Rust语言教程:从入门到进阶 Rust是一门注重性能、内存安全以及并发的系统编程语言。它被设计用来替代C和C++,同时提供更高的安全性和更好的并发支持。本教程将引导你从Rust的基础语法开始,逐步掌握到更高级的概念。 一、Rust入门 1. Rust安装 工具链安装:通过rustup安装Rust工具链,它包含Rust编译器、Cargo包管理器以及标准库文档。 验证安装:在终端运行rustc --version和cargo --version来检查Rust和Cargo是否成功安装。 2. Hello, World! 创建一个新的Rust项目:cargo new hello_world --bin。 进入项目目录:cd hello_world。 编辑srcmain.rs文件,添加fn main() { println!(Hello, World!); }。 编译并运行项目:cargo run。 3. Rust基础语法 变量:使用let关键字声明变量,默认情况下变量是不可变的(immutable)。 数据类型:整数(i32, u32等)、浮点数(f32, f64)、布尔值(bool)、字
anslow_05_0109
【宝城期货-2025研报】国债期货:国债期货底部震荡为主.pdf