智能风控实践指南:从模型、特征到决策

978-7-115-57597-5
作者: 蒋宏
译者:
编辑: 张涛

图书目录:

详情

内 容 提 要 随着人工智能技术的进步和消费金融行业的快速发展,智能风控已经成为金融行业的刚性需求。本书围绕智能风控的关键环节一一展开,同时结合具体的智能风控实例进行解析。 本书共6章,主要内容包括智能风控的发展,搭建智能风控模型体系,搭建风控特征画像体系,搭建智能风控策略体系,智能风控与人工的结合,以及智能风控管理。 本书适合银行、消费金融与保险等领域信贷风控模型开发人员、特征挖掘人员和策略分析人员,以及金融科技领域从业者、咨询行业从业者和其他对智能风控感兴趣的人阅读。

图书摘要

版权信息

书名:智能风控实践指南:从模型、特征到决策

ISBN:978-7-115-57597-5

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

版  权

主  编  蒋 宏

组  编 融360 模型团队

编  著 马海彪 王 欢 王 超

责任编辑 张 涛

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e57597”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。

内容提要

随着人工智能技术的进步和消费金融行业的快速发展,智能风控已经成为金融行业的刚性需求。本书围绕智能风控的关键环节一一展开,同时结合具体的智能风控实例进行解析。

本书共6章,主要内容包括智能风控的发展,搭建智能风控模型体系,搭建风控特征画像体系,搭建智能风控策略体系,智能风控与人工的结合,以及智能风控管理。

本书适合银行、消费金融与保险等领域信贷风控模型开发人员、特征挖掘人员和策略分析人员,以及金融科技领域从业者、咨询行业从业者和其他对智能风控感兴趣的人阅读。

序  一

金融行业高度数据化,是人工智能和云计算等数据驱动技术非常好的应用场景。近年来,随着5G、大数据和区块链等技术的发展与进步,金融科技向传统金融领域不断渗透,智能风控应运而生。

智能风控不仅保证了金融机构业务的效率和安全性,还具有自动化、规范化特点,这让整个风控管理流程变得高效、便捷。

融360作为国内领先的数字金融服务平台,已在智能科技领域深耕多年。随着技术的发展和更新迭代,未来的风险管理要能做到跨越周期和时空,打破学科的边界,持续推动金融服务行业的高质量发展。融360对科技的追求与锻造从未停止,我们希望通过科技来实现“让金融更简单,成为每个人的金融伙伴”的愿景。

在智能风控应用中,模型、特征和策略是极为关键的环节,本书围绕它们,采用理论与实践相结合的方法,讲解了金融科技的整个风控流程。本书内容均来自融360模型团队在智能风控中的实践和经验总结,有很好的借鉴和学习意义。我们希望通过这种方式,促进智能风控领域的行业技术交流,共同推动行业规范、健康发展。

——叶大清

融360联合创始人、董事长兼CEO

序  二

人工智能技术在近些年飞速发展,得到了全社会的广泛关注,很多智能产品(如智能家居、智慧金融等)融入我们的生活当中。2021年,融360已成立10年,作为国内领先的移动金融智选平台,融360利用先进的人工智能技术为“普惠金融”赋能,在智能风控、搜索推荐、精准营销等领域取得了丰硕成果,积累了丰富的经验。作为纽约证券交易所上市公司之一,融360有能力也有责任分享成熟的经验,助力行业的发展。

本书以金融场景为依托,详细介绍了人工智能在风控领域中的应用。与市面上同领域的其他图书相比,本书的特点是“全面而不失细节”,从模型、特征到策略,以方法论为切入点,阐述了风控模型从构建到应用的基本流程,并提供了详细的实现代码和宝贵的实践经验。

本书以理论为基础,同时注重方法的应用和在项目中的落地,适合风控从业者全面掌握风控系统的核心知识点,并能带来启发。

——刘曹峰

融360联合创始人、CTO

序  三

作为从业二十余载的金融风控人,在判断一个风控人员或模型人员是否可靠,以及是否达到资深水平时,我首先观察两点:第一点,他有没有经历过一个完整的经济周期,是否能够在任何经济环境下都能通过行之有效的风控模型与策略持续、稳健地发展业务;第二点,他是否关注风控体系的建立,而不是单纯地搭建风控模型。

本书作者之一蒋宏即为以上两点兼备的智能风控专业人士,他在本书中列举的案例全部来自他及其团队过去6年在消费金融领域的实践。他所在的公司经过行业一轮轮“洗牌”,仍然站稳市场。因此,本书对于相关从业人员具有很高的学习价值!

消费金融行业在从人工风控向智能风控转型的这十多年间,先后经历了从没有模型到片面地以模型为“王”。单独存在的模型仅仅是让数据“说话”的技术,只有存在于一个完整风控体系内的模型才是能够让智能创造价值的艺术!

——叶梦舟

融360旗下时光金科总裁

序  四

风险管理是金融机构运营管理中的重要环节。传统金融风控主要依靠人工审核,以主观经验分析央行征信资料和客户提交的资料,存在效率低下、精度不够的痛点。面对不断提高的监管标准,利用金融科技提升智能风控能力是金融机构的必然选择。

智能风控涉及大数据、人工智能、云计算等多项技术。智能风控需要将数据和算法作为技术核心应用于风险管理。随着多元化的消费需求不断涌现,以及消费金融行业的快速发展,智能风控人才缺口巨大,优秀人才更难寻。

这是一本手把手教你成为优秀的智能风控全栈专业人才的书!

本书结合智能风控一线从业人员的经验,全面解读了智能风控领域的三大核心组件——特征、模型和策略。对于每一部分,本书又从整体理论框架、智能方法和应用体系搭建3个方面进行了详细阐述。本书结构清晰、完整,内容翔实,具有理论与实践相结合的特点。

本书包含大量实用的示例代码,读者可以参考。作者对智能风控团队管理的思考值得读者借鉴。无论是智能风控方向的算法工程师、分析师,还是担负管理职责的经理人,都能从本书中获益。

——肖勇波

清华大学经济管理学院教授

序  五

风控是金融的核心,智能风控是前沿热点。智能风控的内涵是什么?本书鲜明地指出,智能风控不仅仅是一种技术,更是贯穿产品设计、数据、模型和决策,甚至制度的风险管理体系。

本书内容翔实,结构清晰,从业务全貌到技术落地,再延伸到业务决策,最终升华为文化制度。

在业务层面,本书对业务场景、风控流程体系的介绍相当完整,可拓宽模型人员的知识边界。

在技术层面,本书不仅介绍了标准、规范的建模流程,还剖析了机器学习、图网络等算法。同时,本书兼顾理论和实践,配备代码,适合读者实操。

本书是融360模型团队多年实践经验的系统总结,是一本相当不错的书,值得大家细读。

——冯海杰(知乎ID:求是汪在路上)

360数科高级模型算法工程师

序  六

现代社会的每一个市场主体都有可能存在资金需求,需要向金融机构借款,如个人消费、企业经营等场景。金融机构在授信放款之后将面临借款人违约带来的信用风险损失。如何量化评估信用风险成为每个金融机构需要解决的核心问题。信息不对称问题导致金融机构无法轻易了解借款人的全部实际情况,因而通过多个维度的数据,应用先进的机器学习算法,对借款人的违约概率进行量化评估就显得尤为重要。

随着移动互联网的成熟,用于评估违约风险的数据已经从传统的征信报告扩展到了各类征信替代数据,个人金融服务场景也从线下转移到线上,这些都促进了金融风险管理的快速发展。在这个背景下,融360模型团队基于其在消费信贷领域的经验,介绍了智能风控在业务落地过程中各个环节的方方面面,并结合实际案例进行了说明,编写了一本高质量的智能风控参考书。

我与本书作者之一蒋宏相识于2017年,当时他已经在国内头部风控咨询公司管理风控团队,从事信用评分和风险管理相关的咨询工作,拥有丰富的实践经验,相信读者能够通过本书了解智能风控在消费信贷领域的应用,从而在未来为风险管理的发展做出贡献。

——谢士晨

R包scorecard(Python版本scorecardpy)作者

对本书的赞誉

在数字化浪潮下,企业能力变革、风控转型为先。本书专业而不晦涩,以平实的笔触、精彩的案例,介绍了如何利用日趋完善的数据构建涵盖分析模型、特征画像、风控策略的智能化风控体系,称得上是数字化转型浪潮下风控领域同仁自我精进的“指南”。

——尤忠彬,德勤咨询-数据科学卓越中心主管合伙人

本书从智能风控技术起源到成熟的发展过程入手,系统地阐述了智能风控技术的原理、算法和优势,同时结合大量行业实战经验和教训,介绍了从理论到实践的整体框架内容。对于智能风控行业的入门者,本书是一本好的入门教材;对于智能风控行业的资深从业者,本书是一份好的进阶资料。

——段莹,百融云创合伙人、高级副总裁

金融科技的影响已经深入生活的方方面面,智能风控作为金融科技的细分领域,在这一系列变化的背后发挥了重要作用。本书作者之一蒋宏经历了从传统风控向智能风控转型的全过程,以自身实践为基础,系统地梳理了智能风控发展的脉络,从理论和实践的角度给出了有价值的洞见,为希望理解和实施智能风控的读者提供了学习路线图。

——季元,中国邮政储蓄银行风险管理部高级风险专家

随着信贷审核的线上化和自动化,风控审核的效率大幅提升,同时带来了新的技术挑战。本书系统地阐述了从传统风控到智能风控的演化,以及二者的差异,提供了风控模型的数据处理、特征设计和富有特色的建模方法,介绍了基于风控模型的智能风控策略的制订、实际效果的持续监控,以及模型策略的调整和迭代。本书涵盖智能风控技术的特征、模型、策略等方面,是金融科技在风控领域实践的经验总结。

——邹宇,携程大数据与人工智能应用研发部负责人、技术VP

人工智能和金融风控的结合是当今信贷风险管理的主流方向。本书介绍了智能风控的发展历史,并围绕风控模型、特征画像、风控策略等核心环节,系统讲解了智能风控在信贷领域的应用。本书作者之一蒋宏结合自身多年的人工智能算法和信贷风控实践经验,从实际工作出发,结合融360模型团队的实战经验编写此书。本书具有很强的实操性,适合风险管理和金融科技相关从业人员参考与学习使用。

——郑宏洲,盛银消费金融首席风险官

本书介绍了智能风控的演变过程,内容覆盖了信贷风控的全生命周期,将理论框架与实践案例分析进行了有效结合,突出了智能风控应用的实操性。对于立志和已从事智能风控的人,本书内容精练、易懂,值得反复品味。

——辛园,神州信息金融科技首席风控官

搭建一个系统化的智能风控体系是成功建立一个互联网科技金融业务模式的必备要素。本书作者之一蒋宏有多年基于大数据进行风控建模和策略制订的经验,在他及其团队的努力下,本书系统地剖析了智能风控,在不脱离具体实操的基础上,给出了整体解决方案。如果有志于在智能风控领域精进的人想找一本书来学习,那么非此书莫属。

——朱涛,狮桥集团首席风控官

本书是一本实践指导意义非常强的书,凝聚了作者多年的一线建模、特征工程和策略实践经验。本书结构合理、内容丰富、讲解深入浅出,适合银行信贷风控相关人员阅读。

——李振,民生科技有限公司数据业务研发团队总监

本书讲解了智能风控的模型、特征、策略三大核心内容,帮助读者理解智能风控在业务场景中的应用过程。本书中有大量项目案例和代码示例,实操性很强。本书是一本不可多得的适合智能风控技术相关人员学习的图书!

——艾辉,融360技术总监、《机器学习测试入门与实践》《大数据测试技术与实践》作者

DataFun作为大数据与人工智能交流的社区,已邀请超过千位具有丰富数智化经验的专业人士来此分享技术与经验,本书作者之一蒋宏就是受邀的专业人士之一。本书梳理并总结了作者及其团队多年的实践经验,并以严谨、系统的方式进行呈现,相信能够让那些即将或已经从事智能风控的同行少走弯路。

——王大川,DataFun创办人

前  言

风险控制是消费信贷产业的核心。随着大数据、人工智能等技术的快速发展,智能风控技术应运而生。智能风控在传统风控技术的基础上大幅提升了风控效果,提高了风控效率。新兴的金融科技企业、创新的金融模式不断涌现。在金融监管趋紧的背景下,一些金融机构或企业逐步向持牌和纯技术赋能两个方向转型,行业变得越来越规范和健康。行业的蓬勃发展促进了智能风控技术的提升,使得智能风控技术得到实践的检验。智能风控逐渐成为金融机构风控的主流模式。

智能风控为信贷行业的发展带来了新动力,为利润的增加提供了新引擎。我们已经见证了风控审批耗时的大幅缩短,从数天到数秒;审核流程的极大简化,客户足不出户即可完成信用借款;金融机构风控能力得到提高,风险控制水平持续提升。眼光长远的金融机构不断加大在智能风控上的投入,持续提升智能风控能力。

作者从事风控、模型算法相关工作多年,曾在咨询公司为金融机构提供反欺诈和数据挖掘相关咨询服务,随后在互联网金融发展之初进入该领域,持续参与了智能风控的创新,并见证了其发展。本书对智能风控的核心环节——风控模型、特征画像、风控策略,进行了详细讲解和总结,形成了一套标准化的方法和算法体系,并结合实际工作中的案例进行详细说明。通过本书,作者对过去的工作进行了梳理、深度思考和复盘,并总结了不少宝贵的经验,希望它们能为读者提供参考。

目前,市面上的一些智能风控图书着眼于算法的介绍,讲述各类算法的原理,以理论为主,还有一些智能风控的图书则着重讲述某种技术及应用,如信用评分卡建模等具体技术及应用,以实践为主。本书将整个信贷风控体系与人工智能算法紧密结合,既有系统性的方法框架,又有实践应用的案例,内容丰富、实用。本书的特点如下。

本书囊括智能风控的模型、特征和策略三大块内容,构建了智能风控的完整决策链条。

本书以智能风控方法论为主线,紧密结合智能算法,并配有实践案例。相比单独的算法介绍或理论分析,本书内容更具实操性。

本书将金融科技领域先进的风控实践经验作为核心内容。相比传统的信贷风控方法,本书内容更具先进性。

本书以人工智能领域流行的Python语言实现实践案例,符合智能算法和编程语言未来的发展趋势。

基于以上特点,本书适合以下人员阅读。

银行、消费金融、小贷与保险等信贷风控模型开发人员、特征挖掘人员和策略分析人员,以及金融科技、咨询行业相关从业者。本书为入门者提供了系统化的知识地图,使他们能够结合实际案例进行实践;为资深从业者提供内容丰富的参考资料。

与信贷风控人员紧密配合的技术开发人员、产品经理、审批催收人员等。本书可以帮他们掌握智能风控的业务逻辑和常用方法,以更好地与风控团队开展合作。

其他对智能风控感兴趣的读者。

本书共6章,各章内容如下。

第1章介绍智能风控的发展历史,以及智能风控的相关概念与应用。

第2章介绍搭建智能风控模型的方法、智能算法、模型优化和模型体系等,并给出模型开发实践经验。

第3章介绍搭建风控特征画像体系的方法、智能算法、特征挖掘和特征画像体系等,并给出特征挖掘实践经验。

第4章介绍搭建智能风控策略的方法、智能算法、策略体系和策略监控等,并给出策略实践经验。

第5章介绍智能决策与人的结合,剖析智能风控的局限性和如何发挥人工的价值。

第6章介绍智能风控管理的相关经验,解读智能风控中的一系列管理原则。

第2~4章为本书的核心。本书采用从方法论到算法,再到实践案例的结构,其中方法论包含方法框架和整体流程,算法是整体流程中可以替换的关键组件,如同CPU之于计算机,方法和算法最终将应用于不同的业务场景。

本书内容涉及智能风控的模型、特征和策略,以及智能风控管理全流程,读者可以按章节顺序阅读,或者根据自身知识背景和需求有选择地阅读相应章节。本书需要读者有Python编程基础。本书部分代码输出结果为Jupyter Notebook显示风格。

由于作者水平有限,书中难免出现疏漏和不足之处,希望读者谅解并欢迎读者指正。

蒋宏

第1章 智能风控的发展

金融信贷行业是一个古老的行业。世界上已知最早的信贷法出自大约公元前1776年颁布的法律汇编《汉谟拉比法典》,它规范了贷款发放、还贷方式、担保模式、债权债务等业务流程和风险管理过程。风控技术经历了漫长的发展,逐渐从基于人工经验的方法,过渡到统计量化的方法。近些年,随着云计算、大数据、人工智能(AI)等技术的爆发式发展,风控已经进入全新的智能风控时代。

根据风控技术在各个阶段采用的主要方式和方法,作者将其大致总结为3个层次——基于人工经验的风控、传统统计量化的风控、智能风控。3个层次分别对应着风控技术的3个发展阶段。

1.1 早期的风控技术

早期的风控技术主要是指基于人工经验的风控技术和传统统计量化的风控技术,这一时期的风控技术正处于从单纯的基于人工经验的风控逐步过渡到具备一定量化风控的阶段。

1.1.1 基于人工经验的风控

从最早的信贷活动开始,从业者就采用基于人工经验的方式来判断风险。经过多年的发展,人工经验的风控发展出了多种模式,比如信贷员模式、审贷会模式。信贷员模式比较简单,完全由信贷员发展客户,收集客户资料,对客户真实性和风险进行审核,负责客户的贷后跟进。随着小额信贷的进一步发展,审批机构中逐步引入了审贷会,信贷审批不再由一个信贷员单独决定,而是由专业化的审核员进行风险评估。

人工经验风控模式整体流程如图1-1所示,金融机构需要借款人提供各式各样的证件资料,资料审核人员对资料的真伪进行人工辨别,风控审核人员基于经验判断欺诈风险、还款意愿和还款能力等。客户通常还需要到信贷机构线下网点进行资质审核、合同签订等流程。对于更大额的贷款,风控审核人员需要到申请人的工作现场进行尽调,以评估借款风险。此时,风控审核人员是风控中非常重要的角色,掌握着借款申请是否通过的关键决策权。

图1-1 人工经验风控模式整体流程

基于人工经验的风控具备非常好的灵活性,只要招募合适的风控审核人员,就能够快速建立风控团队并开展风险审核工作。但人工经验风控模式存在一系列弊端:风控审核人员的能力和经验有差异,审核质量、准确性无法保证;受限于审核人力瓶颈,效率低、成本高;人工经验,以及数据的收集和处理能力有限,难以评估信用资质欠缺的申请人;人工操作风险和道德风险难以避免。

1.1.2 传统统计量化的风控

随着20世纪50年代美国信用卡的快速发展,人工经验风控已经不能适应小额消费信贷发展的需求。此时,数据库技术、统计学、计算机的发展为量化风控奠定了基础。信贷活动中积累的大量数据能够反映客户的还款意愿和还款能力,以TransUnion、Equifax和Experian三大征信机构为代表的社会征信数据体系随之建立。利用统计量化的方法建立信用评分模型来进行风控逐渐成为主流。

传统统计量化的风控模式如图1-2所示,它为集中审核的模式。集中审核模式中所有的信贷申请都会统一流转到风控中心,审核过程中引入信用评分对客户风险进行分层,自动拒绝高风险客户,其他客户进入人工审核。风控中心还设立反欺诈人工调查等部门,对欺诈案件进行排查。

图1-2 传统统计量化的风控模式

其中,信用评分的发展经历了以下两个阶段,第一阶段是以客户分类为核心的信用分析,主要进行单个维度的统计分析,在此基础上,对客户进行分类处理;第二阶段是以预测模型为核心的信用评分模型,通过借款人自身属性信息和外部征信机构信息,提取特征,运用统计方法,预测借款人的风险水平,然后进行分级处理。信用评分模型中的典型技术是信用评分卡技术。信用评分卡基于逻辑斯谛回归模型建立,以信用分来表示风险高低,并将信贷借款人的各个特征维度以分数的方式量化,便于风控业务人员理解。

统计量化模型的应用为风控带来了诸多好处:①更加客观,避免了审核人员的偏见;②更加准确,以历史数据表现为决策依据;③更加稳定,基于客观数据决策,没有人为操作风险;④更加高效,可以达到部分自动实时决策。但是这个阶段的风控仍面临诸多挑战:①数据维度不够充足,主要还是依赖强征信数据,对征信数据较少或缺失的客户的识别不准确;②信用评分卡技术处理的数据维度有限,模型只用到几个到几十个数据维度;③虽然已经减少了人工操作,但是诸如电话审批这些环节依然依赖人工。

1.2 初识智能风控

智能风控是在传统统计量化的风控基础之上融入更多人工智能元素发展而来的。随着互联网金融的兴起,智能风控逐步成为风控的主角。智能风控发展的关键驱动因素包括:经济层面,金融机构住户消费贷款和互联网消费金融放贷规模快速增长,个人消费贷款额持续高速上涨,金融机构不良贷款率增加,急需更先进的风控技术;社会层面,我国人均可支配收入快速增长,消费结构从生存型向发展型升级转变,形成对消费金融的强需求;技术层面,大数据、人工智能、云计算等金融科技代表技术为智能风控的应用落地提供了强有力的技术支持。

1.2.1 智能风控的定义

智能风控是利用大数据、人工智能技术和科学决策方法,通过自动化预测、评级、决策等方式,替代风控中的人工操作,完成人工无法完成的任务,优化营销、风控、定价、放款和贷后管理等环节,提高决策精度和效率,降低成本,最终提高风控能力的综合体系。智能风控的整体框架如图1-3所示。

图1-3 智能风控的整体框架

智能风控是一个综合体系,并不是单一的某个算法或者技术。智能风控方法层面包含预测模型搭建方法、数据挖掘方法、风控策略制订方法等,通过一系列方法,可以构建智能风控的基本架构;工具层面包括机器学习、深度学习和关系网络等智能算法,这些智能算法是方法体系中的核心部件,也是智能风控得以展现智能的关键;实现方式是建立自动化体系,运用智能风控的方法论搭配智能算法构建智能决策的核心,结合工程技术实现自动化的风控决策和智能交互,自动进行模型迭代;应用环节包括风控流程的全过程,从信贷营销到贷前准入、定价,再到贷中额度调整,最后到贷后催收管理,都融入了智能风控的元素;从目标方面来讲,智能风控提高了风险控制的精准度和效率,将风险控制在目标范围内,最终提高企业的盈利能力。

1.2.2 智能风控的发展

智能风控伴随互联网金融的发展而发展,大致经历了萌芽期、发展期和成熟期3个阶段,如图1-4所示。

图1-4 智能风控发展历程

1. 2005~2012年:萌芽期

互联网金融产生,P2P模式兴起,网络金融突破了地域限制,此时,线下模式和线上模式同时发展,线上模式的规模效应明显,边际成本降低,发展速度较快。线上模式的互联网金融公司必须建立纯线上风控模式以适应新业态,它们开始寻找新的数据和技术来探索智能风控模式。

2. 2013~2015年:发展期

在这个阶段,互联网金融高速发展。据网贷天眼统计,2014年,P2P行业整体交易规模突破2500亿元,比2013年上涨接近140%。人工智能技术(如机器学习、语音识别和图像识别)取得重大突破,互联网金融企业纷纷引入新技术,优化模型和系统,逐步搭建智能风控体系。

3.从2016年至今:成熟期

2016~2017年,趣店、拍拍贷、简普科技等平台在美国进行IPO,掀起互联网金融类公司上市的浪潮。上游征信和大数据、金融科技市场迎来爆发式增长,大数据+人工智能算法成为风控领域的主要工具,智能风控应用逐渐成熟,成为互联网金融企业的核心竞争力。

根据艾瑞咨询研究院对2018~2022年中国AI+金融相关市场规模的统计和预测(见图1-5),金融领域对整体信息化科技投入的总规模保持上升趋势,金融科技和金融场景AI投入遵循同样步调,其中AI投入在整体科技投入中的占比平稳上升,说明市场中的需求方肯定了AI技术的应用价值,并有计划地加大购买力度,也从数据上验证了智能风控应用比例的持续提升。

来源:艾瑞咨询研究院自主研究和绘制。

图1-5 中国AI+金融相关市场规模的统计和预测

随着互联网金融行业的发展,监管也逐步介入,开始清理行业中的乱象,违法违规企业被清退,平台逐步走向正规化,或者转型为纯金融科技平台,行业逐步走向健康、成熟,拥有先进智能风控技术的企业的行业竞争力进一步提高。

1.2.3 与传统风控对比

相较于传统风控,智能风控存在诸多优势,它在传统统计风控的基础上,引入更加多元的模型技术和更广泛的数据维度。智能风控与传统风控的对比如表1-1所示。

表1-1 智能风控与传统风控的对比

对比维度

基于人工经验的风控

传统统计量化的风控

智能风控

决策方法

人工决策

人工决策和模型自动决策并重

模型自动决策为主

风控模型

传统评分卡技术

机器学习(如XGBoost、LightGBM)、深度学习、自然语言处理、关系网络

特征维度

较少

几个到几十个维度

几千到几万个维度

数据来源

客户自填、线下资料收集

客户自填信息、征信信息

客户自填信息、征信信息、客户行为信息等

通过表1-1可知,相较于传统风控,智能风控在以下4个维度有明显优势。

在决策方法维度,智能风控以模型自动决策为主,相比传统方法,极大地提升了效率,节约了人力成本,信审人员转而进行个别欺诈案例分析和跟踪的工作,即弥补模型在无历史数据的情况下无法预测的不足。

在风控模型维度,智能风控以机器学习、深度学习、自然语言处理、关系网络等技术为主,相比传统方法,精确度更高,可以挖掘更高维度的数据,充分利用弱征信数据识别风险。

在特征维度,得益于新算法和大数据计算处理能力的提升,风控特征画像维度可以轻松达到几千维,甚至上万维。

在数据来源维度,智能风控将原来很少用于信用评估的行为类数据充分利用起来,相比传统的征信信息和客户提供的信息,数据维度更加多元、复杂,能够从多个角度反映客户的资质和潜在的风险。

1.3 智能风控主要应用

智能风控的应用可以覆盖包含信贷业务的营销、贷前、贷中、贷后等在内的业务全流程。依托智能风控技术,金融机构可以对客户进行及时有效的身份识别、欺诈识别、信用风险判断,同时实现全链条自动化决策。智能风控的应用可以分为图1-6所示的4个方面。

图1-6 智能风控的应用

下面分别对营销、贷前、贷中和贷后环节的智能风控应用进行介绍。

1.3.1 应用于营销环节

营销是信贷风控的第一个环节,营销环节决定了金融机构获得何种质量和偏好的客户。营销和风控的侧重点不同,营销端负责获取大量客户,风控端负责筛选出好客户。当前被认可的广义的风控是从营销入口开始的,这使得营销和风控在更高的层面上达成了一致。营销的目标是获取符合期望的目标客户,而不仅仅是获得一定数量的客户。营销环节的智能风控应用主要包括客户意向评估、客群细分和客群分层。

1.客户意向评估

营销的第一个关键点是找到有需求且有意向购买信贷产品的客群,提升营销环节转化率,从而降低分摊到每个申请客户上的成本。

在智能风控中,我们利用从营销环节到申请环节可以获得的多维、异构化、高度分散的数据,进行整合分析,形成客户画像,同时利用机器学习技术建立营销响应模型。根据客户响应概率,客户可分为高响应客户、中响应客户和低响应客户。针对不同的响应级别,金融机构可以设置不同的营销策略,如对高响应客户采取主动营销策略(如电话营销),对低响应客户可暂时放弃,以降低营销成本。

2.客群细分

不同类型的客户对信贷产品的需求不同,根据客户的不同需求,有针对性地营销产品,有利于提升申请转化率。当然,不同人的需求有很多共性,金融机构提供的产品是有限的,有效的做法是区别对待每一群人,为“相似”的人提供同一类产品。

在智能营销中,通过建立客户分群模型,可以将具有多个相似特征的客户划分到一个细分群体,进而分析细分客群的需求,提供相应的信贷产品。例如,在细分客户中,发现有车人群,可以设计针对车主的营销方案和定制产品。

3.客群分层

客群分层是指将潜在的信贷申请客户预先进行风险等级评定,从而在营销之前将一些高风险客户排除在外,为低风险客户提供更有吸引力的金融产品。

在智能风控中,通过建立一系列客户筛选规则和预授信模型,对客户进行分层评估,从而有区别地进行营销。营销阶段的客群分层有利于降低整体客群的风险水平,提高转化率,降低营销成本。我们可以认为,客群分层是一种风控前置的方法。

1.3.2 应用于贷前环节

贷前风控是一个在客户申请和放款之间对申请人进行风险评估的风控环节。智能风控通过收集大量数据,运用机器学习模型,预测客户的风险概率,自动评估信贷申请人的身份真实性、信用等级和风险等级,并给予相应的信用额度和定价。我们可以通过数据和技术消除信息不对称性,降低不确定性;通过自动化决策,降低成本,提高效率。贷前风控主要包括身份验证、反欺诈、信用评估,以及额度和定价评估。

1.身份验证

身份验证是为了确认信贷申请行为中实际操作人与信贷资料上显示的是否一致。

智能风控采用多种手段结合的方式进行身份验证,包括使用人脸识别,并与官方人脸信息库比对;使用活体检测技术,判断操作人是否为真人操作;利用官方身份信息库,校验身份证等证件信息的准确性。

2.反欺诈

信贷欺诈是指在金融信贷各个环节中使用虚假身份、冒用他人身份或者伪造信息以骗取信贷的行为,其中以申请贷款中的欺诈为主要类型,即贷前申请欺诈。随着线上信贷业务的飞速发展,欺诈案件数量不断增加。

在智能风控中,我们已经通过身份认证技术解决了一部分身份欺诈问题,但是,还有更隐蔽的欺诈方式,需要借助多元化的工具解决。例如,我们从关系网络数据、设备信息等多种高维度数据中挖掘特征,构建一系列反欺诈规则和模型,提高欺诈案件识别率。

3.信用评估

信用评估是为了确认借款人的还款可信度等级(即信用等级)。信用等级可以解构为两个维度:还款意愿和还款能力。还款意愿可以通过借款人的历史行为体现,如之前的借款是否按时偿还,还款能力可以从借款人的收入水平方面判断。

在智能风控中,我们通常借助多维度大数据建立信用风险模型,对借款人的信用等级进行评估。这些数据维度包括中国人民银行征信数据、客户社交、司法、行为、搜索、电商、线上线下消费等。由于还款意愿和还款能力很难绝对区分,因此,通常将体现还款意愿或者还款能力的各维度特征综合以作为模型的输入,通过模型学习,从历史有表现的数据中找到各个维度与信用等级的量化关系,从而进行综合信用等级评估。

4.额度和定价评估

信贷产品的关键要素包括授信额度、利率、期限。额度和定价的设计实际上比大多数人考虑的要复杂得多。这些要素需要参考市场上其他竞争对手、监管限制,并结合自身客群的还款能力和风险水平来确定。然而,当我们改变额度和定价时,会反过来影响客户的借款意愿、还款能力和还款意愿,从而影响产品转化、风险水平,最终影响盈利。

在智能风控中,我们结合信用评估模型,还款能力预估模型,以及额度和定价对转化与风险的影响分析,综合确定额度和定价,并且采用大量A/B测试,采用最优化方法寻求合理的额度和定价策略。

1.3.3 应用于贷中环节

贷中环节是指贷款申请成功到贷款结清阶段,一旦客户逾期,就转入贷后环节。信贷产品一般分多期进行还款,有可能在贷款期间存在提额和提款需求,因此,贷中管理关系到还款质量、新需求是否满足和客户风险的变动。贷中风险控制主要包括额度和定价调整,交易风险和反欺诈,以及贷中风险预警。

1.额度和定价调整

贷中额度和定价调整一般有两种情况:一是客户主动发起调整申请,二是金融机构为了满足客户潜在需求而主动调整。

在智能风控中,我们一般通过贷中风险模型对客户的信用等级进行重新评估,当客户信用等级比以前高(信用更好)时,给予更高的额度和更优惠的定价。金融机构可以主动、定期地运行贷中风险模型,对客户进行信用等级评估,从而给出更合理的产品方案,这将有利于留存客户,提升客户价值。

2.交易风险和反欺诈

当客户获得授信额度后,真正的借款交易可能在贷中分多次进行。而客户的资质和风险是随着时间变化的,因此,在贷中,需要对在线交易进行仿冒和欺诈识别,对借款人的行为进行分析,有效防范和控制欺诈交易等贷中风险。

在智能风控中,我们通过关联各类数据,寻找新出现的欺诈模式,运用机器学习、深度学习、图谱学习等技术,构建贷中反欺诈规则和模型,对风险进行拦截。

3.贷中风险预警

在客户借款之后,就可以通过客户的贷中行为对客户是否会入催进行预测,从而提前知道哪些客户有可能逾期。对于高风险客户,提前介入催收,往往会取得良好的效果,因为信贷借款人往往存在从多个金融机构借款的情况,而当客户还款资金有限时,更早介入的金融机构往往更有可能收回贷款。

在智能风控中,我们可以构建贷中风险预估模型和贷中逾期识别规则,提前预判入催可能性高的客户,并采取有效措施以降低借款人入催的比例,从而降低贷款逾期率,减少损失。

1.3.4 应用于贷后环节

贷后是指借款客户逾期至催回的完整阶段。贷后管理的精细程度对客户的还款质量有相当大的影响。利用机器学习,处理贷中和贷后行为数据,以及多维度内外部大数据,可以精准预估逾期客户的早期还款概率、晚期还款概率和失联概率等,从而对不同风险等级的客户采取不同的催收策略。贷后风险控制主要包括还款预估和失联预估等。

1.还款预估

还款预估是指在借款人已经逾期的情况下,预测借款人还款的概率。针对不同还款概率的客户,采用不同的催收方式,提高还款可能性。按照逾期时间的长短,还款预估可以分为早期还款预估和晚期还款预估。早期逾期的客户很可能是由于遗忘或不方便还款而导致逾期,通过短信提醒等轻度催收方式即可回款。从策略上来讲,我们应该将催收的重点放在还款概率低的客户上。晚期逾期的客户则相反,这些逾期时间较长的客户在还款意愿或还款能力方面有问题,针对这些客户,我们应该关注其中还款可能性高的客户,对于还款可能性低的客户,可以暂时有选择性地进行放弃,或者委托第三方机构进行催收。

在智能风控中,我们可以建立各个阶段的催收模型,预估还款概率。我们通常可以将3类数据作为模型输入:第一类是客户的个人基本信息,包括年龄、性别、学历、职业、主要收入、家庭情况与住房情况等;第二类是信用历史数据,包括信用历史时间,逾期频率和严重性,以及内外部信用评分;第三类是催收信息记录,包括催收时间、催收通话时长、催收反馈等。

2.失联预估

在催收的后期,经常出现无法联系到借款人的情况。失联对催收会产生非常大的阻碍,尽早了解客户是否失联对催收的价值很大,金融机构可以对失联概率高的客户尽早进行委外处理,或者尽早收集更多的联系人信息。

在智能风控中,我们可以通过建立失联预估模型,利用金融机构内部的客户信息、交易信息和催收信息,预测逾期客户失联的可能性,从而有针对性地采取预防措施。

上面简要介绍了智能风控在信贷各个环节的应用。事实上,智能风控体系的不同环节都有相似的底层逻辑,作者从风控的全流程中抽象出核心框架,后续章节通过模型、特征画像和策略3个维度对其进行介绍。

1.4 本章小结

本章主要介绍了智能风控的发展历程,从完全基于人工经验的风控发展到智能风控,越来越多的人工风控工作被智能技术替代。相比以往的风控手段,智能风控的高效率和良好效果已经得到充分验证,智能风控的应用已出现在信贷风控的全流程中。在第2章~第4章中,我们将详细介绍智能风控实践中的3个核心工作:搭建智能风控模型体系、搭建特征画像体系和搭建智能风控策略体系。

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e57597”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。

相关图书

有限元基础与COMSOL案例分析
有限元基础与COMSOL案例分析
程序员的README
程序员的README
现代控制系统(第14版)
现代控制系统(第14版)
现代软件工程:如何高效构建软件
现代软件工程:如何高效构建软件
GitLab CI/CD 从入门到实战
GitLab CI/CD 从入门到实战
科学知识图谱:工具、方法与应用
科学知识图谱:工具、方法与应用

相关文章

相关课程