机器学习如何助力银行挖掘更多的客户价值
01 Aug 2017关于机器学习对银行业影响的研究自20世纪以来,已经持续了很长一段时间,但一直没有获得过重大的突破。直到大数据技术的实现,摆脱了传统数据存处理技术对计算机硬件要求的枷锁,机器学习才真正在银行业务中发挥出了其实战作用,例如信用风险管理等。
机器学习(Marchine Learning)听起来比较复杂,很有未来感,但其实它的工作原理很简单。简单来说,机器学习就是结合大量类似于决策树的决策模型,来创建一个更加精确的模型。通过快速地对这些决策模型进行迭代训练,机器学习能够找到“隐藏”的最优解,特别是在统计模型中经常遗漏的非结构化数据。
· 机器学习在银行业中的应用
银行投资组合中经常会出现长尾数据,相对于传统的统计方法,机器学习对长尾数据的解释力更强。考虑到那些个体投资较少但总体数量庞大的客户,我们通常对这一群体的客户知之甚少,并且他们也是相当被动的接受银行业务。但是,机器学习能够对这类客户的行为进行很好的分析,从而指导业务人员有针对性的挖掘潜在的盈利目标。
举一个机器学习在银行业信用卡产品线中实际应用的案例,该银行的目标是针对每个客户寻求最优的信用额度,简单来说就是他们希望知道能够在哪些方面增加或减少信用额度。现有统计模型虽然已经具有了相当可观的预测能力,但当利用机器学习方法去重新训练与之相同的数据集,并在训练时添加一些诸如政策规定等非结构化数据时,模型的预测能力直接提高了1.6倍。这种改进能够从基于现有模型中风险较低的客户手中获得显著收益,由此会导致信用额度下降,并且会避免因为信用额度增加而导致的额外损失。
· 机器学习应用的局限性及解决方案
那么,是什么导致了银行业并没有更广泛地采用机器学习方法呢?通常来说,有以下三个方面的问题:首先,变量规模的扩大会使得当前的银行系统需要更多的资金进行研发和维护;其次,机器学习中许多模型都是一个黑盒子,以至于造成了预测结果的不可解释性,这严重触犯了银行业的稳定规范;最后,机器学习准确性的检验比较复杂,因此使用机器学习方法在验证环节具有一定的挑战。 尽管机器学习方法具有诸如此类的问题,但也有一些切实可行的办法来弱化这些问题。例如,直接使用现有所有可用的变量开始建模,根据每个变量对模型的贡献率快速地进行筛选,从而在不影响模型预测精度的前提下,留下一批可受控制的变量;或者是减少机器学习模型中的一些“分支”,从而获得一组核心的线性规则,这些规则所使用的变量更少,但同时还保留了原模型80%以上的预测能力。
关于银行业是否能够用更复杂的机器学习模型来获取更多的价值?这个答案是肯定的,并且也是未来银行业发展的一个趋势。机器学习通过利用银行业现有模型所忽略的大量的“小”数据,加上内外部监管系统中常见的非结构化数据,从而能够更深入的了解潜在客户需求,帮助银行挖掘更多的客户价值。
分类: 相关资讯