说到人工智能,大多会联想到聊天机器人、人脸识别、无人驾驶,但人工智能的应用绝不仅只是停留在这些具象的前沿应用场景上,就金融领域而言,人工智能还可以通过深度学习技术帮助金融机构进行反欺诈以及降低信用风险。
欺诈一直以来都是银行业的主要风险之一。银行零售业务反欺诈的本质是对实施欺诈人员进行伪造身份、联系方式、设备信息、资产信息等虚假信息的识别。传统银行拥有上亿万级的信息数据库,但由于缺乏有效的科技手段,传统规则的经验式反欺诈模型已无法应对日益演进的欺诈模式和欺诈技术。
传统银行反欺诈模型的局限
银行经过多年历史数据沉淀,拥有大量的历史违约和欺诈数据,是反欺诈的重点聚焦领域。但对传统银行来说,一些传统的反欺诈手段,无论在效率、有效性、全面性以及成本上都是银行的短板,尤其随着互联网金融的兴起,非现场交易增多,更是加剧了银行风险防控的难度。
“小众的欺诈事件越来越难以用商业经验和确切规则描述出来,国内目前的欺诈都是rule base(规则驱动)的,即凭借过往经验和从此前发生过的事实中,抽象出系列规则,每一条规则触发一种欺诈场景,交叉组合所施加的业务逻辑判断,就构成了欺诈模型,”天云大数据CEO雷涛在接受第一财经采访时表示。
“但在这个过程中,传统规则的模型就会带来很多问题,”雷涛表示,“申请欺诈就很难将一些难以描述的规则抽象出来。”
例如,团伙在某村庄以招工的名义大量收取村民的身份证,并申请信用卡,然后刷卡透支,让村民背负银行债务。此时,银行按照过往经验便会判定该村地址为欺诈地址,使该村村民抹上信用污点,然而事实并非如此。因此,对于抽象的、难以描述的金融现象,便可以借助机器处理。
作为人工智能最重要的技术——机器的深度学习,其最大价值就是能够做特征表达,通过一个数学的复杂结构来表达一些以往很难描述的金融现象,因此特别适合处理风险、欺诈以及金融产品的营销这些依靠过往经验难以准确定量的事件。
深度学习在金融领域本质上还是进行特征提取和问题描述,因为在整个金融链条上,包括借贷、个人理财、等多种金融产品和服务上,数据都起着核心作用,尤其是银行,拥有着上亿规模的标注数据。“机器的深度学习可以将这些数据通过特征表达的方式转化到复杂的数据模型上,并依靠深层的神经网络,生成多层非线性的表达,这种表达可以代替原先的简单描述,”雷涛称。“例如Alpha go,就是利用深层的神经网络解决了对棋手棋风的描述和棋手大局观的定义问题,从而使之战胜世界级冠军。”
事实上,国内目前将人工智能的深度学习技术与银行反欺诈相结合的应用还比较少,一些征信类公司开始通过提供丰富的外部数据资源来为银行提供反欺诈技术支持。例如前海征信研发部门基于Encoder-Decoder深度学习技术框架设计的智能风控专家机器人,可以应用于银行业风控反欺诈领域,解释贷款产品特性、借款人风险识别、贷款产品政策等各类问题,高效智能地服务信贷审批、贷后风控管理和资产组合经理,提升信贷产品审批速度,降低客户违约率,防范贷款欺诈风险。
同时,一些金融科技企业也正在与银行合作。例如天云大数据近期就利用其模型算法训练平台(MaximAI)为光大银行提供反欺诈方面的技术支持。基于样本数据进行一站式的模型算法训练、验证以及输出。训练完成的模型算法程序,被输出到欺诈分析引擎中,运行于大数据平台技术上,实现了实时在线对交易数据进行欺诈识别。
然而,目前在银行反欺诈方面中国与北美的差距还是很大的,硅谷的金融科技创业公司很早就将这一技术应用到金融反欺诈中。例如,京东和百度同时投资的美国金融科技公司Zest Finance,便是利用机器的深度学习这一人工智能中最重要的技术手段,从大量的数据中提取变量并采用多个预测分析模型包括欺诈模型、预付能力模型来帮助用户降低信贷成本,其核心竞争力便是数据挖掘能力和模型开发能力。
机器深度学习提升反欺诈能力
利用机器的深度学习技术反欺诈的原理,实际上是从银行反欺诈的脆弱点着手,不再只通过传统策略引擎,而是通过机器收集到大量异构、多源化的信息,包括可交叉验证信息主体所提供的信息以及第三方信息来源的真实性,形成共享库。通过对数据的采集和分析,再通过机器学习及复杂网络等模型算法技术,对数据进行深度挖掘,从传统历史数据中量化抽取风险特征指标,利用复杂网络关联分析技术从历史违约数据中发现实时欺诈业务风险指标,丰富深度学习风险模型的业务维度,建立人工智能反欺诈模型,从而发现欺诈者隐藏的蛛丝马迹,分析其数据的矛盾点和可疑点,从而识别欺诈者身份,加上与传统经验规则配合使用,大幅提升银行欺诈风险的防控能力。
欺诈分析所使用的数据主要来源内部数据和外部数据,针对不同的数据源,通过多种采集方式对数据进行有效采集,并集中在数据湖中进行融合存储。根据预测模型分析的需求,通过配套的数据处理技术工具对数据进行预处理,最终输出模型训练所需的样本数据。
就拿上述某村庄信用卡申请欺诈为例,银行可以利用复杂网络(Complex Network)技术,在不从外部引入新数据的情况下,抽取现有进件数据(application form)的关联性,从每一个进件与进件的关联中分辨出是否使用类似的电话号码、类似的地址以及类似的区域,建立的社交关联属性与其他金融数据输入深度学习网络做有监督的训练,在数十万欺诈案例数据上得到一个动态识别模型。
去年10月,美国政府发布的《为人工智能的未来做好准备(Preparing for the Future of Atificial Intelligence)》报告称,机器的深度学习是人工智能最重要的技术手段之一,同时也是人工智能取得很多进展和商业应用的基础。该报告同时还提到,现代机器学习是一个始于大数据的统计学过程,通过数据分析推导出规则或者流程,用于解释数据或者预测未来数据。
在金融科技领域,大型金融实体与Fintech企业的合作上具有独到优势,因其多年历史沉淀下来的数据,不仅仅是行为数据,更有有价值的违约数据,与人工智能目前的发展阶段非常匹配——即提供给机器“答案”的学习。
未来,随着人工智能的逐步成熟,例如当下GAN对抗神经网络等科技演进,让机器自主选择方法,我们不仅不再需要描述问题,或为提供答案而承担昂贵的试错成本,而是面向最终安全的反欺诈目标,由人工智能提供面向“目标”的学习。