证券日报APP

扫一扫
下载客户端

您所在的位置: 网站首页 > 基金频道 > 基金动态 > 正文

基金业数字化转型专题 | 英大基金:基于大数据和图谱进行反洗钱客户尽调的研究与实践

2022-11-21 12:52  来源:中国基金业协会

    【编者按】为深入贯彻落实党的二十大精神,引导基金行业机构践行《证券期货业科技发展“十四五”规划》,共促基金行业数字化转型,按照中国证监会总体工作部署,于2022年11月开展“证券期货业数字化转型主题宣传月”活动。通过开展“证券期货业数字化转型主题宣传月”活动,搭建交流平台,展现数字化转型成果案例,激发金融科技创新活力,营造金融科技长效发展新生态。该篇为“证券期货业数字化转型主题宣传月”系列宣传之十二。

    基于大数据和图谱进行反洗钱客户尽调的研究与实践

    ——英大基金

    一、什么是客户尽职调查

    “客户尽职调查”是一个西方的商务术语,起源于美国。1933年美国证券法规定,如果证券发行人或者帮助发行证券的承销商能够证明自己已经对发行证券的公司进行了“审慎的”(CustomerDueDiligence)调查,并且将调查中所发现的问题对投资人或者股民做了披露,那么他们就不必为无法披露调查过程中没有发现的信息而承担责任。

    巴塞尔银行监管委员会以“了解你的客户”为核心,把对新客户和现有客户充分的尽职调查的作为实施“了解你的客户”政策的关键组成部分、鼓励金融机构采取有效手段识别客户,拒绝可以交易以及与执法部门合作。由美国联邦金融机构监察委员会(FFIEC)发布的《银行保密法/反洗钱检查手册》中也论述了CDD的意义。它认为“CDD的目的是使银行能够在相当程度上对某一客户会进行何种交易作出预期,从而协助银行判别交易是否潜在可疑”。CDD首先是确认客户身份,然后对与客户相关联的风险进行评估,还应包括对高风险客户做进一步尽职调查以及持续监控方面的流程。

    二、反洗钱客户尽职调查的必要性

    金融行动特别工作组FATF《四十项建议》中,在第五至第九项建议规定了金融机构的客户尽职调查措施,其措施包括以下几个方面:

    一是确定客户身份,并利用可靠的、独立来源的文件、数据或信息来验证客户身份。

    二是确定受益权人身份,并利用合理的手段进行验证,以使该金融机构明了收益权人的身份情况。对于法人和实体,金融机构应采取合理的措施了解该客户的所有权和控制权结构。

    三是获得有关该项业务关系的目的和以土属性的信息。

    四是对业务关系以及在这种业务关系整个过程中进行的交易进行持续的尽职调查,以确保交易的进行符合该金融机构对客户及其风险状况(必要时还包括资金来源)的认识。金融机构可以根据客户、业务关系或交易的类型,并在风险敏感程度的基础上确定这些措施的应用范围。对于高风险类别,金融机构应实施更严格的尽职调查。

    三、英大基金基于大数据和图谱进行反洗钱客户尽调的研究与实践

    (一)项目背景

    根据中国人民银行《法人金融机构洗钱和恐怖融资风险管理指引(试行)》及其他反洗钱监管机构的管理要求,法人金融机构应当建立完善以客户为单位,覆盖所有业务(含产品、服务)和客户的反洗钱信息系统,及时、准确、完整采集和记录洗钱风险管理所需信息,对洗钱风险进行识别、监测和报告,并根据洗钱风险管理需要持续优化升级系统。

    当前,大数据和知识图谱技术经多年发展日益成熟,公安系统已在反洗钱深度应用知识图谱分析技术,金融机构也逐步利用机器学习结合知识图谱开展可疑交易监测和风险排查。

    英大基金资产管理规模超千亿,客户尽职调查及后续管控压力大,传统数据库仅能展示单个客户的风险状况,无法展现各个风险客户的关联性,挖掘潜在风险点,也无法分析风险传递路径及风险聚集情况。

    因此十分有必要引入大数据和知识图谱相关计算,打造全新的尽职调查工具,通过社团发现、最短路径分析等成熟的图算法挖掘潜在风险,提高反洗钱尽职调查的效率与风险管理的整体水平。

    (二)项目概述

    英大基金携手恒生电子股份有限公司致力于建立健全洗钱风险管理体系,合理配置资源,对机构洗钱风险进行持续识别、审慎评估、有效控制及全程管理,有效防范洗钱风险。同时还通过建立与完善以客户为单位的反洗钱信息系统,及时、准确、完整采集和记录洗钱风险管理所需信息,反洗钱系统需支持完整的数据报送流程管理,从可疑交易筛选、报告生成、报告初审、报告复核、报告上报到回执文件接收存档全流程线上直通式管理。同时支持客户身份识别、风险评级、名单管理以及提供与第三方系统实现数据接入的接口。

    通过大数据处理、企业图谱、受益人模型、名单相似度监控等技术,基于9000万家企业、1.5亿条股权穿透服务,构建多重企业关联图谱信息,助力高效智能识别客户。

    企业股权关联图谱技术和大数据处理技术。反洗钱系统基于企业关联图谱技术和大数据处理技术,构建无限穿透的企业股权关系图谱,以及关联关系穿透信息。最终实现股权一次性无限穿透,全量数据拓扑关联,基于恒生自主研发的受益人计算逻辑,提供企业全景信息、疑似控制路径、股权关系路径、受益所有人信息及受益人控制路径等信息,实现在大数据支撑下,了解受益人和识别受益人信息。

    (三)项目实现的主要目标

    因企业数据信息较多,股权信息错综复杂、层层穿透,结合中国人民银行下发的反洗钱客户身份识别《关于加强反洗钱客户身份识别有关工作的通知》(简称235号文)的要求,每天需要计算反洗钱受益人结果,因此对大数据处理技术提出非常高的要求。

    基于大数据和图谱客户尽调反洗钱系统项目的主要目标有3个方面:

    1、大数据中台基础设施建设

    2、应用开发

    l大数据反洗钱应用

    l外部数据对接

    l图谱及指标分析

    l监管报送

    3、数据采集及比对

    4、客户管理及尽调、可疑交易、风险评估等

    5、指标及模型调整适配

    (四)技术方案

    随着资产管理规模快速增长,客户尽职调查及后续管控压力大,传统数据库仅能展示单个客户的风险状况,无法展现各个风险客户的关联性,挖掘潜在风险点,也无法分析风险传递路径及风险聚集情况。

    为满足反洗钱工作顺利开展,基于大数据和图谱客户尽调建设反洗钱系统,正是解决上述迫切需求的最好途径。

    1、系统应用架构

    本系统采用大数据应用架构,满足数据收集与存储、业务数据清洗、指标计算、实时接口、数据稽核等功能,对应架构图如下:

    建立一套满足监管要求的反洗钱系统,关键技术特点包括:²客户信息整合:支持将从不同系统数据源获取的信息,按要素整合所需数据;²灵活、智能、通用的可疑交易筛选规则,可灵活修改规则阈值,支持可疑交易试算;²支持可疑事件分析审批流程以及对应的可疑事件上报、解析、重报;²客户风险等级评估,支持审批流程以及自动到期重评;²支持客户身份识别、尽职调查信息留痕,自动发起客户身份重新识别提醒;²黑白名单查询与管理,制裁国家和地区信息管理,涉恐名单回溯;²支持产品风险等级评估,机构自评估;²年度报告及内部报表生成;²非自然人客户受益所有人核查等。

    2、系统技术架构

    (1)前端层:表示合规、内控等系统可通过Https来访问RDM云服务。(2)接口层:RDM云服务对外Api网关层是基于Nginx,提供的是REST服务的Api接口,数据格式均为JSON。(3)服务层:RDM服务是由多个微服务接口组成,基于SpringCloud技术实现,Eureka是服务注册中心,通过Eureka集群保证了服务注册中心的可靠性。(4)系统监控:通过hs-ommp和open-falcon,监控整个微服务集群的健康状态。(5)日志收集:通过kafka+logstash+elasticsearch收集各种日志。

    对应架构图如下:

    3、系统数据架构

    数据流说明:

    (1)异源数据通过数据同步工具同步至贴源数据层ODS。(2)通过数据清洗过程,从贴源层中提取产品,账户(客户),交易,持仓和TA参数类数据。此类数据保存在业务明细层中。(3)反洗钱根据各系统基础数据、客户风险等级以及第三方数据(如黑名单)按照特定规则筛选出可疑客户的交易,根据指定逻辑计算客户标签,根据客户或监管要求生成对应的报表数据。(4)大数据平台将可疑客户的所有信息(包括账户信息,交易和持仓)推送至反洗钱应用库中。反洗钱应用库根据客户标签刷新客户风险等级和生成可疑交易报文。对应架构图如下。

    4、功能目标

    (1)运维监控

    统一的任务管理、监控、运维,降低运维难度及成本。

    (2)图形化编排

    支持图形化流程编排,快速完成任务的编排工作,提高工作效率,流程中自带流程变量,节点上下文可自由通信。支持流程循环判断,支持汇流分支,支持流程节点判断满足各种复杂业务情况。

    (3)作业类型

    内置子流程,微服务,HTTP,SHELL脚本,消息队列多种执行器开箱即用,支持执行过程同异步满足各种复杂场景。支持自定义任务类型插件,方便快捷的扩展调度任务类型,满足更多个性任务调度场景。无缝对接恒生ETL工具可动态读取ETL作业。

    (4)运行处理

    完善的人工干预能力,支持强制终止、重跑、断点续跑、暂停/恢复、跳过等干预手段。

    支持多种失败重试策略、异常处理策略,手动重试、自动重试、失败跳过。

    (5)场景支持能力

    提供OpenAPI为其它系统接入调度系统提供任务的创建、修改、查询、监控、触发等接入能力。支持线上统一配置任务参数。

    (6)任务迁移能力

    批量任务的导入导出,方便在不同的环境中快速部署。

    (7)高可用能力

    提供分布式执行器,可通过扩展执行器数量提升调度能力,满足大规模任务的调度需求。

    提供资源管理,可通过配置单机执行任务数、资源占用阈值动态调整任务执行参数,保证系统可靠稳定的运行。

    5、非功能目标

    (1)支持实时数据采集技术

    数据开发平台支持多种实时数据采集技术,如针对关系型数据库,可采用恒生自研发的斗转组件,实时解析数据库日志,获取数据操作并同步到目标端;针对数据流,可通过kafka将数据流实时推送到下一个数据加工组件或者目标端,保证数据按需加工的同时进行快速流转。

    (2)支持多种源数据类型

    数据开发平台中数据同步工具支持丰富的输入源,使得用户可以方便高效的从各种来源抽取想要的数据。

    (3)支持多种输出格式

    数据开发平台中数据同步和数据计算工具支持丰富的输出格式,能够满足用户不同的数据存储需求。

    (4)支持开发任务的多版本管理

    平台提供版本管理功能,每一次开发的任务代码都可以根据需要进行版本发布和版本记录,在用户发现异常或者需要进行代码恢复的时候,可以通过以往发布的版本快速获取之前的任务代码。

    (5)支持多种数据任务执行引擎

    数据开发平台提供多种任务执行引擎,如datax、jdbc、spark、flink等,结合用户的数据源、目标端的数据库类型,选择合适的引擎有助于快速进行数据流转,减轻数据库压力。

    平台也会提供缺省的任务执行引擎,满足大多数数据开发任务的高效执行。用户只要根据平台提示,就可完成任务开发和执行。

    (6)平台作业监控

    完善的平台作业监控功能,方便开发和维护人员,及时了解任务执行情况,是否正常运行、是否执行超期、是否报错等等,同时提供维护命令,便于快速进行异常任务人工干预。

    6、系统效能

    (1)满足英大基金支持各数据加工和计算能力的需要

    数据加工和计算的任务主要针对有问题的数据按规则进行转换、数据粒度的转换,以及一些商务规则的计算。a、数据格式转换:常见的格式包括数字和字符串的转换,字符串和日期的转换,这些格式转换都可以通过开发平台快速编码实现。b、数据值转换:值转换的需求一般发生在源端数据质量有问题或者不满足目标端的数据规范时,例如数据清洗时的空值、非法值替换,数据转换时的关联值、映射关系转换等等。c、数据粒度的转换:数据开发有一部分场景是用于数据仓库和数据分析,所以数据聚合必不可免,从业务系统采集的明细的数据,可以根据仓库、集市中主题分析的数据颗粒度和分析层次进行汇总和聚合计算。d、附加数据标签:数据目标端(如数据仓库)的数据可能会来自多个部门、系统,在进入数据仓库的时候可以为数据添加附加字段,来标记数据来源,数据进入仓库的时间,这些附加字段都可以通过开发平台来自动标记和赋值,方便用户发现和检查问题。

    (2)建立了针对不同客户群体灵活配置调整的动态管控机制

    数据开发平台中数据任务的作业调度非常灵活,主要支持:

    按时间调度:具体日期(某一天)可以是每周的某一天,也可以是每月或者年,周期(间隔时间)可以隔周、天、月、时、分、秒。按工作日历调度:检查每个执行日期是否工作日,如春节、国庆等非工作日,可选择是否忽略执行任务。按cron规则作业:类似linux的crontab调度方式,可自由灵活设置执行周期、间隔。

    (3)完善了标准化的维护管理台

    支持定制化需求设计与开发,同时,定制化开发部分与产品部分代码分离,避免后续产品版本升级对定制化开发部分的影响;系统提供可靠、安全、稳定运行的监控措施;数据库及应用定期备份、恢复机制;系统性能支持较高应用并发访问,具有较合理的响应时间,具备性能调优方案;数据安全传输机制,通过互联网传输数据有安全加密机制;禁止未登录状态对系统功能访问;保护查询功能和维护功能中数据的安全,不被未授权用户使用;系统内部数据标准化,具有数据元定义规则和数据字典,系统交互遵循标准;具备不同业务功能可分阶段投产,系统业务规则及基础功能前台配置,实时生效的扩展性要求;能够根据用户数及业务容量合理规划硬件部署方案。

    (4)简化了业务流程,提升业务效率

    采用最新大数据处理技术和算法模型,受益所有人查询服务效率提升60%,服务并发请求性能提升10倍。相较传统反洗钱工作效率有显著提升,人员综合成本减少30%以上。

    (五)应用前景及项目荣誉

    1、应用前景

    基于本项目的和成果及落地案例,为我司千亿规模增长及监察稽核等工作起到保驾护航的作用,项目特点及推广应用前景如下:

    (1)推广应用门槛低,支持国产化改造

    基于BS架构,用户只需登录浏览器,就可完成所有开发、调度、管理工作。

    (2)外部数据对接无障碍

    基于厂商自主研发的数据对接组件,实现实时数据采集和流转。

    (3)适应大数据支持

    提供多种大数据类型的数据库写操作,实现高效的数据处理。支持对接厂商大数据或自研大数据底座。

    (4)丰富的系统适配功能和数据开发血缘分析

    基于Datax、JDBC方式,实现对各种主流数据库系统的支持。通过自动分析,剖析输入、输出的表格以及字段血缘和映射关系。

    2、项目荣誉

    本项目由IDCFinancialInsights组织举办的“中国金融行业技术应用场景创新案例”评选中,荣获“金融行业技术应用场景创新坚定者”奖,以及CIIS和CIO时代网联合组织举办的“2022年度数字化转型灯塔案例”评选中获奖。

-证券日报网
  • 24小时排行 一周排行
  • 深度策划

多地密集走访调研上市公司

通过调研认真解决上市公司发展中面临的具体困难和问题,加大对优质上市公司……[详情]

版权所有证券日报网

互联网新闻信息服务许可证 10120180014增值电信业务经营许可证B2-20181903

京公网安备 11010202007567号京ICP备17054264号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800

网站传真:010-83251801电子邮件:xmtzx@zqrb.net

证券日报APP

扫一扫,即可下载

官方微信

扫一扫,加关注

官方微博

扫一扫,加关注