證券日報APP

掃一掃
下載客戶端

您所在的位置: 網站首頁 > 基金頻道 > 基金動態(tài) > 正文

基金業(yè)數字化轉型專題 | 英大基金:基于大數據和圖譜進行反洗錢客戶盡調的研究與實踐

2022-11-21 12:52  來源:中國基金業(yè)協會

    【編者按】為深入貫徹落實黨的二十大精神,引導基金行業(yè)機構踐行《證券期貨業(yè)科技發(fā)展“十四五”規(guī)劃》,共促基金行業(yè)數字化轉型,按照中國證監(jiān)會總體工作部署,于2022年11月開展“證券期貨業(yè)數字化轉型主題宣傳月”活動。通過開展“證券期貨業(yè)數字化轉型主題宣傳月”活動,搭建交流平臺,展現數字化轉型成果案例,激發(fā)金融科技創(chuàng)新活力,營造金融科技長效發(fā)展新生態(tài)。該篇為“證券期貨業(yè)數字化轉型主題宣傳月”系列宣傳之十二。

    基于大數據和圖譜進行反洗錢客戶盡調的研究與實踐

    ——英大基金

    一、什么是客戶盡職調查

    “客戶盡職調查”是一個西方的商務術語,起源于美國。1933年美國證券法規(guī)定,如果證券發(fā)行人或者幫助發(fā)行證券的承銷商能夠證明自己已經對發(fā)行證券的公司進行了“審慎的”(CustomerDueDiligence)調查,并且將調查中所發(fā)現的問題對投資人或者股民做了披露,那么他們就不必為無法披露調查過程中沒有發(fā)現的信息而承擔責任。

    巴塞爾銀行監(jiān)管委員會以“了解你的客戶”為核心,把對新客戶和現有客戶充分的盡職調查的作為實施“了解你的客戶”政策的關鍵組成部分、鼓勵金融機構采取有效手段識別客戶,拒絕可以交易以及與執(zhí)法部門合作。由美國聯邦金融機構監(jiān)察委員會(FFIEC)發(fā)布的《銀行保密法/反洗錢檢查手冊》中也論述了CDD的意義。它認為“CDD的目的是使銀行能夠在相當程度上對某一客戶會進行何種交易作出預期,從而協助銀行判別交易是否潛在可疑”。CDD首先是確認客戶身份,然后對與客戶相關聯的風險進行評估,還應包括對高風險客戶做進一步盡職調查以及持續(xù)監(jiān)控方面的流程。

    二、反洗錢客戶盡職調查的必要性

    金融行動特別工作組FATF《四十項建議》中,在第五至第九項建議規(guī)定了金融機構的客戶盡職調查措施,其措施包括以下幾個方面:

    一是確定客戶身份,并利用可靠的、獨立來源的文件、數據或信息來驗證客戶身份。

    二是確定受益權人身份,并利用合理的手段進行驗證,以使該金融機構明了收益權人的身份情況。對于法人和實體,金融機構應采取合理的措施了解該客戶的所有權和控制權結構。

    三是獲得有關該項業(yè)務關系的目的和以土屬性的信息。

    四是對業(yè)務關系以及在這種業(yè)務關系整個過程中進行的交易進行持續(xù)的盡職調查,以確保交易的進行符合該金融機構對客戶及其風險狀況(必要時還包括資金來源)的認識。金融機構可以根據客戶、業(yè)務關系或交易的類型,并在風險敏感程度的基礎上確定這些措施的應用范圍。對于高風險類別,金融機構應實施更嚴格的盡職調查。

    三、英大基金基于大數據和圖譜進行反洗錢客戶盡調的研究與實踐

    (一)項目背景

    根據中國人民銀行《法人金融機構洗錢和恐怖融資風險管理指引(試行)》及其他反洗錢監(jiān)管機構的管理要求,法人金融機構應當建立完善以客戶為單位,覆蓋所有業(yè)務(含產品、服務)和客戶的反洗錢信息系統,及時、準確、完整采集和記錄洗錢風險管理所需信息,對洗錢風險進行識別、監(jiān)測和報告,并根據洗錢風險管理需要持續(xù)優(yōu)化升級系統。

    當前,大數據和知識圖譜技術經多年發(fā)展日益成熟,公安系統已在反洗錢深度應用知識圖譜分析技術,金融機構也逐步利用機器學習結合知識圖譜開展可疑交易監(jiān)測和風險排查。

    英大基金資產管理規(guī)模超千億,客戶盡職調查及后續(xù)管控壓力大,傳統數據庫僅能展示單個客戶的風險狀況,無法展現各個風險客戶的關聯性,挖掘潛在風險點,也無法分析風險傳遞路徑及風險聚集情況。

    因此十分有必要引入大數據和知識圖譜相關計算,打造全新的盡職調查工具,通過社團發(fā)現、最短路徑分析等成熟的圖算法挖掘潛在風險,提高反洗錢盡職調查的效率與風險管理的整體水平。

    (二)項目概述

    英大基金攜手恒生電子股份有限公司致力于建立健全洗錢風險管理體系,合理配置資源,對機構洗錢風險進行持續(xù)識別、審慎評估、有效控制及全程管理,有效防范洗錢風險。同時還通過建立與完善以客戶為單位的反洗錢信息系統,及時、準確、完整采集和記錄洗錢風險管理所需信息,反洗錢系統需支持完整的數據報送流程管理,從可疑交易篩選、報告生成、報告初審、報告復核、報告上報到回執(zhí)文件接收存檔全流程線上直通式管理。同時支持客戶身份識別、風險評級、名單管理以及提供與第三方系統實現數據接入的接口。

    通過大數據處理、企業(yè)圖譜、受益人模型、名單相似度監(jiān)控等技術,基于9000萬家企業(yè)、1.5億條股權穿透服務,構建多重企業(yè)關聯圖譜信息,助力高效智能識別客戶。

    企業(yè)股權關聯圖譜技術和大數據處理技術。反洗錢系統基于企業(yè)關聯圖譜技術和大數據處理技術,構建無限穿透的企業(yè)股權關系圖譜,以及關聯關系穿透信息。最終實現股權一次性無限穿透,全量數據拓撲關聯,基于恒生自主研發(fā)的受益人計算邏輯,提供企業(yè)全景信息、疑似控制路徑、股權關系路徑、受益所有人信息及受益人控制路徑等信息,實現在大數據支撐下,了解受益人和識別受益人信息。

    (三)項目實現的主要目標

    因企業(yè)數據信息較多,股權信息錯綜復雜、層層穿透,結合中國人民銀行下發(fā)的反洗錢客戶身份識別《關于加強反洗錢客戶身份識別有關工作的通知》(簡稱235號文)的要求,每天需要計算反洗錢受益人結果,因此對大數據處理技術提出非常高的要求。

    基于大數據和圖譜客戶盡調反洗錢系統項目的主要目標有3個方面:

    1、大數據中臺基礎設施建設

    2、應用開發(fā)

    l大數據反洗錢應用

    l外部數據對接

    l圖譜及指標分析

    l監(jiān)管報送

    3、數據采集及比對

    4、客戶管理及盡調、可疑交易、風險評估等

    5、指標及模型調整適配

    (四)技術方案

    隨著資產管理規(guī)??焖僭鲩L,客戶盡職調查及后續(xù)管控壓力大,傳統數據庫僅能展示單個客戶的風險狀況,無法展現各個風險客戶的關聯性,挖掘潛在風險點,也無法分析風險傳遞路徑及風險聚集情況。

    為滿足反洗錢工作順利開展,基于大數據和圖譜客戶盡調建設反洗錢系統,正是解決上述迫切需求的最好途徑。

    1、系統應用架構

    本系統采用大數據應用架構,滿足數據收集與存儲、業(yè)務數據清洗、指標計算、實時接口、數據稽核等功能,對應架構圖如下:

    建立一套滿足監(jiān)管要求的反洗錢系統,關鍵技術特點包括:²客戶信息整合:支持將從不同系統數據源獲取的信息,按要素整合所需數據;²靈活、智能、通用的可疑交易篩選規(guī)則,可靈活修改規(guī)則閾值,支持可疑交易試算;²支持可疑事件分析審批流程以及對應的可疑事件上報、解析、重報;²客戶風險等級評估,支持審批流程以及自動到期重評;²支持客戶身份識別、盡職調查信息留痕,自動發(fā)起客戶身份重新識別提醒;²黑白名單查詢與管理,制裁國家和地區(qū)信息管理,涉恐名單回溯;²支持產品風險等級評估,機構自評估;²年度報告及內部報表生成;²非自然人客戶受益所有人核查等。

    2、系統技術架構

    (1)前端層:表示合規(guī)、內控等系統可通過Https來訪問RDM云服務。(2)接口層:RDM云服務對外Api網關層是基于Nginx,提供的是REST服務的Api接口,數據格式均為JSON。(3)服務層:RDM服務是由多個微服務接口組成,基于SpringCloud技術實現,Eureka是服務注冊中心,通過Eureka集群保證了服務注冊中心的可靠性。(4)系統監(jiān)控:通過hs-ommp和open-falcon,監(jiān)控整個微服務集群的健康狀態(tài)。(5)日志收集:通過kafka+logstash+elasticsearch收集各種日志。

    對應架構圖如下:

    3、系統數據架構

    數據流說明:

    (1)異源數據通過數據同步工具同步至貼源數據層ODS。(2)通過數據清洗過程,從貼源層中提取產品,賬戶(客戶),交易,持倉和TA參數類數據。此類數據保存在業(yè)務明細層中。(3)反洗錢根據各系統基礎數據、客戶風險等級以及第三方數據(如黑名單)按照特定規(guī)則篩選出可疑客戶的交易,根據指定邏輯計算客戶標簽,根據客戶或監(jiān)管要求生成對應的報表數據。(4)大數據平臺將可疑客戶的所有信息(包括賬戶信息,交易和持倉)推送至反洗錢應用庫中。反洗錢應用庫根據客戶標簽刷新客戶風險等級和生成可疑交易報文。對應架構圖如下。

    4、功能目標

    (1)運維監(jiān)控

    統一的任務管理、監(jiān)控、運維,降低運維難度及成本。

    (2)圖形化編排

    支持圖形化流程編排,快速完成任務的編排工作,提高工作效率,流程中自帶流程變量,節(jié)點上下文可自由通信。支持流程循環(huán)判斷,支持匯流分支,支持流程節(jié)點判斷滿足各種復雜業(yè)務情況。

    (3)作業(yè)類型

    內置子流程,微服務,HTTP,SHELL腳本,消息隊列多種執(zhí)行器開箱即用,支持執(zhí)行過程同異步滿足各種復雜場景。支持自定義任務類型插件,方便快捷的擴展調度任務類型,滿足更多個性任務調度場景。無縫對接恒生ETL工具可動態(tài)讀取ETL作業(yè)。

    (4)運行處理

    完善的人工干預能力,支持強制終止、重跑、斷點續(xù)跑、暫停/恢復、跳過等干預手段。

    支持多種失敗重試策略、異常處理策略,手動重試、自動重試、失敗跳過。

    (5)場景支持能力

    提供OpenAPI為其它系統接入調度系統提供任務的創(chuàng)建、修改、查詢、監(jiān)控、觸發(fā)等接入能力。支持線上統一配置任務參數。

    (6)任務遷移能力

    批量任務的導入導出,方便在不同的環(huán)境中快速部署。

    (7)高可用能力

    提供分布式執(zhí)行器,可通過擴展執(zhí)行器數量提升調度能力,滿足大規(guī)模任務的調度需求。

    提供資源管理,可通過配置單機執(zhí)行任務數、資源占用閾值動態(tài)調整任務執(zhí)行參數,保證系統可靠穩(wěn)定的運行。

    5、非功能目標

    (1)支持實時數據采集技術

    數據開發(fā)平臺支持多種實時數據采集技術,如針對關系型數據庫,可采用恒生自研發(fā)的斗轉組件,實時解析數據庫日志,獲取數據操作并同步到目標端;針對數據流,可通過kafka將數據流實時推送到下一個數據加工組件或者目標端,保證數據按需加工的同時進行快速流轉。

    (2)支持多種源數據類型

    數據開發(fā)平臺中數據同步工具支持豐富的輸入源,使得用戶可以方便高效的從各種來源抽取想要的數據。

    (3)支持多種輸出格式

    數據開發(fā)平臺中數據同步和數據計算工具支持豐富的輸出格式,能夠滿足用戶不同的數據存儲需求。

    (4)支持開發(fā)任務的多版本管理

    平臺提供版本管理功能,每一次開發(fā)的任務代碼都可以根據需要進行版本發(fā)布和版本記錄,在用戶發(fā)現異?;蛘咝枰M行代碼恢復的時候,可以通過以往發(fā)布的版本快速獲取之前的任務代碼。

    (5)支持多種數據任務執(zhí)行引擎

    數據開發(fā)平臺提供多種任務執(zhí)行引擎,如datax、jdbc、spark、flink等,結合用戶的數據源、目標端的數據庫類型,選擇合適的引擎有助于快速進行數據流轉,減輕數據庫壓力。

    平臺也會提供缺省的任務執(zhí)行引擎,滿足大多數數據開發(fā)任務的高效執(zhí)行。用戶只要根據平臺提示,就可完成任務開發(fā)和執(zhí)行。

    (6)平臺作業(yè)監(jiān)控

    完善的平臺作業(yè)監(jiān)控功能,方便開發(fā)和維護人員,及時了解任務執(zhí)行情況,是否正常運行、是否執(zhí)行超期、是否報錯等等,同時提供維護命令,便于快速進行異常任務人工干預。

    6、系統效能

    (1)滿足英大基金支持各數據加工和計算能力的需要

    數據加工和計算的任務主要針對有問題的數據按規(guī)則進行轉換、數據粒度的轉換,以及一些商務規(guī)則的計算。a、數據格式轉換:常見的格式包括數字和字符串的轉換,字符串和日期的轉換,這些格式轉換都可以通過開發(fā)平臺快速編碼實現。b、數據值轉換:值轉換的需求一般發(fā)生在源端數據質量有問題或者不滿足目標端的數據規(guī)范時,例如數據清洗時的空值、非法值替換,數據轉換時的關聯值、映射關系轉換等等。c、數據粒度的轉換:數據開發(fā)有一部分場景是用于數據倉庫和數據分析,所以數據聚合必不可免,從業(yè)務系統采集的明細的數據,可以根據倉庫、集市中主題分析的數據顆粒度和分析層次進行匯總和聚合計算。d、附加數據標簽:數據目標端(如數據倉庫)的數據可能會來自多個部門、系統,在進入數據倉庫的時候可以為數據添加附加字段,來標記數據來源,數據進入倉庫的時間,這些附加字段都可以通過開發(fā)平臺來自動標記和賦值,方便用戶發(fā)現和檢查問題。

    (2)建立了針對不同客戶群體靈活配置調整的動態(tài)管控機制

    數據開發(fā)平臺中數據任務的作業(yè)調度非常靈活,主要支持:

    按時間調度:具體日期(某一天)可以是每周的某一天,也可以是每月或者年,周期(間隔時間)可以隔周、天、月、時、分、秒。按工作日歷調度:檢查每個執(zhí)行日期是否工作日,如春節(jié)、國慶等非工作日,可選擇是否忽略執(zhí)行任務。按cron規(guī)則作業(yè):類似linux的crontab調度方式,可自由靈活設置執(zhí)行周期、間隔。

    (3)完善了標準化的維護管理臺

    支持定制化需求設計與開發(fā),同時,定制化開發(fā)部分與產品部分代碼分離,避免后續(xù)產品版本升級對定制化開發(fā)部分的影響;系統提供可靠、安全、穩(wěn)定運行的監(jiān)控措施;數據庫及應用定期備份、恢復機制;系統性能支持較高應用并發(fā)訪問,具有較合理的響應時間,具備性能調優(yōu)方案;數據安全傳輸機制,通過互聯網傳輸數據有安全加密機制;禁止未登錄狀態(tài)對系統功能訪問;保護查詢功能和維護功能中數據的安全,不被未授權用戶使用;系統內部數據標準化,具有數據元定義規(guī)則和數據字典,系統交互遵循標準;具備不同業(yè)務功能可分階段投產,系統業(yè)務規(guī)則及基礎功能前臺配置,實時生效的擴展性要求;能夠根據用戶數及業(yè)務容量合理規(guī)劃硬件部署方案。

    (4)簡化了業(yè)務流程,提升業(yè)務效率

    采用最新大數據處理技術和算法模型,受益所有人查詢服務效率提升60%,服務并發(fā)請求性能提升10倍。相較傳統反洗錢工作效率有顯著提升,人員綜合成本減少30%以上。

    (五)應用前景及項目榮譽

    1、應用前景

    基于本項目的和成果及落地案例,為我司千億規(guī)模增長及監(jiān)察稽核等工作起到保駕護航的作用,項目特點及推廣應用前景如下:

    (1)推廣應用門檻低,支持國產化改造

    基于BS架構,用戶只需登錄瀏覽器,就可完成所有開發(fā)、調度、管理工作。

    (2)外部數據對接無障礙

    基于廠商自主研發(fā)的數據對接組件,實現實時數據采集和流轉。

    (3)適應大數據支持

    提供多種大數據類型的數據庫寫操作,實現高效的數據處理。支持對接廠商大數據或自研大數據底座。

    (4)豐富的系統適配功能和數據開發(fā)血緣分析

    基于Datax、JDBC方式,實現對各種主流數據庫系統的支持。通過自動分析,剖析輸入、輸出的表格以及字段血緣和映射關系。

    2、項目榮譽

    本項目由IDCFinancialInsights組織舉辦的“中國金融行業(yè)技術應用場景創(chuàng)新案例”評選中,榮獲“金融行業(yè)技術應用場景創(chuàng)新堅定者”獎,以及CIIS和CIO時代網聯合組織舉辦的“2022年度數字化轉型燈塔案例”評選中獲獎。

-證券日報網
  • 24小時排行 一周排行

版權所有證券日報網

互聯網新聞信息服務許可證 10120180014增值電信業(yè)務經營許可證B2-20181903

京公網安備 11010202007567號京ICP備17054264號

證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網站電話:010-83251800

網站傳真:010-83251801電子郵件:xmtzx@zqrb.net

證券日報APP

掃一掃,即可下載

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注