用户案例
图谱的 N 重业务价值:中证数智的一图多用
导读:在金融风险管理与智能营销领域,传统的关系型数据库已难以应对日益复杂的关联分析需求。中证数智科技(深圳)有限公司通过引入 NebulaGraph 图数据库,构建了覆盖全市场的企业图谱,实现了从风险管控到智能营销的多维度突破。本文整理自中证数智胡新老师,在香港 nMeetUp 上的分享。
胡新,英国杜伦大学硕士,FRM,拥有 10 年的金融行业风险管理与合规管理科技建设经验。专研于风险计量模型和智能图算法在金融机构风险管理与合规领域的应用,并为多家金融机构提供基于关联图谱的落地风控、合规应用。
一、背景
中证数智是中证信用旗下的科技企业,专注于金融机构信用风险管理领域,为监管机构、投资机构、中介机构等金融市场参与主体提供智能化的信用数据、信用评价、信用风险预警等信用科技服务。
中证数智的产品基座是海量的信用数据,通过实时信用数据关联与洞察,完成实控人识别、股权穿透、关联交易实时监控、风险传染管理等复杂任务。在传统的关系型数据库难以应对日益复杂的关联分析需求下,中证数智选择了 NebulaGraph,构建了覆盖全市场的企业图谱,显著了提升金融机构的风险管理能力和业务决策效率。
二、知识图谱构建
数据资源层:大规模、多维度整合
中证数智整合内外部资源,构建了覆盖全市场的企业金融知识图谱,包括:
企业工商与图谱数据:注册信息、股东高管、投资关系、分支机构、年报、抵押、异常经营、行政处罚等;
信息预警数据:新闻舆情、公告、司法数据、诚信数据、预警评分;
经营与金融产品数据:企业曝光、区域与财务数据、债券、股票、私募基金、ABS、REITs 等;
宏观与区域数据:行业经济、景气指数、国民经济核算、区域经济与债务等。
目前图谱已覆盖3 亿+点,包括 1.2 亿企业实体、1.4 亿自然人、200 万金融产品,4亿+边,包括控制、投资、任职、担保、诉讼等多种关系类型。
技术实现:基于 NebulaGraph 的图谱构建
在金融风控、企业关联分析、集团客户管理等场景中,如何高效地从结构化数据中构建出可供业务直接使用的知识图谱,是很多企业面临的核心挑战。
中证数智形成了一套系统化的企业图谱构建流程:以标准化接口为桥梁,将传统数据库中的企业信息转化为图数据库中的节点与关系,最终通过多种图谱应用接口支撑业务分析。
- 数据提取
从传统数据库导出 CSV 格式的节点文件、节点属性文件、关系文件、关系属性文件。
企业基本信息(Company info):包括企业名称、注册号、注册地、行业、成立日期、注册资本等基础属性。
企业股东信息(Company shareholders info):记录股东名称、持股比例、出资日期、股东性质(企业/自然人)等。
企业高管信息(Company executive info):包括董事、监事、高级管理人员的姓名、职位、任职日期等。
这些数据通常以表结构存储,虽能满足日常查询,但难以高效处理深层次的关联分析。
- 图谱映射
通过图工具将数据批量导入 NebulaGraph,上述数据将变为符合图属性的元素。
点(Vertex):表示实体,如企业、自然人、产品等;
标签(Tag):描述点的属性特征,如企业名称、注册资本;
边 (Edge):描述点间的关联,如投资、任职、担保;
边类型(Edge type):描述关系的特征,如持股比例、任职日期。
- 标准化接口
为方便业务系统调用,中证数智将常用的图谱查询与分析功能封装为标准化的图谱接口(Graph API),这些接口屏蔽了下层数据结构的复杂性,使业务人员可直接通过 API 调用获取关联分析结果,无需理解底层图数据库结构。
图谱应用:覆盖多元应用场景
在技术创新层面,显著提升了基于专家经验与企业历史数据的业务预测分析方法在准确性、覆盖范围及效率方面的表现。
从业务视角来看,它能将分析从传统的规则驱动转变为智能驱动:通过运用大数据和图技术,我们可以发现不同于传统规则的未知风险模式,并据此进行更深层次的分析。
图技术与大数据的结合,能够为金融机构的前台、中后台等多个场景提供支持。
前台应用侧重于客户管理,包括客户尽职调查、客户画像分析以及业务机会挖掘等。
中后台应用则聚焦于风险管理和合规管理。在风险管理方面,可以利用数据和图算法探查疑似关联关系、识别空壳公司、实现集团客户统一管理,并构建风险标签模型。基于分析结果,还可进一步实施集中度管理、风险传导分析和风险排查。
三、核心算法突破
业务挑战
金融机构在进行集团客户授信、关联交易核查、风险集中度管理时,需准确识别企业之间的控制关系。
- 直接持股法
从 A 点向上找最大股东 D,再找 D 的最大股东 G,最终得出控制人为 G. 但结果错误,因为它忽略了 E 和 F 间由 H 控制的间接持股关系。
- 累计持股法
从 A 向上找到所有股东 B、C、D、H,通过股权乘法,得出最大股东为 C,但该方法因股权乘稀释也造成错误结果。
以上两种传统方法存在三大局限:
方法缺陷:直接持股法忽略间接持股,累计持股法因股权稀释无法跨层比较;
穿透层级有限:通常不超过 10 层;
计算规模受限:仅能针对重点客户进行分析,无法覆盖全市场。
投票权迭代算法
中证数智研发的投票权逐层迭代算法,通过逐层比较股东控制权大小,精准识别企业实际控制人。
该算法已获国家发明专利,具有以下优势:
无限层级穿透:实测最深可穿透 50 层以上;
全量计算能力:支持超 4 亿节点全市场计算,生成超 100 万个资本系,最大集团成员数达 9,084 家;
高效计算:10 万成员规模的集团计算时间约 2 分钟,全市场计算在 20 小时内完成。
四大业务调整机制
在实际应用中,团队针对四类复杂场景做了专项优化:
- 自然人合并
对同名自然人的控制企业进行概率合并,如“Bai Yu”控制四家企业,经图谱结构计算后合并为同一实控人。
- 交叉持股处理
在循环持股中按持股比例、注册资本、名称排序等优先级确定实控人。
- 实控人人工修正
支持基于尽调信息的实控人手动调整,优先级为:自建实控人 > 公开实控人 > 疑似实控人。
- 政府实体处理
将政府单位(如国资委)退回至第一层非政府企业股东,便于集团管理。
可视化展示:2D/3D实控路径图谱
通过可视化展示优化,提供直观的资本系树状图和实控路径展示,极大提升了业务人员的分析效率。
四、从风险管控到智能营销的全链路赋能
风险管控
中证数智构建了一套完整的风险信号识别与管理机制:
信号来源:系统监控、人工上报、定期检查;
风险分层:根据阈值进行分类、分层、分主体管理;
处置流程:风险识别 → 应急处理 → 调查评估 → 化解处置 → 持续跟踪。
场景示例
对风险主体与客户关系的定期排查,输入风险企业群、我的客户/投资组合及关联关系配置,输出图谱显示:有 9 个与风险主体相关的客户群主体需进一步排查。该算法还可用于供应商投标、业务新主体验证、关联交易核查等场景。
智能营销
此外,中证数智还利用大模型+图谱实现智能营销。
信息源:公开市场信息(新闻、公告、研报、工商信息等) + 内部信息(项目文档、周报等);
商机标签:上市公司增减持、回购、融资融券;私募机构备案、优秀基金经理等;
- 技术实现
标签识别:BERT + 分类器,从金融文本中提取商机标签;
信息抽取:GRU + CRF 进行实体识别,BERT + 分类器进行关系抽取;
图谱构建:将商机标签、实体、关系存入知识图谱;
部门画像:通过大模型解析历史文档,生成业务部门偏好画像;
推荐匹配:基于协同过滤、内容推荐等算法,向部门推送个性化商机。
系统还能分析客户资金属性、投资偏好、风险承受能力、合规准入等维度,实现:
投资融资需求:股权投资、资产管理、衍生品业务;
融资需求:信贷业务、融资融券;
服务中介需求:投资咨询、托管外包、产品销售;
- 场景示例
在客户关联图谱平台下的关系图谱中,中心节点是现有客户或商机实体,通过关联方和业务层级筛选潜在客户,降低获客成本。
五、图技术驱动金融智能未来
中证数智通过深度融合 NebulaGraph 与自研算法,实现了从实控人识别,到风险管控再到智能营销的全链路赋能,目前已被中国银河证券、东吴证券 、招商证券、国投证券等证券公司,中国大地保险、远东租赁、越秀集团等金融机构深度应用。
中证数智的实践表明,图技术不仅能提升传统风控的精度与效率,更能打开新的业务增长点,推动金融机构向数据驱动、智能决策的新阶段迈进。