龙空技术网

CCCF精选 | 知识图谱的开源与金融领域实践

CCFvoice 164

前言:

目前大家对“金融c语言”可能比较注意,朋友们都想要剖析一些“金融c语言”的相关知识。那么小编在网摘上收集了一些有关“金融c语言””的相关知识,希望朋友们能喜欢,兄弟们快快来学习一下吧!

本期专题特别围绕金融知识实践,分享金融行业大背景下的企业级图谱实践、基于图谱的金融中台构建设计、从企业图谱到事理图谱变迁和升级的需求和应对等内容,从不同层面为金融知识图谱建设者,以及更广泛的金融行业图谱应用开发者提供借鉴与参考。

关键词:知识图谱 开源开放 金融实践

专题背景

2012年,谷歌率先提出知识图谱,在过去的10年中,知识图谱技术有了长足的进步,不仅在搜索、问答、推荐等互联网场景中得到广泛应用,在金融等诸多垂直领域也积累了丰富的成功案例。开源开放生态对技术的发展和落地具有至关重要的价值。知识图谱的开放以及开源工具的构建对知识图谱赛道的发展同样起到不可忽视的作用。因此,本期专题将分享典型的开放知识图谱数据集和值得关注的开源图谱工具,从不同层面为知识图谱开源开放生态建设者以及更广泛的图谱应用开发者提供借鉴与参考。

金融是最早拥抱和尝试知识图谱技术的行业,在反欺诈、反洗钱、量化分析、产业链因果推断、营销获客、智能投研与投顾等诸多细分领域有知识图谱的深入应用,成为知识图谱落地的重要战场。在此背景下,本期专题特别围绕金融知识实践,分享金融行业大背景下的企业级图谱实践、基于图谱的金融中台构建设计、从企业图谱到事理图谱变迁和升级的需求和应对等内容,从不同层面为金融知识图谱建设者,以及更广泛的金融行业图谱应用开发者提供借鉴与参考。

综上,本期专题邀请了来自学术界和产业界的研究团队撰稿,介绍知识图谱开源开放的典型案例,以及金融实践相关的最新研究进展和技术方案。

文章导读

围绕知识图谱的开源与金融领域实践这一主题,本期专题收录了6篇稿件,分享相关典型案例,探讨最新技术进展以及未来的发展方向。

阿里巴巴的熊飞宇、郭威等人撰写的《阿里巴巴数字商业知识图谱的构建与开放》一文重点介绍了数字商业知识图谱在阿里巴巴集团多元业务中的落地实践。自2015年起,阿里巴巴基于自身多个领域的数字商业实践,联合多所高校及科研院所,共同合作开展了“藏经阁”研究计划,利用知识图谱对商业要素进行建模,在商品表示模型标准化、商业要素关系建模、多源异构商务数据的融合集成等方面发挥着基础性作用。同时,面向广大知识图谱产业和科研工作者,阿里巴巴开放了阿里电商部分数据集(),旨在利用开放的商业知识发现更多社会经济的价值,并促进数字商业、数字经济等领域的交叉学科研究,服务数字经济健康发展的国家战略需求。

南京大学的胡伟等人撰写的《OpenEA:基于嵌入的实体对齐开源软件库》一文,介绍了基于嵌入的知识图谱实体对齐开源软件库OpenEA()。作为知识融合的重要技术,实体对齐旨在从不同知识图谱中识别指称真实世界同一对象的实体。随着表示学习技术在图像、视频、语音、自然语言处理等领域的成功,基于嵌入的实体对齐方法开始涌现,并取得重大突破。OpenEA对基于嵌入的实体对齐方法的集成,通过Python和TensorFlow开发完成,它集成了12种具有代表性的基于嵌入的实体对齐方法以及多个基准测试集,并使用了一种灵活的架构,可以较容易地集成大量现有模型,是知识融合领域典型的开源工具范例。

浙江大学的张宁豫等人撰写的《支持cnSchema的开源知识图谱构建与推理框架》一文,总结了知识图谱行业应用场景如商务金融、医疗健康、政务服务中,由于行业数据敏感度高、知识专业性强,同时缺乏构建知识图谱和推理的训练语料,且存在数据异质和多模态问题,制约了知识图谱应用的效率和性能。在这种情况下,浙大团队基于中文开放知识图谱OpenKG平台实现了一个支持cnSchema的开源知识图谱构建与推理框架,文中详细阐述了其技术实现原理和使用方式,对比了其技术框架与传统思路的异同,最后探讨了未来的研究方向。

蚂蚁集团的梁磊等人撰写的《金融多元场景企业级知识图谱架构》一文,介绍了蚂蚁集团从 2018年开始体系化地投入知识图谱的建设,结合金融多元化的业务场景构建不同领域知识图谱,围绕控风险、促增长核心命题持续和业务深度合作,在过程中也沉淀了支撑多业务图谱构建迭代的企业级知识图谱架构和开放平台能力。文中重点介绍了结合金融多元化的业务场景构建不同领域的知识图谱,以及如何通过知识图谱实现领域知识管理、跨域融合及推理应用等,全面分享了多业务图谱构建迭代的企业级知识图谱架构和开放平台经验。

达而观信息科技有限公司的王文广撰写的《基于知识图谱的金融中台架构》一文,从金融业的特点出发,介绍了基于知识图谱建设金融数据、知识和业务三合一中台方案,其核心是5 个工作流——知识建模工作流、映射式构建工作流、抽取式构建工作流、知识应用工作流和知识运营工作流。文中详细分享了各个核心工作流的最新研究进展和应用案例,给出了基于知识图谱的金融三合一中台的完整架构,并提供了建设金融三合一中台的行动指南,为正在规划或实施建设金融中台的机构提供指引。

恒生电子股份有限公司的陈佼、邵志英在《从企业图谱到事理图谱——金融科技行业的视角》一文总结分析了在投研场景中,大部分金融机构的大规模图谱构建实践一般从企业图谱开始,然后组织企业相关各种实体、关系,构成相应的网络,并提供各种查询、分析、计算服务,同时随着业务应用的发展,逐步往行业、宏观进行扩展。应用以上逻辑顺序,从微观到行业再到宏观,文中详细介绍了恒生电子从企业图谱到事理图谱的构建历程,包括构建企业图谱、产业链图谱、事理图谱这条“螺旋上升”式的金融知识图谱实践路径,以及在投研领域的各种金融应用实践。

总结展望

本期专题的6篇文章分享了知识图谱开源开放方面的典型案例和相关工具的使用方法,对知识图谱的金融实践进行了全方位地剖析,介绍了工业界的最新动态,也指出了未来潜在的发展方向。知识图谱的技术发展和落地应用处于蓬勃发展的时期,希望本期专题能够对相关领域的同行在理论、技术和实践方面有所启发,吸引更多的专家、学者和工程师关注,共同推进知识图谱研究与实践的发展。

王昊奋

CCF高级会员,CCF上海分部秘书长、 CCF SIGKG主席、术语工委副主任。同济大学百人计划特聘研究员,博士生导师。主要研究方向为知识图谱、自然语言处理。carter.whfcarter@gmail.com

特别声明:中国计算机学会(CCF)拥有《中国计算机学会通讯》(CCCF)所刊登内容的所有版权,未经CCF允许,不得转载本刊文字及照片,否则被视为侵权。对于侵权行为,CCF将追究其法律责任

标签: #金融c语言