龙空技术网

[电子学报文章精选] 带对象结构信息形式背景的概念知识发现与演化

中国电子学会 112

前言:

现在咱们对“进化算法的概念和特点是”大概比较关注,大家都需要学习一些“进化算法的概念和特点是”的相关知识。那么小编在网摘上搜集了一些关于“进化算法的概念和特点是””的相关知识,希望兄弟们能喜欢,我们一起来了解一下吧!

昆明理工大学数据科学研究中心李金海教授课题组对概念动态更新展开研究,相关成果以“带对象结构信息形式背景的概念知识发现与演化”(Conceptual Knowledge Discovery and Evolution in Formal Context with Object Structure Information)为题,发表在《电子学报》2023年第1期。

内容简介

概念知识发现与更新是针对动态数据用形式概念分析(Formal Concept Analysis, FCA)方法获取有用知识的过程,它是概念认知学习中的基本问题。该问题来源于Wille 教授提出的形式概念,最初用于刻画对象-属性数据集中“共同拥有”这一语义下的基本知识。随后形式概念被相关学者不断扩展,使其能够分析多种类型的对象-属性数据,如多值数据、区间值数据、实值数据和模糊数据等。

然而,考虑到从海量数据中挖掘概念知识非常耗时,一些学者进一步又研究了增量式并行构造概念,以提高概念求解的效率。截至目前,已有较多成熟的理论和方法能够处理动态数据的概念知识发现问题,但它们都是针对对象-属性关系数据进行研究,完全忽略了对象之间可能存在的结构信息,这弱化了概念知识发现的能力,因此亟需解决此类问题。为了方便叙述,本文将包含对象结构信息和对象-属性信息的数据集称为带对象结构信息形式背景。

本工作讨论了带对象结构信息形式背景能够通过对象结构矩阵和连接矩阵反映出数据中包括的对象结构信息和对象-属性信息。为了有效地挖掘出有用的概念知识,在形式概念的基础上引入连通性,定义了全局结构信息形式概念(简称全局概念)和局部结构信息形式概念(简称局部概念),给出了相应的概念知识发现算法。通过对连通性赋予不同的语义能够获得不同内涵的概念,这更加符合实际应用中对特定概念的应用需求。对于动态的带对象结构信息形式背景,当对象结构矩阵和连接矩阵发生改变时,提出了如何快速获取数据更新后的全局概念和局部概念的方法,即减边的概念演化算法、增边的概念演化算法、添加属性的概念演化算法和减少属性的概念演化算法。

为了验证这些算法的有效性,通过表1中的真实数据集做了大量的对比实验,结果表明文中提出的概念演化算法相比于全局概念和局部概念传统计算方法更加有效,适用于大规模数据分析,且对对象结构信息的类型更具抗噪能力,详细的实验结果如图1、图2和图3所示。

表1 数据集及其参数

图1 数据集1-12的结构信息形式概念计算方法耗时对比

图2 数据集1-12的数据规模增加情况与概念演化耗时增加情况对比

图3 数据集1-12的对象结构信息类型改变前后的概念演化耗时对比

本工作的创新性体现在以下两个方面:

第一,巧妙地将连通性与形式概念相结合,不仅刻画了数据中的对象-属性信息,还可以分析对象之间的结构信息,摆脱了FCA长期以来只针对对象-属性数据进行分析的缺陷;

第二,在带对象结构信息形式背景中,无论是对象结构矩阵发生变化,还是连接矩阵动态更新,概念演化均只涉及数据表中的一行或一列的计算,这是本文提出的概念动态更新算法之所以有效的关键所在。

在本文工作的基础上,还可以进一步探讨下列问题以丰富该领域的研究内涵:

(1)由于文中默认对象结构信息形式背景的节点数不变,这与实际中某些问题的假设不吻合,限制了其进一步应用的范围,因此需要弱化该假设得到节点数变化的概念演化算法;

(2)在多数应用场景中,不可避免的存在信息不完备情况,如对象结构信息客观存在,但未能完全体现在已掌握的信息中,如何将本文方法扩展到不完备的情形?

(3)对于本文提出的对象结构信息形式概念,如何进一步训练分类器得到分类性能优异的概念认知学习方法?

(4)由于粒计算在处理大数据方面有着巨大的优势,如何融合粒计算与对象结构信息形式概念研究粒概念知识发现以提高计算效率也是有意义的。

总之,本文初步探索了从带对象结构信息数据中进行概念知识发现与更新的问题,通过连通性建立了FCA与相关研究领域连接的桥梁,为提高FCA处理更多复杂数据的能力奠定了基础。

作者简介

李金海(通讯作者) 博士。昆明理工大学数据科学研究中心副主任,教授,博士生导师。云南省中青年学术和技术带头人。主持国家自然科学基金4项,在国际期刊IEEE TKDE、IEEE TCYB、IEEE TFS、IEEE SMCA,以及国内一级学报《计算机学报》《软件学报》《电子学报》等发表论文40余篇。主要研究方向为大数据分析、粒计算和概念认知学习。

闫梦宇(第一作者) 昆明理工大学理学院系统科学博士研究生。主要研究方向为形式概念分析、概念认知学习和机器学习。

论文信息

带对象结构信息形式背景的概念知识发现与演化

闫梦宇, 李金海, 刘文奇, 张文修.

电子学报, 2023, 51(1): 11-17.

DOI: 10.12263/DZXB.20211559

标签: #进化算法的概念和特点是