粗糙集与其他软计算理论结合情况进行综述研究

您当前的位置：首页 > 工学 > 计算机 > 正文

来源：网络时间：2017-07-01 00:32:00

　　摘要:最近几年，对于粗糙集的研究越来越多，尤其是粗糙集与其他软计算理论相结合的研究更为突出，取得了很多有意义的研究成果。因此，将此方面目前的主要研究情况进行一个总结，主要介绍了目前粗糙集与模糊集、神经网络、证据理论等一些其他软计算理论之间的结合研究情况，并对这方面未来的发展提出了自己的一些观点。
　　关键词:粗糙集; 软计算; 模糊集; 粗糙模糊集; 模糊粗糙集
　　
　　Survey on combination of rough sets and other soft computing theories
　　
　　TANG Jian-guo??1，2， William ZHU?1，SHE Kun?1， CHEN Wen??1，3
　　(1.School of Computer Science & Engineering， University of Electronic Science & Technology of China， Chengdu 611731， China;2.School of Computer Science & Engineering， Xinjiang University of Finance & Economics， Urumqi 830012， China;3.Dept. of Computer Science， Fuzhou Polytechnic， Fuzhou 350108， China)?Abstract:In recent years， there are more and more research on rough sets.Especially，the combinations of rough sets and other soft computing theories have became more prominent，and have made a lot of meaningful research results. In view of this， this paper gave a summary of the current status of these major researchs.It focused on the combination of rough sets and other soft computing theories such as fuzzy sets，neural net，evidence theory，and so on. In the end， it put forward the own viewpoint of the future development in this area.
　　Key words:rough sets; soft computing; fuzzy sets; rough-fuzzy sets; fuzzy-rough sets
　　0 引言
　　随着计算机技术和网络技术的迅速发展与广泛应用，人类社会进入了信息爆炸的时代，如何处理并有效利用这些信息已经成为世界各国学者研究的热点问题。软计算就是在这种需求背景下出现的一种新技术。软计算最初是由模糊集理论的创始人Zadeh[1]在1994年提出的，它是一种通过对不确定、不精确及不完全真值的数据进行容错处理从而取得低代价、易控制处理以及鲁棒性高的方法的集合。目前，软计算的理论与方法主要包括神经网络、模糊集、粗糙集、遗传算法、证据理论等。
　　粗糙集是在最近几年发展较快的一门理论，它是一种用于分析和处理不确定、不精确问题的数学理论，是由波兰数学家Pawlak[2]在1982年提出的。它的基本思想是通过论域上的等价关系将论域划分成若干个等价类，然后利用这些知识对所需处理的不精确或不确定的事物进行一个近似的刻画。
　　粗糙集理论最大的特点是它对论域的划分只依赖于所需处理的数据集合本身，不需要任何先验信息，所以对问题不确定性的描述或处理是比较客观的。这一点也是它与其他软计算理论之间的显著区别。不过，粗糙集在原始数据不精确或不确定时，是无法处理数据的，这恰好与软计算中的其他理论有很强的互补性。因此，粗糙集与其他软计算理论和方法的结合已成为粗糙集研究中的一个重要内容。本文将对粗糙集与模糊集、神经网络、概念格以及证据理论等软计算理论的结合研究情况进行介绍，并指出这方面未来的研究发展方向。
　　1 粗糙集理论概述
　　粗糙集是一种用于解决不确定性问题的数学工具。粗糙集理论中知识被理解为对事物进行区分的能力，在形式上表现为对论域的划分，因而通过论域上的等价关系表示。粗糙集通过一对上、下近似算子来刻画事物，它不需要数据以外的任何先验知识，因此具有很高的客观性。目前，粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[3~8]。
　　1.1 粗糙集中的基本概念[9]
　　定义1 论域、概念。设U是所需研究的对象组成的非空有限集合，称为一个论域，即论域U。论域U的任意一个子集XU，称为论域U的一个概念。论域U中任意一个子集簇称为关于U的知识。
　　定义2 知识库。给定一个论域U和U上的一簇等价关系S，称二元组K=(U，S)是关于论域U的知识库或近似空间。
　　定义3 不可分辨关系。给定一个论域U和U上的一簇等价关系S，若PS，且P≠?，则∩P仍然是论域U上的一个等价关系，称为P上的不可分辨关系，记做IND(P)。
　　
　　称划分U/IND(P)为知识库K=(U，S)中关于论域U的P-基本知识。
　　定义4 上近似、下近似。设有知识库K=(U，S)。其中U为论域，S为U上的一簇等价关系。对于?X∈U和论域U上的一个等价关系R∈IND(K)，则X关于R的下近似和上近似分别为
　　
　　下近似 R(X)=∪{Y∈U/R|YX}
　　上近似 R(X)=∪{Y∈U/R|Y∩X=?}
　　集合的上近似和下近似是粗糙集中最核心的概念，粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。当R=(X)时，称X是R-精确集;当R(X)≠(X)时，称X是R-粗糙集，即X是粗糙集。
　　1.2 粗糙集中的知识约简
　　在一个信息系统中，有些描述对象的属性可能是不必要的，因此需要将这些冗余的属性予以删除来提高系统的效率。
　　给定一个知识库K=(U，S)，对于PS，?R∈P，如果IND(P)=IND(P-{R})成立，则称R为P中不必要的，否则称R为P中必要的。如果P中的每个R都是必要的，则称P是独立的。
　　定义5 约简、核。给定一个知识库K=(U，S)和知识库上的一簇等价关系PS，对于任意GP，如果G是独立的，并且IND(G)=IND(P)，则称G是P的一个约简，记为G∈RED(P)。P中所有必要的知识组成的集合称为P的核，记为Core(P)。约简与核的关系为Core(P)=∩RED(P)，即核是约简的交集。
　　
　　常见的粗糙集中知识约简的算法主要有盲目删除约简法、基于Pawlak属性重要度的约简法和基于差别矩阵的约简法。其中，盲目删除法是通过任意选择一个属性，看其是否是必要的，如果是必要的则保留，否则删除该属性，这种方法简单直观，但约简的结果却不一定让人满意;基于Pawlak属性重要度的方法是根据属性的重要度来进行约简，其特点是用这种方法可以得到信息系统的最优约简或次优约简，但它却存在找不到一个约简可能性;基于差别矩阵的方法是把论域中区分任意两个对象的属性集合用矩阵的形式表示出来，通过这个矩阵可以直观地得出信息系统的核和所有约简，这种方法虽然能很直观地得出信息系统的所有约简和核，但当问题规模较大时会产生组合爆炸。此外，也有学者对知识的约简提出了一些改进的新算法。文献[10， 11]基于邻域对粗糙集的属性和属性值的约简进行了优化处理;文献[12]提出了一种新的属性约简方法ReCA，提高了对连续性属性的数据的知识约简性能。

　　粗糙集在处理不确定问题中新颖独特的方法引起了大量学者的兴趣，很多学者对该理论作出了扩展性的研究[13~17]，包括覆盖粗糙集[18~21]、变精度的粗糙集[22]等很多新的内容。文献[23]对粗集的公理化进行了深入的研究，得到了两个关于粗集的最小公理组;文献[24]通过松弛对象之间的不可分辨和相容性条件，给出了一种新的基于和谐关系的粗糙集模型;文献[25]构造了关于决策表对象的区分条件，并借助区分矩阵与区分函数提出了一种完备的约简方法;文献[16]将组合熵和组合粒度的概念引入到了粗糙集中，确立了两者之间的关系;文献[26]提出了在不协调目标信息系统中知识约简的新方法;文献[27]提出了属性左划分和属性右划分的观点，设计了一种基于划分的属性约简算法ARABP;文献[28]从属性和信息熵的角度探讨了粗糙集的不确定性的度量。这些研究极大地推动了粗糙集理论的发展和应用。
　　2 粗糙集与模糊集
　　模糊集理论是由美国学者Zadeh于1965年提出的，模糊集指的是这样一种集合，这个集合中的每个元素都是在一定程度上隶属于或者不隶属于这个集合，用于衡量这种隶属程度的函数被称为隶属函数。模糊集中的任意一个元素都是通过隶属函数来确定一个隶属度与之一一对应。
　　2.1 模糊集理论的基本概念
　　定义6 隶属度、隶属函数。设U是一个论域，A是U上的一个模糊集，如果?x∈U，均能确定一个数μ?A(x)∈[0，1]来表示x隶属于A的程度，称这个数是x对A的隶属度。其中μ?A(x)是这样一个映射:μ?A:U→[0，1]，x|→μ?A(x)∈[0，1]，?μ?A(x)称为A的隶属函数。
　　隶属函数是模糊集的核心基础概念，由它来确定和描述一个模糊集。对于同一个论域，不同的隶属函数确定不同的模糊集，如μ?A(x)和μ?B(x)是论域U上的两个不同的隶属函数，则由它们可以确定两个不同的模糊集A和B。模糊集是经典集合理论的扩展，当一个模糊集的隶属度只能取0或1时，即μ?A(x)∈{0，1}，模糊集A便退化为一个经典集合论中的普通集合。
　　2.2 模糊集与粗糙集的互补性
　　在模糊集中，隶属函数一般是根据专家的经验知识或者通过一些统计数据结果来确定，具有很大的主观性，而缺乏一定的客观性，这也是模糊集的一个根本缺陷。粗糙集中的上近似和下近似是由已知知识库中客观存在的对象来确定的，不需要任何先前的假设条件，具有很强的客观性。但是，在实际的生活中，有很多已知的、确定的而无须再去进行判断的先验知识，如果能直接利用这些知识来解决问题，会带来很高的效率，而这一点又正是粗糙集所欠缺的。由此可见，粗糙集与模糊集各自的特点之间具有很强的互补性，把它们结合起来解决问题通常都会比单独使用它们更为有效。在这方面的研究已经有了很大的进展和很多的具体应用，粗糙模糊集和模糊粗糙集[29]便是其中两个重要的研究成果。
　　粗糙模糊集主要是通过对模糊集中的隶属函数采用粗糙集中集合的上近似与下近似的方法来进行描述，以此来增强模糊集处理问题的客观性。它是把粗糙集中的上下近似的特点融入到了模糊集当中，将模糊集中的隶属函数概念扩展成上近似的隶属函数和下近似的隶属函数，由这两个隶属函数所确定的隶属度值来形成一个区间;用这个区间来描述一个元素隶属于一个模糊集的可能性范围，而不再是之前的元素与隶属度之间一一对应的情况，即x∈A的隶属度不再是μ?A(x)∈[0，1]，而是在[下近似的隶属度，上近似的隶属度]这个区间。粗糙模糊集的基本定义如下:
　　定义7 粗糙模糊集。设U是一个论域，R是U上的一个等价关系，A是U上的一个模糊集，μ?A(x)是A的隶属度函数，R(A)和(A)分别表示A的上近似和下近似，它们对应的隶属函数是:
　　a)下近似的隶属函数μR(A)([x]?R)=inf{μ?A(x)|x∈[x]?R}，?x∈X;
　　
　　b)上近似的隶属函数μ(A)=sup{μ?A(x)|x∈[x]?R}，??x∈X。
　　称R(X)=(R(X)，(X))为粗糙模糊集。
　　
　　模糊粗糙集是把模糊集中的隶属函数的概念应用到了粗糙集当中，根据模糊集中的隶属函数来确定粗糙集中的一个等价关系，即把由隶属函数得到的隶属度相同的元素归属于同一等价类，从而得到论域U上的一个划分。这其实就是将模糊集中已知的、确定的而无须再判断的知识转变为粗糙集中的等价关系，得到粗糙集上的一簇等价类，提高粗糙集处理问题的效率。模糊粗糙集的基本概念定义如下:
　　定义8 模糊粗糙集。给定一个论域U，A是U的一个模糊集，μ?A(x)是A的隶属函数。设R?A为U上的一个等价关系，且满足对于?x，y∈U，xR?Ay?μ?A(x)=μ?A(y)。令[x]R??A表示以x为代表元素的等价类，若XU，X≠?，则X关于R?A的下近似和上近似分别为
　　
　　下近似 R?A(X)=∪{[x]R??A|[x]R??AX}
　　上近似 ?A(X)=∪{[x]R??A|[x]R??A∩X≠?}
　　
　　若R?A(X)=?A(X)，称X是R?A-可定义集;若R?A(X)≠?A(X)，称X是R?A-模糊粗糙集。
　　
　　粗糙模糊集和模糊粗糙集对粗糙集和模糊集进行很好的互补性处理，已经在很多领域得到了实际应用[30~33]，并取得了很好的效果。有很多学者对它们进行了进一步的比较研究[34~37]，作了一些改进和扩展。文献[38]在覆盖粗糙集的基础上，结合模糊集的最近寻常集，引入了覆盖广义粗糙集模糊度的概念，给出了一种模糊度计算方法，并证明了该模糊度的一些重要性质;文献[39]提出了模糊不可分辨关系的概念，加强了粗糙集对模糊值属性处理能力。
　　3 粗糙集与神经网络
　　神经网络是在现代神经生物学研究成果的基础上发展起来的一种模仿人脑信息处理机制的网络系统。它具有在有监督或无监督的情况下从输入数据中进行学习的能力，被广泛地应用于数据挖掘[40~42]、模式识别[43~47]、信号处理[48，49]、预测[50， 51]等领域。
　　3.1 神经网络基本知识
　　神经网络[52]是一个由简单处理单元构成的规模宏大的并行分布式处理器，天然具有存储经验知识和使之可用的特性。神经元是神经网络最基本的信息处理单元，它具有接收和传递信息的功能。一个神经网络是由众多的神经元组成，每个神经元接收其他神经元和外界的输入信息。神经网络的结构通常都是以层的方式来组织的，一般包含一个输入层、任意多个隐藏层和一个输出层，每层都由众多的神经元组成。其基本原理是输入层神经元接收外界环境的信息输入，隐藏层神经元将隐藏层单元的信息输出至输出层，输出层将信息输出至外界。根据神经元信息的输出是否存在反馈，又将神经网络分为前馈神经网络和递归神经网络。

上一篇：IGRS与UPnP设备互连的安全机制探讨
下一篇：粒计算下的粗糙集模型对比

热点论文

[中等教育] 职专政治教育中的德育渗透: 　　帮助学生树立正确的价值观和人生观，提升学生的个人品德与思想素质，是职专政治教育的主要目标与根本目的。但受限于传统政治教育的教学 [全文]
[中国哲学] 传递“中国梦”正能量是记者的神圣使命: 　　摘要：中国梦是中华民族伟大复兴的梦，是当今中华民族前进的动力，是当前中国最具影响力、最具感染力、最具普遍性的正能量。记者作为以 [全文]
[财务控制] 论企业集团财务控制的对策: 摘要：市场经济飞速发展促使企业集团组织形式发生非常大的变化，那么企业集团需要有效利用自身发展优势，促进现代化经济发展。改革逐渐 [全文]
[财务控制] 中小企业的财务控制问题分析: 摘要:随着市场经济体制不断完善，我国中小企业进入快速发展阶段，其在国民经济发展中的作用被不断凸显出来。本文中笔者以中小企业财务管 [全文]
[职业教育] 分析音乐课堂中的情感互动及学生体验: 　　【摘要】针对音乐课堂中的情感互动及学生体验进行分析，基于学生的实际音乐学习需求、音乐学习目标等予以教学设计，以期能够不断提升音 [全文]
[市场营销] 新时期下市场营销的演变趋势分析: 摘要：随着全球经济互相影响，新市场格局的形成让新时期环境里市场营销不断发生变革。而本文主要是对当今市场新形势进行一个分析，找出对市 [全文]
[国际贸易] 国际贸易融资创新及风险控制: [摘要] 国际贸易企业融资风险的主要表现有两种：一是国际贸易企业无法以自身的流动资金偿还债务，要通过集资的方式偿还债务本金和利息； [全文]
[国际贸易] “互联网 +”时代下国际贸易发展策略研究: 摘要：随着网络技术和经济全球化的进一步发展，互联网关系到国际贸易领域的方方面面，并以全新的国际贸易形态，将分散在世界各地的市场， [全文]

粗糙集与其他软计算理论结合情况进行综述研究

最新论文

热点论文