• Hi:欢迎来到一心论文网!
  • 您当前的位置:首页 > 工学 > 计算机 > 正文

    基于SemRank的CWME专家权威度计算方法研讨

    来源:网络  时间:2017-07-01 00:32:00

      

      摘 要:针对综合集成研讨环境中的专家权威度评价问题,提出了一种基于SemRank的专家权威度计算方法。该方法既考虑专家之间的交互结构,又考虑专家发言内容之间的语义关联。由于专家之间的交互具有动态复杂性,在计算语义关联时,引入了时间衰减函数,反映时间这一要素的影响。实验结果表明,提出的专家权威度计算方法合理有效;在综合集成研讨环境中,对促进专家良性互动和激发专家思维具有一定的作用。

      关键词:基于cyberspace的综合集成研讨厅;群体交互;SemRank;开放的复杂巨系统

      Expert authority estimating method based on SemRank in CWME
      
      WANG Ai, LI Yao-dong, LI Wei-jie
      (Key Laboratory of Complex Systems & Intelligence Science, Institute of Automation, Chinese Academy of Sciences, Beijing100190, China)
      Abstract:To solve the problem of measuring experts’ authority in CWME,this paper proposed a method for estimating expert authority based on SemRank.This method not only considered the interactive structure between experts, but also took into account semantic relation between the experts’ speeches.As the interaction between experts possessed dynamic complexity,introduced the time decay function to estimating semantic relation. Experimental result shows that the proposed method is feasible and effective. It lays a good foundation for experts to interact and inspire in CWME.
      Key words:cyberspace for workshop of metasynthetic engineering(CWME); collective interaction; SemRank; open complex giant systems
      0 引言
      1990年钱学森等人[1]提出开放的复杂巨系统的概念,以及处理这类系统的方法论——从定性到定量的综合集成方法。综合集成法就其实质而言是将专家群体(各种有关的专家)、数据和各种信息与计算机技术有机地结合起来,把各种学科的科学理论和人的经验知识结合起来,三者构成一个系统。这个方法的成功关键在于充分发挥了系统的整体优势和综合优势。1992年3月,钱学森进一步提出了人机结合,从定性到定量的综合集成研讨厅(HWME)体系的思想[2]。这个研讨厅的构思是把人集成于系统之中,采用人机结合、以人为主的技术路线,充分发挥人的作用,使研讨的集体在讨论问题时互相启发,互相激活,使集体创见远远胜过个人的智慧[3]。
      随着Internet和各种通信网络的迅速普及,cyberspace(电子空间和数字空间)成为一个重要的概念,它使参与者跨越时间和地域的限制,随时随地就所关心的问题进行研究、交流和探讨,并可随时利用网络上的大量资源。信息技术的这个发展,为综合集成研讨厅的实现提供了一种新的、可能的形式,即基于cyberspace的综合集成研讨厅(CWME)[4]。通过多年的探索与实践,已经成功建立了几个典型的CWME系统[5,6]。
      在CWME体系中,专家群体是最具有能动性的成员,各专家以研讨的方式畅所欲言,充分表达自己的观点,随时进行质询和辩论,以促进对复杂问题认识的提高。但是在研讨过程中,每个专家对同一复杂问题的认识和判断都不尽相同,且参与者个人的行为和判断会不同程度地影响周围每个人的思维判断,使得专家群体中的交互关系存在着微妙的随时间变化的动态复杂性。因此,在综合集成研讨厅体系中,如何衡量专家意见的合理性,计算在研讨过程中涌现出来的专家权威度,刻画专家群体之间的交互关系和结构,从而促进研讨流畅、高效地进行,是研讨厅体系实践和应用过程中的一个重要问题。
      文献[7]提出一种对发言观点进行权威度计算的方法。该方法借鉴万维网网页的链接概念,根据发言之间的响应关系建立广义专家群体的有向链接结构。该结构采用有向属性图表示,专家的每条发言作为一个节点,每个节点有两个属性,即见解质量属性和见解评价属性。专家发言之间的响应关系作为有向边(链接)。根据发言响应和被响应的情况计算每条发言的权威度,发言被响应的次数越多,该条发言的权威度越高;权威度较高的发言所响应的发言,其权威度也较高,反之权威度越小。文献[8]提出了基于即时发言评价的专家权威度计算方法。在研讨过程中,各位专家在主持人的引导下按照一定的评价指标即时对发言进行评价,所采用的评价指标是相关度、可信度、合理度以及启发度。在研讨过程中,一个专家的权威度主要是由其发言效率和评价效率决定的。因此,基于即时发言评价的专家权威度计算方法的基本思想是通过计算专家的发言效率和评价效率,并对两者进行适当加权,进而得出专家的总体权威度。
      上述方法尽管可以计算专家某条发言的权威度,但是并没有从语义的角度考虑专家的发言内容之间的关系,同时也没有考虑专家群体交互的动态复杂性。基于此,本文提出了基于Semantic-PageRank(SemRank)的专家权威度计算方法。该方法既考虑专家之间的交互结构,又考虑专家发言内容之间的语义关联;在计算语义关联时,该方法还引入了时间要素这一概念来体现专家交互的动态复杂性。实验结果表明,本文提出的专家权威度计算方法合理、有效,可以为与会专家在综合集成研讨环境中进行良性互动提供一定的参考意义。
      1 PageRank算法
      本文提出的SemRank算法是在PageRank的基础发展得到的,“PageRank”技术[9]最早由斯坦福大学的“Google”研究小组提出。可以用一种“随机冲浪”模型作为“PageRank”的理论基础,该模型描述网络用户对网页的访问行为。假设如下:
      a)用户随机地选择一个网页作为上网的起始网页;
      b)看完这个网页后,从该网页所含的超链接中随机地选择一个页面继续进行浏览;
      c)沿着超链接前进了一定数目的网页后,用户对这个主题感到厌烦,重新随机选择一个网页进行浏览,如此反复。
      根据上述的用户行为模型,PageRank的基本思想就是引入一个网页的权威值的概念,其网页的权威值与网页的内容无关,权威值计算是根据网络的拓扑结构图。网页p的权威值取决于两个要素:a)有多少网页引用了它(网页p);b)引用网页p的这些网页的权威值。因此这是一个循环迭代的过程[10]。计算公式如下:

      x?p=dN+(1-d)?q∈pa[p]x?qh?q(1)
      
      其中:d∈(0,1)是阻尼因子;h?q是节点q的出度,就是q有多少个超链接外链;pa[p]是指向p的网页集合;N是指网络拓扑结构中节点数,即网页的数量。
      
      2 基于SemRank的专家权威度计算方法
      综合集成研讨厅体系的链接结构是通过专家群体的有效互动建立起来的。在互动过程中,专家对以前的发言进行评论,同时发表自己对问题的见解,通过这种响应建立起个体之间响应关系,进而可建立专家群体的有向链接结构。链接结构中,专家每次的发言为一个节点,专家发言的响应或者被响应关系为有向边,从而使得这种链接结构可用有向属性图表示。这与PageRank中描述WWW的有向属性有相似之处:WWW中的网页对应一个节点,WWW中网页的链接关系对应图中的边。文献[7]采用的就是这个思路计算专家发言的权威度。
      在实践过程中,运用上述方法却经常遇到两个问题:a)虽然某条发言A在长时间内得到较多的响应,但此时发言的主题已经发生了一定程度的改变,此时A的权威度理应下降,但是由于PageRank算法本身不考虑发言内容的语义相似度,导致计算出来的A的权威度偏高;b)越早的发言,权威度容易越高,这是因为较早的发言容易得到相对较多的响应,或者说最近的发言经常尚未得到充分的响应,此时按照PageRank计算的权威度会偏离真实的权威度情况。
      针对这两个常见问题,在PageRank算法的基础上,本文提出SemRank方法。该方法的优势在于:a)引入发言内容的语义相似度计算方法,在衡量某条发言的权威度时,不仅考虑它得到了多少响应,同时考虑它与所响应的发言之间的语义联系;b)引入时间衰减函数,对较近的响应赋予较大的权重,削弱某些早期发言过于长久的影响。
      SemRank算法同样根据有向属性图来计算每条发言的权威度,然后对每个专家的所有发言的权威值求均值,获得该专家的总体权威度。
      2.1 发言内容的动态相似度计算
      首先考虑专家发言之间的语义关联,把研讨中的每条发言表示成tf-idf向量形式,采用余弦相似度计算语义关联程度,计算公式如下:
      
      sim(u,v)=?ω∈u,vtf?u(ω)tf?v(ω)idf(ω)?2
      
      ?ω∈u(tf?u(ω)idf(ω))?2
      ?ω∈v(tf?v(ω)idf(ω))?2
      (2)
      
      其中:tf?u(ω)和tf?v(ω)分别表示词ω在发言u和v中的词频;idf(ω)表示逆文本频率,计算公式为
      idf(ω)=log (N/n?ω)(3)
      
      其中:n?ω是表示有多少条发言包含词ω,N为总的发言数。
      式(2)只考虑了专家发言之间的静态关系。实际上这种关系应该是与时间相关的:两条发言之间的时间间隔越长,语义之间的相似度就越低,反之则越高。因此本文考虑时间衰减要素,引入时间衰减函数(这里考虑的时间信息是专家的每条发言在整个研讨过程中的相对位置,而不是每条发言在研讨过程中出现的绝对时间),得到如下的动态相似度计算公式:
      s?i(u,v,T)=sim(u,v)×f?i(u,v,T);i=1,2(4)
      其中:f?i(u,v,T)为发言u与v之间的时间衰减函数。这里采用两种形式:
      a)f?1(u,v,T)=1-|k-i-1|/N。其中:发言u为研讨中第k个发言,发言v为研讨中第i个发言。
      b)f?2(u,v,T)=1/|k-i|。其中:发言u为研讨中第k个发言,发言v为研讨中第i个发言。
      2.2 专家权威度计算
      基于SemRank的专家权威度计算的算法实现过程如下:
      初始值:向量P?0=(p?0(1),p?0(2),…,p?0(N)),其中p?0(u)=1/N(u=1,2,…,N)。?
      输入:error ε。
      输出: 向量P=(p(1),p(2),…,P(N))。
       t=0
       repeat
      t=t+1
      根据式(6)计算P?t(u)(u=1,2,…,N)
      δ=‖P?t-Pt-1‖
      until δ<ε
      returnP?t
      在考虑了发言内容之间的动态语义相似度以后,专家之间交互的有向属性图就成为了一个加权的有向属性图。从文献[11]获得启发,在加权的有向属性图的基础上计算专家发言的权威值。
      加权的有向属性图通过两个矩阵的点乘形式表示:
      B?kN×N=AN×N?•×sim?kN×N;k=1,2(5)
      
      其中:B?kN×N(i, j)=AN×N(i, j)×sim?kN×N(i, j)(i, j=1,2,…,N;k=1,2);矩阵AN×N为邻接矩阵,如果节点i到j之间有一条有向边,则AN×N(i, j)为1,否则为0;矩阵sim?kN×N为动态相似度矩阵,式中sim?kN×N(i, j)=s?k(i,j,T)(k=1,2)。
      在此加权有向属性图矩阵B?kN×N的基础上,专家发言的权威值计算如下:
      
      p?k(u)=dN+(1-d)?v∈adj[u]B?k(v,u)B?k(v,i)p?k(v) (6)
      其中:k=1或k=2,即计算矩阵B?kN×N时采用了哪个时间衰减函数;N是属性图的节点总数;d是阻尼因子,一般都在区间[0.1,0.2]选择,一般选择0.15;adj[u]是指向u的发言集合。
      最后将权威度向量进行归一化,即
      P=(p(1)maxNi=1 p(i),
      p(2)maxNi=1 p(i),…,
      p(N)maxNi=1 p(i))(7)

    相关论文

    最新论文

    热点论文

    [中等教育职专政治教育中的德育渗透
      帮助学生树立正确的价值观和人生观,提升学生的个人品德与思想素质,是职专政治教育的主要目标与根本目的。但受限于传统政治教育的教学 [全文]
    [中国哲学传递“中国梦”正能量是记者的神圣使命
      摘要:中国梦是中华民族伟大复兴的梦,是当今中华民族前进的动力,是当前中国最具影响力、最具感染力、最具普遍性的正能量。记者作为以 [全文]
    [财务控制论企业集团财务控制的对策
    摘 要:市场经济飞速发展促使企业集团组织形式发生非常大的变化,那么企业集团需要有效利用自身发展优势,促进现代化经济发展。 改革逐渐 [全文]
    [财务控制中小企业的财务控制问题分析
    摘 要:随着市场经济体制不断完善,我国中小企业进入快速发展阶段,其在国民经济发展中的作用被不断凸显出来。本文中笔者以中小企业财务管 [全文]
    [职业教育分析音乐课堂中的情感互动及学生体验
      【摘要】针对音乐课堂中的情感互动及学生体验进行分析,基于学生的实际音乐学习需求、音乐学习目标等予以教学设计,以期能够不断提升音 [全文]
    [市场营销新时期下市场营销的演变趋势分析
    摘要:随着全球经济互相影响,新市场格局的形成让新时期环境里市场营销不断发生变革。而本文主要是对当今市场新形势进行一个分析,找出对市 [全文]
    [国际贸易国际贸易融资创新及风险控制
    [摘 要] 国际贸易企业融资风险的主要表现有两种:一是国际贸易企业无法以自身的流动资金偿还债务,要通过集资的方式偿还债务本金和利息; [全文]
    [国际贸易“互联网 +”时代下国际贸易发展策略研究
    摘 要:随着网络技术和经济全球化的进一步发展,互联网关系到国际贸易领域的方方面面,并以全新的国际贸易形态,将分散在世界各地的市场, [全文]

    售前客服

    咨询QQ:619978682

    在线客服