当前位置:首考文秘网>范文大全 > 公文范文 > 基于模块化聚类的标签弹性推荐

基于模块化聚类的标签弹性推荐

时间:2023-06-16 17:10:03 公文范文 来源:网友投稿


打开文本图片集

〔摘 要〕[目的/意义]社会化标注系统为用户检索提供便利的同时也面临一些困扰,标签推荐研究有助于解决资源检索中精确度与召回率之间的两难抉择。[过程/方法]借助网络科学的理论与方法,通过对标签网络的模块化聚类处理获得主题聚类,采用度数中心度对主题聚类内部标签进行排名,根据特定规则选取Top-N标签数量。[结果/结论]实验结果显示,研究中提出的模块化Top-N标签推荐方法,具有可逐层细化的精确度和良好的召回率。该方法的弹性机制可为不同的检索要求提供差异化服务。

〔关键词〕社会化标注;标签推荐;模块化聚类;标签排序

DOI:10.3969/j.issn.1008-0821.2018.04.008

〔中图分类号〕G254.97 〔文献标识码〕A 〔文章编号〕1008-0821(2018)04-0058-07

〔Abstract〕[Purpose/Significance]Social tagging system is also facing some inconvenience while facilitating the retrieval of users.Tag recommendation research can help solve the dilemma between the accuracy and the recall rate in resource retrieval.[Process/Method]With the theory and method of network science,the topic clusters were obtained through the modularity clustering on tag network,the degree centrality was used to rank the tags in the topic clusters,the numbers of the Top-N tags were selected according to a specific rule.[Results/Conclusions]The experimental results showed that the modularity Top-N tag recommendation method had the accuracy of level-by-level refinement and the good recall rate.The flexible mechanism of this method could provide differentiated services for different retrieval requirements.

〔Key words〕social tagging;tag recommendation;modularity clustering;tag rank

Web2.0环境下,网络用户不仅是信息的接受者,同时也成为信息的组织者与架构者。文献网站、社交网站、图片网站、音乐网站等各种类型的网站纷纷采用社会化标注资源组织模式,允许并鼓励用户对网络资源进行标注,并根据标签向用户提供检索服务,从而使得社会化标注系统在互联网上迅速蔓延。与此同时,广大用户在享受社会化标注系统所带来的福利的同时,不得不面对其平层结构在资源检索中所造成的困扰。因此,以资源精确定位和有效覆盖为目的的社会化标注系统中的标签推荐研究引起了学术界的关注,并尝试建立多种推荐方法以满足上述目标及要求。

本研究采用网络科学的理论和方法,基于标签之间的关联关系构建标签网络。结合网络模块化聚类和中心度排序,生成主题聚类并提取不同主题聚类中的推荐标签。同时对该方法的弹性机制与资源覆盖率进行了解析与测度,以期建立一种能够适应不同检索需求的具有可调整性的弹性标签推荐方法。

1 研究工作综述

社会化标注系统中的相关资源都被赋予了不同的用户标签,通过标签能够直接引导用户直接到达资源层。尽管检索行为的最终标的物是目标资源,但是真正起到推荐作用的则是各类标签,而且其中的标签来源于用户的标注行为,又直接面对用户的检索行为。因此,学术界对于借助标签实现和辅助资源检索的标签推荐问题展开了相关研究,并在近年来取得了较为丰富的成果。

德国学者I.Peters和W.G.Stock[1]在对标签网络的测量中发现了标签节点度值的幂律分布规则,在此基础上利用切断文档精确标签长尾部分中的标签形成搜索标签。研究表明,搜索标签与一般的大众分类和传统知识组织系统兼容,并且可以通过长尾标签限制点击量,提高了信息检索结果的精确度。K.Yi[2]等人通过研究发现资源的URL与标签之间在排名和频率方面存在幂律关系。通过对网页资源主题标签的调查显示,主题标签可以被用作相同资源的同现网址的索引词,从而能够基于幂律分布的主题标签对资源推荐产生影响。J.J.Jung[3]采用朴素贝叶斯和支持向量机的数据挖掘方法,通过每个类目中标签术语的使用频率对所收集的资源进行分类。该方法应用于标记社交网络服务上的未标记资源,能够提升资源获取的广度。J.Mao[4]及其合作者基于标签同现关系构建标签网络,采用PageRank和HITS方法利用链路对节点加权,通过将权重转换为资源的推荐分数的方式,将标签网络向“标签——资源”网络扩展。测试结果显示,该方法相比基于标签协同过滤的方法在精度和召回度方面都能够得到改善。S.Yamamoto[5]等研究者以时间序列为基准,采用余弦相似度、朴素贝叶斯和TF-IDF相结合方法计算用户和主题标签之间的分数,以此来发现具有相似兴趣的用户,并且能夠评估用户的兴趣爱好进行推荐。M.F.Alhamid[6]等人则提出一种新的语境感知推荐模型,利用标签计算用户对其他类似语境的潜在偏好,通过查找用户语境以及语境与资源之间的相似性,确定对特定语境有吸引力的资源。并根据该特定用户的语境映射,推荐适合用户需求的最相关的资源。

推荐访问:模块化 弹性 标签 推荐

版权所有:首考文秘网 2015-2024 未经授权禁止复制或建立镜像[首考文秘网]所有资源完全免费共享

Powered by 首考文秘网 © All Rights Reserved.。备案号:冀ICP备15026071号-91