TA的每日心情 | 奋斗 2020-9-2 15:06 |
|---|
签到天数: 2 天 [LV.1]初来乍到
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要: 尽管用户可自主生成个性化数据以更全面描述个人偏好,但由于用户创建数据不严谨、不可控,导致生 成的庞大数据集大多存在质量低、噪声严重的缺陷.因此管理复杂网络信息时,不能仅使用写入性知识,必须重视具有 大量领域知识的专家,因为其可为系统提供高质量的信息.本文通过构建和分析用户兴趣分布曲线以发现兴趣领域专 家,并提出甄别状态不正常的伪专家算法.由于网络中权威专家数量较少,所以所提供的信息是有限的.因此本文定义 的领域专家不仅包含权威专家,而且包含普通用户中对某领域有极高关注的兴趣领域专家.实验证明算法的正确性和 高效性,并且较低的复杂度使其可处理海量用户节点信息. ' U& \# \, A7 c7 H, \
, {, P0 i$ _4 ]+ _% C( W
关键词: 专家发现;兴趣分析;兴趣图谱;复杂网络分析
$ J. g/ z+ W/ g5 j" ~; w! _% I0 Q4 T7 o
+ ~* U" G- F" C# U" G) i9 u& {- O) \) @9 t+ N& D2 v. @
从社会网络用户中发现专家以扩展网络信息储备 量,是一种在特定领域中寻求知识量较多用户的信息检 索过程.网络信息多样化导致数据噪声和严重的冗余现 象,因此知识挖掘和管理不能仅局限于写入性知识(传 统互联网页面信息),必须重视拥有大量领域知识的专 家所能为系统提供的高质信息.专家发现算法主要包 含:基于共词分析和网络特征分析[1],基于关联关系分 析或网络节点链接信息[2],基于文本相关度和用户权威 度分析[3],发现社区以确定专家[4],基于监督 /半监督的 机器学习[5],有识别能力的概率模型[6]及多种专家发现 策略的融合算法[7]$ H+ ~, L* k( B8 Y, S# n
4 g8 H& n" w2 d1 K c0 K) U | |& N. m% u9 U, r5 w
9 p1 `3 l5 k& e; w; E, K' l: \8 d
4 D( Q3 J2 y2 y) |) T6 `附件下载: |
|