|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的思想,将协同实体关系融合到主题模型中,并在此基础上利用维基百科知识库,进行半监督消歧.本文最后在网络文本数据上进行了相关的实验,验证了所提算法的有效性.实验表明该方法有效的提高了实体消歧精度.
; f/ m k. \' h) y$ S1 u& K* D. U) J6 \! ~ P6 ]
关键词:实体消歧;维基百科;双词主题模型
% s6 w- M3 C3 C" {2 v) q, g
: j% Z% V9 d0 S) x6 S* k6 A 命名实体消歧(Named Entity Disambiguation,NED)是将文档中提及的命名实体链接到一个无歧义的知识库中相应实体的过程,该技术广泛应用于信息抽取、知识库构建、语义搜索"等领域.在网络文本数据中,蕴含着大量的歧义实体,如何从这些网络数据中获得准确的实体信息是网络信息抽取亟待解决的问题.为了解决这一问题,实体消歧技术得到广泛的研究.
$ e4 t6 @! t+ g9 m" B* H* f3 d
4 g$ N( N6 T( r4 X* c* ?6 s$ R" R* P, f) ~( o: I! S1 ]
6 R* p' n, `9 M2 b& t* F6 {: ^! v6 ^6 Z, q5 F a h
' d# [7 C4 n# ~+ d2 Q' J: V6 x( b2 D4 M* ? K: A
3 f9 v# q# O2 h# k/ V: B" {& K
1 Y( L- c! T* H, F0 ^, S
|
|