找回密码
 注册
关于网站域名变更的通知
查看: 947|回复: 1
打印 上一主题 下一主题

[毕业设计] M2LSH%3A基于LSH的高维数据近似最近邻查找算法

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-5-28 10:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
M2LSH%3A基于LSH的高维数据近似最近邻查找算法

. x" \6 `4 ~0 _. D0 M摘要:在许多应用中, LSH(Locality Sensitive Hashing )以及各种变体,是解决近似最近邻问题的有效算法之一.虽然这些算法能够很好地处理分布比较均匀的高维数据,但从设计方案来看,都没有针对数据分布不均匀的情况做相应的优化.针对这一问题,本文提出了一种新的基于ISH 的解决方案(M2ISH,2 Layers Merging I.SH) ,对于数据分布不均匀的情况依然能得到一个比较好的查询效果.首先,将数据存放到具有计数功能的组合哈希向量表示的哈希桶中,然后通过二次哈希将这些桶号投影到一维空间,在此空间根据各个桶中存放的数据个数合并相邻哈希桶,使得新哈希桶中的数据量能够大致均衡.查询时仅访问有限个哈希桶,就能找到较优结果.本文给出了详细的理论分析,并通过实验验证了M2LSH的性能,不仅能减少访问时间,也可提高结果的正确率.' F, w( c9 w% }  g- v- W" P5 R+ Q
关键词:近似最近邻;KNN查询;局部敏感哈希;高维数据% G5 ?/ f) k+ a
0 e$ G/ }! J7 j! W; _7 F: C5 S
1引言/ U% |/ }  c1 n7 h# c7 D+ r
最近邻查询问题( nearest neighbor search problem)指在给定数据集中返回与查询对象距离最近的数据对象的问题.最近邻问题在不同领域都有广泛的应用,如:人工智能、信息检索、模式识别等.形式化地,最近邻查询指在给定有n个d维数据对象的数据集D中找到与3 D: P8 |* S3 y( R% }
! y# L( @& ]% E4 B  D7 V! Q
游客,如果您要查看本帖隐藏内容请回复
& W# T$ Q  C+ Y  o/ L3 p# s

/ _" V$ ]; e) [6 V$ W' ?3 l9 `. v

该用户从未签到

2#
发表于 2021-5-28 11:08 | 只看该作者
M2LSH%3A基于LSH的高维数据近似最近邻查找算法
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-8-19 12:43 , Processed in 0.109375 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表