找回密码
 注册
关于网站域名变更的通知
查看: 766|回复: 3
打印 上一主题 下一主题

最大相关最小冗余(mRMR)算法

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-7-13 13:54 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x

( ^% \' y6 q2 l' w. X, h在做特征选择时,可能面临两个问题:特征与类别预测有多大相关性,特征之间有多大冗余度。在特征选择中,“最好的m个特征不一定是m个最好的特征”,从相关度与冗余度来看,最好的m个特征是指与分类最相关的特征,但由于最好的m个特征之间可能存在冗余,因此最相关的m个特征并不一定比其他m个特征产生更好的分类准确率。可以看出,特征选择可以分为两个过程:1、怎样度量特征相关性。2、怎样解决特征之间的冗余。7 Z' T$ d9 B6 }: b' ]' z6 G
& e$ V- a# o. }2 ~5 F9 Q. p. E7 G
互信息' p9 ^6 I4 C: g- |# O5 R& ?2 L
! k! Y6 J( b7 Y/ v' j0 {

+ U2 W9 c9 X( x+ x1 ^互信息可以度量两个变量x,y之间的相关关系。如下图所示:+ X6 O. a7 f4 `% `8 L

7 z/ e" D4 |/ v" ~: I# I  O4 R * r2 u1 w, K4 z$ m7 g

+ ]- x6 o! q2 b2 G" G考虑特征x与分类目标c,计算I(x,c),I(x,c)的大小代表了x与c之间的关联度的大小。从所有特征中选出与c之间互信息最大的m个特征,就可以得到与c最相关的m个特征。
$ `- K. A% Q2 }7 w: ~$ ~: M2 t$ e# |: U
最大相关度与最小冗余度  X, g' ?/ Q/ t; s/ Y
) X, a  I7 f* u% i& K7 {* ~0 }
设S表示特征{xi}的集合,|S|=m. 为了选出m个最相关特征,使得S满足如下公式:' M2 C- W( V6 z& u

- S. X( Z" V* X- y- E; k7 T ( q% T( @9 `! z" m. W
) k& i, ^; j3 N" |6 P
可见目标是选出m个平均互信息最大的集合S。9 g! l2 N$ x+ P+ _6 s8 }$ f- n9 e; U
S很可能包含相关度很大的特征,也就是说特征之间存在冗余。集合S的冗余度如下式所示:( ?% |% X3 y& i
  Y) S! _' u/ v6 w

& l- T3 d& O1 W7 A" ~4 ^6 M% K+ \. {2 P* s4 f7 u8 o0 p- l4 K
最终目标是求出拥有最大相关度-最小冗余度的集合S,直接优化下式:, l: E- _# M' l2 i

- |1 ]. j- f5 p, q7 z$ {   ]6 w! |2 \, u* [4 @! I" s
9 P8 k' v& I0 \% }" @. N1 J. v
直观上说D的增大,R的减小都会使得目标函数增大。$ r1 E+ _0 K8 r/ s5 e
假设现在S中已有m-1个特征,现在需要从余下的特征中选择第m个特征。
1 t  ~3 z  [3 G* W' r. S$ W. ^. m- g! I4 m+ t' m( _+ v. S

" J, s: B& d  ^% S$ }& S9 M
3 B+ s! p' |9 z1 B6 @2 f( ]特征选择过程  X3 p0 B  O; Z" v
5 h; }' c3 u' r1 `
特征选择的目的是选择出一个具有很好分类效果的精简特征集。为了达到此目的,可以分两步进行:第一步,利用mrmr选出候选特征集;第二步,利用其它方法选出精简特征集。& {  h9 z7 e7 |0 J$ P4 T* V, \

* M% x, i7 @( k* e1 H8 ]4 t/ [* }7 `+ S# K( F% Q7 y
主要步骤:
2 m: Z; b. B. Q* L) V* U3 J( ~+ l0 M6 e6 g, Y
  • 将数据进行处理转换的过程(注:为了计算两个特征的联合分布和边缘分布,需要将数据归一化到[0,255]之间,并且将每一维特征使用合理的数据结构进行存储)
  • 计算特征之间、特征与响应变量之间的分布及互信息
  • 对特征进行mrmr得分,并进行排序
    - S( f& I2 e& p1 C/ V. p

# j3 j4 y, c* h! p* C

该用户从未签到

2#
发表于 2021-7-13 15:18 | 只看该作者
最大相关最小冗余(mRMR)算法

该用户从未签到

3#
发表于 2021-7-13 15:19 | 只看该作者
最大相关最小冗余(mRMR)算法

该用户从未签到

4#
发表于 2021-7-13 15:20 | 只看该作者
最大相关最小冗余(mRMR)算法
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-10-29 19:52 , Processed in 0.140625 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表