|
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
# ]; X6 b: c7 e8 e K) N
论文提出了一种解决大规模稀疏问题的多目标算法,大规模稀疏存在于许多领域:机器学习、数据挖掘、神经网络。
1 C/ L, H+ H% ]" M2 e( E9 c2 O" T- J作者主要讨论了四个具体的问题, P$ Y! V6 S8 c: A% E4 X) d% M
- ①特征选择
- ②模式挖掘
- ③关键节点检测
- ④神经网络训练
& y$ J O& r! x% [# U4 B+ i 上面四个问题虽然存在于不同领域,但是它们都属于多目标问题,它们的pareto面的解集都是稀疏的。举例来说,对于大规模特征选择问题,10000维中只能选取不到100个,压缩率达到了99%,是典型的稀疏问题。5 B" J) c9 R! ]; k/ Y
& R- V! y7 I. z2 w, C
具体问题
8 O* h' e/ M: F3 k7 T3 l* n k: Y3 H# {3 Y2 [& T0 h% p; W
$ l/ u3 R" }, @' L0 O' X3 l
5 Z0 Q- z" ^- Z
1 g" G) c5 ]( F% S
. l9 e X& b; F0 q9 `9 ^
9 c3 u2 R. q+ y$ Q算法的贡献' C# l% V$ c1 g
, ^" u) b; z& `' A- ①设计了新的种群初始化策略(根据稀疏大规模特性,能够获得一个很好的前沿面)
- ②设计了新的基于pareto解集稀疏性的遗传算子3 w' g6 n- ^( |/ U
1 q; M% x( E5 [% g9 J; t, o
9 m9 y; r. l# c具体算法" d& j t, S* O: Z' {& g
* F7 b _# ?" w
算法框架+ c% `) A9 Q4 Z
$ e. G3 t+ X& e% H
类似于NSGA2的框架
% i, h$ L. h7 P5 M2 [) Q' M6 g. b" s3 [. p8 | e
. ?2 o. `7 R* |( o" T, `' `& P" y
3 v8 h8 F! F6 d9 U1 y) {% \# S8 ~) |
% j5 v( p3 o! C; k/ C# V% E1 S初始化策略
- `. ]! x6 }! }7 L( Y7 W7 X- R
4 z+ s. z: A8 X' H! _9 D2 n为了集成两种编码,需要引入两个向量,一个是决策变量向量dec (实际上是进化的解,对于01编码来说,可以全置1),另一个是掩码向量mask(实际上一个01向量,用来记录每个维度的好坏,好的置1),最终的决策变量是两者的内积。/ y! @6 k3 G4 ^! U: K, `! T
6 Q' U' I9 H/ S& _2 h0 M/ }
. P, V1 M5 U$ x P9 n& u4 H# _9 G1 V1 @0 Q5 W' ]* G' h8 d- X8 P
经过初始化后的结果:$ E% i0 Y! S$ R4 X
' m" s& L$ j" [
( ^7 J( [7 Q0 @8 V+ @# s9 m
& \. `$ p& @8 x5 [( |可以看到,通过该初始化策略,获得一个一个近似于pareto面的良好分布。2 X6 m \% X1 _- L' @
& c" M. i0 w1 i: V
. s2 Y$ `7 F) t* c5 b+ b, ]" A交叉变异算子
6 ^2 H7 H( k$ K
: p* T+ A2 Y( A7 n$ A$ _! R这个交叉变异是算法的核心,它每次在二进制向量mask中,以同样的概率每次在0元素中翻转一个元素,或者在非0元素中翻转一个元素,翻转是根据决策变量的适应度值进行的。因此,生成的子代不会有同样数量的0和1,并且可以保持子代的稀疏度。
) \' @* J/ U5 u" _, d% Y' |8 Q+ _
9 G" n+ x: n3 O" M. @$ v/ A- F7 Z; c
采用交叉变异后的结果:
3 R9 {0 g" g; i9 j7 Z2 H0 \1 C5 y
. g' o# j5 {5 A
, X! f2 `( s( |' F: q( o0 T, X
) A4 |. D- f C; |可以看到,通过此策略,提高了稀疏度,被置为1的维度越来越少。. Q& a% ^, i# t# J! h9 f+ m
) J. M0 u$ ~ E) `2 n2 Q9 e- H$ C, I
其他. ^' O; Y: ~1 n' e" ?2 q
5 l# t. W# U0 h% _6 x4 D
对于实验部分,作者设计了具体的测试套件,结果也非常乐观,在此不赘述。+ ?4 m+ s. R* I1 o7 U% A3 ?! q: o# q
|
|