|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
属性约简准则与约简信息损失的研究
# E* A& |# {0 M+ |# E2 E+ j9 d摘要:属性约简是粗糙集的重要研究内容,信息嫡是度量信息量的方法.在研究绝对约简和几种相对约简的基础上,归纳出属性约简的一般准则.定义了基于条件属性信息嫡的属性约简和基于联合嫡的属性约简,研究了几种属性约简与绝对约简之间的关系.定义了基于条件属性信息嫡的约简信息损失,澄清了属性约简不损失信息的含糊观念,指出了属性约简只是在约简准则意义下不损失信息,在信息嫡意义下可能损失信息.为进一步研究粗糙集,粒计算中属性约简与分类夯实了信息论基础.
" Q9 N# d" ~: l关键词:粗糙集;属性约简;信息嫡;联合嫡;信息损失7 p- s+ n! A/ h7 K* u- [
% u# J5 q0 n* l1 `
1引言3 G. [& I$ W- r9 \# H6 V* z0 V( s
粒计算[12]是人类智能处理问题的思维方式,也是处理不确定性问题的方法.粒计算的主要方法有模糊集[3]、粗糙集4~7]、商空间[8和云模型”等.粗糙集理论[4~”是一种处理不精确、不完全、含糊数据的有效数学工具,是数据挖掘和分类的重要方法.
% ^! o& R6 \* ?粗糙集最重要的应用在于不确定性分析和属性约简.研究者们提出了上、下近似+~7]、隶属度[10]、信息嫡"]、条件嫡[1213]、粗糙嫡、模糊嫡[115]等不确定性度量来刻画和描述数据的不确定性,其中很大一部分不确定性指标被用来作为条件属性约简的准则,例如:条件嫡、互信息等,由此衍生出了各种各样关于属性约简的研究["~23].几乎所有的条件属性约简都笼统地宣称保持分类不变或信息不变,人们也非常认同这个观点.但是条件属性约简是否真的保持信息不变、信息无损# w& k3 q G) {2 P0 u7 l) X! N
' d% s, R1 o/ H8 g3 p
; `1 ~' L" `) r
- O4 \3 k$ [) L1 K: ]( _7 {" l, r5 {8 ` E/ L1 T* d, E( P
|
|