以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  [求助]请教一个分类的问题  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=66969)


--  作者:sonic530
--  发布时间:9/8/2008 4:13:00 PM

--  [求助]请教一个分类的问题
假设我现在有三类样本,如图一所示。它们可以很容易分类(这三类都服从高斯分布)。
问题是现在三类样本的幅度(即每个样本点模值)随机乘上一个随机变量
(可以假设这个随机变量服从特定分布),即可以认为它们受到了乘性噪声的干扰,这时它们就混在一起不能区分了就像图2所示的那样。
如果我对它们的幅度全部进行归一化,如图三所示,这时会产生两个问题
1。粉红色的点和黑点混在一起,基本不能分开
2. 所有的点都分布在单位圆上。此时若我想用最大后验概率来分类的话,首先需要假设各个类的样本服从高斯分布,然后求各个高斯的结构。但很明显所有的点都在单位圆上,明显不符合高斯分布这个假设。
   
上面两个问题中我首先最想解决的是第二个问题。我想通过对受到乘性噪声干扰的样本做一个逆变换,把它们恢复到之前如图一所示的那种分布(不一定要和图一一样,只要逆变换之后这三类仍服从高斯分布且分的很开就行了,因为我的目的是分类,而且这时问题1也得到了解决)。
可是我尝试了好几个代价函数来进行逆变换都失败了,逆变换没有很好的实现,分类效果很差。即使没有第一个问题,即粉红点和黑点在单位圆上分的很开,逆变换的分类效果也没有归一化的分类效果好(理论上说,用高斯来描述逆变换后的数据更符合数据的真实结构,分类效果应该更好才对)。

不知道大家对于如何做这个逆变换有什么建议?或者不一定非要做逆变换,能有其他很好的分类途径也行,还望各位前辈不吝赐教!多谢了!
按此在新窗口浏览图片
按此在新窗口浏览图片
按此在新窗口浏览图片


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
9,062.500ms