以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  同样的数据,转为weka格式分类,效果很差?  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=56562)


--  作者:guanshuihao
--  发布时间:12/10/2007 1:35:00 AM

--  同样的数据,转为weka格式分类,效果很差?
文本分类的数据,4500 个文本,每个向量1000个特征,用c++写的普通的naive bayes分类效果有80%左右,但是转为weka的格式分类,精度只有60多,使用核估计也差不多这么多,怎么回事啊,是不是weka的 naive bayes实现不一样?

另外用svm分类,效果是87%左右。而使用smo效果85%左右,可能是因为参数的问题,weka的smo的最优参数怎么选择?

谢谢


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms