以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  Class Distribution  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=22922)


--  作者:boyang
--  发布时间:10/10/2005 9:24:00 PM

--  Class Distribution
小弟对Class Distribution 不太理解,有个问题想求教各位大侠。为什么不同的人对同一个数据集的Class Distribution 描述却不同。例如,对于uci上的数据集vote,有人写到它的Class Distribution 是62.07%(其中的一个),而从UCI上下载的该数据集的描述中Class Distribution 却是45.2 %和 54.8%。但是,该数据集明明是267个正例,168个负例。267/435=61.38%。是不是小弟对 Class Distribution的理解有误,Class Distribution不是各类实例所占的比例吗?求教各位大侠,求教版主。
--  作者:eyounx
--  发布时间:10/21/2005 12:29:00 AM

--  
理解没错

有些数据集作了处理,比如去除了有缺失属性值的实例


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
742.188ms