以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  求高人指教自动分类中待分类文档的向量表示方法  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=58997)


--  作者:usernames
--  发布时间:2/20/2008 3:36:00 PM

--  求高人指教自动分类中待分类文档的向量表示方法
在文本自动分类中,类的特征向量可以用特征词的权重(比如TF-IDF)表示。当一篇待分类文档进入系统后,该文档的特征向量如何表示呢?因为在TF-IDF公式中,涉及到了训练文档总是N这些参数,可是现在只有一篇文档,怎样确定每个特征词的权重呢?这个问题一直困扰着我,看了很多文献,都只是介绍理论但不知道具体怎么实现的,恳请有这方面经验的高人给予指导!
--  作者:eweixia
--  发布时间:5/16/2008 4:36:00 PM

--  
文本分词
--  作者:vanway
--  发布时间:5/19/2008 12:47:00 PM

--  
用训练集指导待分类文档,所以,相关的训练集级别的参数使用训练集的结果
--  作者:阿达
--  发布时间:5/23/2008 11:05:00 PM

--  
关注中。
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
54.688ms