以文本方式查看主题 - 计算机科学论坛 (http://bbs.xml.org.cn/index.asp) -- 『 人工智能 :: 机器学习|数据挖掘|进化计算 』 (http://bbs.xml.org.cn/list.asp?boardid=62) ---- 求高人指教自动分类中待分类文档的向量表示方法 (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=58997) |
-- 作者:usernames -- 发布时间:2/20/2008 3:36:00 PM -- 求高人指教自动分类中待分类文档的向量表示方法 在文本自动分类中,类的特征向量可以用特征词的权重(比如TF-IDF)表示。当一篇待分类文档进入系统后,该文档的特征向量如何表示呢?因为在TF-IDF公式中,涉及到了训练文档总是N这些参数,可是现在只有一篇文档,怎样确定每个特征词的权重呢?这个问题一直困扰着我,看了很多文献,都只是介绍理论但不知道具体怎么实现的,恳请有这方面经验的高人给予指导! |
-- 作者:eweixia -- 发布时间:5/16/2008 4:36:00 PM -- 文本分词 |
-- 作者:vanway -- 发布时间:5/19/2008 12:47:00 PM -- 用训练集指导待分类文档,所以,相关的训练集级别的参数使用训练集的结果 |
-- 作者:阿达 -- 发布时间:5/23/2008 11:05:00 PM -- 关注中。 |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
54.688ms |