新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> The future of AI, is the future of computer
    [返回] 计算机科学论坛计算机理论与工程『 人工智能 :: 机器学习|数据挖掘|进化计算 』 → 求高人指教自动分类中待分类文档的向量表示方法 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 4613 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 求高人指教自动分类中待分类文档的向量表示方法 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     usernames 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:1
      积分:52
      门派:XML.ORG.CN
      注册:2008/2/20

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给usernames发送一个短消息 把usernames加入好友 查看usernames的个人资料 搜索usernames在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看usernames的博客楼主
    发贴心情 求高人指教自动分类中待分类文档的向量表示方法

    在文本自动分类中,类的特征向量可以用特征词的权重(比如TF-IDF)表示。当一篇待分类文档进入系统后,该文档的特征向量如何表示呢?因为在TF-IDF公式中,涉及到了训练文档总是N这些参数,可是现在只有一篇文档,怎样确定每个特征词的权重呢?这个问题一直困扰着我,看了很多文献,都只是介绍理论但不知道具体怎么实现的,恳请有这方面经验的高人给予指导!

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/2/20 15:36:00
     
     eweixia 美女呀,离线,快来找我吧!水瓶座1986-2-13
      
      
      等级:大一新生
      文章:3
      积分:63
      门派:W3CHINA.ORG
      注册:2008/5/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给eweixia发送一个短消息 把eweixia加入好友 查看eweixia的个人资料 搜索eweixia在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 点击这里发送电邮给eweixia 引用回复这个贴子 回复这个贴子 查看eweixia的博客2
    发贴心情 
    文本分词
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/16 16:36:00
     
     vanway 帅哥哟,离线,有人找我吗?处女座1981-8-28
      
      
      等级:大一新生
      文章:4
      积分:68
      门派:XML.ORG.CN
      注册:2008/5/19

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给vanway发送一个短消息 把vanway加入好友 查看vanway的个人资料 搜索vanway在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看vanway的博客3
    发贴心情 
    用训练集指导待分类文档,所以,相关的训练集级别的参数使用训练集的结果
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/19 12:47:00
     
     阿达 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:7
      积分:82
      门派:XML.ORG.CN
      注册:2008/5/23

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给阿达发送一个短消息 把阿达加入好友 查看阿达的个人资料 搜索阿达在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看阿达的博客4
    发贴心情 
    关注中。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/23 23:05:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/8/5 13:25:11

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms