以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  [求助]关于Weka的文本挖掘问题,求各位大仙帮忙~  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=89142)


--  作者:Jennyeleven
--  发布时间:1/15/2011 7:21:00 PM

--  [求助]关于Weka的文本挖掘问题,求各位大仙帮忙~
最近在写一篇论文,是关于文本挖掘的,中间遇到了一个问题,我是属于菜鸟级的,不知道如何解决,希望大家能帮帮忙?
我是要对网上的评论进行挖掘,以句为单位,分好词后,把每句话中的名词抽取出来,然后想用关联规则算法对其进行挖掘

举个例子,比如我要对手机的评论进行挖掘,分词后得到下面的形式的信息:
  
第一句:手机 智能型 手机 智能型 办公 游戏 软件
第二句:屏幕 新闻 方便 手指 地方 键
第三句:照相 性能  手机 录像 照相 定位
第四句:强光 屏幕 通讯录 塑料感 桌面 快捷键
第五句:手机 阳光 桌面 快捷键
第六句:屏幕 性价比 电池 音效
第七句:屏幕 画面 外形 后盖 女生 手机
  
其中每行是一个句子里面抽取出的关键词,但是这里我不知道应该把这些关键词存成什么样的格式,因为每个句子最后抽取出来的关键词数目会不一样,没办法存成二维表的形式,大家能给我点提示吗?这样的信息应该怎么用weka来挖呢?具体怎么操作呢?不知道我表述清楚没有……万分感谢!


--  作者:xhp3057
--  发布时间:12/31/2011 11:19:00 AM

--  
期待有人解答
--  作者:boyboyvox
--  发布时间:1/29/2013 2:30:00 PM

--  
同问?
--  作者:hyh5800
--  发布时间:6/8/2013 9:36:00 AM

--  
我也期待答案!
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
50.781ms