计算机科学论坛--显示贴子

以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  [求助]关于Weka的文本挖掘问题，求各位大仙帮忙~  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=89142)

--  作者：Jennyeleven
--  发布时间：1/15/2011 7:21:00 PM

--  [求助]关于Weka的文本挖掘问题，求各位大仙帮忙~
最近在写一篇论文，是关于文本挖掘的，中间遇到了一个问题，我是属于菜鸟级的，不知道如何解决，希望大家能帮帮忙？
我是要对网上的评论进行挖掘，以句为单位，分好词后，把每句话中的名词抽取出来，然后想用关联规则算法对其进行挖掘

举个例子，比如我要对手机的评论进行挖掘，分词后得到下面的形式的信息：

第一句：手机智能型手机智能型办公游戏软件
第二句：屏幕新闻方便手指地方键
第三句：照相性能  手机录像照相定位
第四句：强光屏幕通讯录塑料感桌面快捷键
第五句：手机阳光桌面快捷键
第六句：屏幕性价比电池音效
第七句：屏幕画面外形后盖女生手机

其中每行是一个句子里面抽取出的关键词，但是这里我不知道应该把这些关键词存成什么样的格式，因为每个句子最后抽取出来的关键词数目会不一样，没办法存成二维表的形式，大家能给我点提示吗？这样的信息应该怎么用weka来挖呢？具体怎么操作呢？不知道我表述清楚没有……万分感谢！

--  作者：xhp3057
--  发布时间：12/31/2011 11:19:00 AM

--
期待有人解答

--  作者：boyboyvox
--  发布时间：1/29/2013 2:30:00 PM

--
同问？

--  作者：hyh5800
--  发布时间：6/8/2013 9:36:00 AM

--
我也期待答案！

W 3 C h i n a ( since 2003 ) 旗下站点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》

93.750ms