以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  [经验交流] 如何读文章,如何选研究课题  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=47619)


--  作者:eyounx
--  发布时间:5/27/2007 12:12:00 PM

--  [经验交流] 如何读文章,如何选研究课题
又是好久没来,看到前面iamwym发的“专题讨论——研究方法”,很有感触
开了几次会议,发现国内指导能力强的导师不多,甚至有些名气比较大的导师,都是靠学生自己摸索出的文章来出名,很多很多的学生在进行unsupervise learning。
这种状况也许在短期内无法改变,幸好还有Internet可以加强大家的交流。
作为一个长期不在线的版主,就写写我的研究经验作为补偿吧 --_--b


做研究的第一步是要有一个研究方向。但是这个方向一般来说是由阅历丰富的导师给的,而很多学生没有这样的导师,因此需要在第一步前增加第0步:自己寻找一个方向。

一个好的方向我觉得:1. 自己有很高的兴趣 2. 前途光明 3. 道路曲折 4. 道路不能太曲折
第一点很重要,也比较容易衡量。
第二点是说这个方向的终极目标,自己要能够看到光明的终极目标,这样在研究过程中一旦感到迷茫,这个终极目标会给你指路
第三点是说这个方向还有很多事情要做但还没有做,大家也不知道该怎么做好,否则它也不是一个研究方向
第四点是说自己要有在这个方向上做出一些成果的能力,要衡量自己是否啃得动里面的一些问题

那么如何知道一个方向是否满足以上一些标准呢。这就要靠辛苦的读文章了。首先大家应该不难找到一些现有方向的简介,在一些涉及AI整个领域的书,如《AI: A modern approach》,和一些网站上。对于每一个看起来感觉不错的方向,下面要阅读该方向的相关文章。


文章哪里找?
杂志和会议是研究人员交流研究成果的地方,除次之外还有技术报告等。
对于还没有入门的学生,首先应该阅读顶级杂志上的文章,而不推荐会议文章。因为会议文章有篇幅限制,不能面面俱到,要求读者有较强的背景知识;而一般杂志文章的任务之一是引入外行。
在自己具备评价能力之前,一定要阅读顶级杂志上的文章,一些质量不好的文章可能使你对这个方向失去兴趣,更甚者可能带你误入歧途。
下面列一些顶级杂志:
Artificial Intelligence: 简称AIJ
Journal of Artificial Intelligence Research: 简称JAIR
这两个是关于整个AI领域的杂志
Machine Learning: 简称MLJ
Journal of Machine Learning Research:简称JMLR
两个关于机器学习领域的杂志
IEEE Transactions on Knowledge Discovery and Data Engineering: 简称TKDE
Data Mining and Knowledge Discovery: 简称 DMKD
两个关于数据挖掘的杂志
IEEE Transactions on Evolutionary Computation: 简称TEC 或 TEvC
Evolutionary Computation: 简称 ECJ
两个关于进化计算的杂志
Neural Computation
IEEE Transactions on Neural Networks: 简称 TNN
两个关于神经计算的杂志
IEEE Transactions on Pattern Analysis and Machine Intelligence:简称TPAMI
关于机器视觉和模式识别方面的杂志
(具体领域的杂志可以向相关教授写信询问)
上面的杂志除了JAIR,JMLR是免费的,其他的都需要有数据库访问权。首先查询学校的图书馆是否购买了这些数据库;如果没有,可以先找到感兴趣文章的题目和作者(这是可以免费得到的),然后google找到作者主页,看看有没有在主页上共享文章;如果没有共享,可以写email问作者要(写email要注意礼貌);如果没有回音,可以问问在其他学校的同学,看看他们学校有没有购买数据库。

在有一些背景知识后,可以阅读顶级会议的文章。顶级会议的文章要比同时间顶级杂志的文章内容新1、2年。顶级会议列表请见本版置顶文章:
"[转帖] daniel: AI conferences"


文章怎么读?
第一次读文章,基本上都是读不懂的,即便是杂志文章,仍可能有不够浅显的地方。不用怕,大家都是这样过来的。一开始,特别要注重理解领域的背景、解决的问题、为什么要解决这个问题。然后是关注用什么方法解决,如何进行实验研究和理论研究。最后就是看别人的paper是怎么写的,学着写文章。(以后会发如何写文章的帖专门讨论)
下面总结几个阶段:
咬文嚼字:刚开始读文章就是这样,一字一字的读,一句话要读上好几遍才能明白在说什么。
顺藤摸瓜:终于大致明白一篇文章在讲什么了,文章的Introduction部分或Background或Related Work部分介绍了一些来龙去脉和相关工作,都给了引文,还有一些文章不细交代的地方也给了引文。顺着这些引文看下去,能得到更全面的了解。
温故知新:相关文章看了一些了,很多疑惑也明白了,再到过头来把以前读的文章再读一遍,发现以前的理解太浅,或者根本就不对。
提纲携领:读了大量这个领域的文章,来龙去脉都清楚了,有哪些问题也知道了,做法也明白了。下面再看文章就会很快了,看看Introduction,看看做法,看看结果结论就知道是怎么回事。
为我所用:当有了自己的研究课题了,读文章就不再限于理解文章,而是要找可以用得上的东西。
上面这些说起来很快,做起来还是需要不少毅力的。


先写到这里,以后计划再写如何做实验和如何写文章。
欢迎讨论指正!


--  作者:DMman
--  发布时间:5/30/2007 6:35:00 PM

--  
以下是引用eyounx在2007-5-27 12:12:00的发言:

1. 自己有很高的兴趣 2. 前途光明 3. 道路曲折 4. 道路不能太曲折
   


我很高兴 数据挖掘就是具体如此一个方向,而且是偶在楼主所谓的“第0步”选择的。:-)
--  作者:czzygxc
--  发布时间:6/4/2007 9:41:00 PM

--  haodongdong
好东东,我得从第0步开始。

--  作者:bigc
--  发布时间:6/5/2007 9:48:00 PM

--  
我有想法,可是神经网络却不是很好,AI就只用过A*等等的一些启发式搜索算法。
目前需要BP,我还是把问题描述清楚点:
假设 我需要评价一个

f = W1* X1+W2*X2+……
可是我不知道Wi怎样确定才好,于是,我就找到一个评价函数E,
任意给定Wi,计算F,然后通过评价函数E来评价f的好坏,从而决定Wi设置的好坏。

请问这样,是不是最后大量训练后,wi就基本稳定le。?


--  作者:bigc
--  发布时间:6/5/2007 9:50:00 PM

--  
我觉得我的研究方向
不光明
可是导师逼着我干活怎么办?
大家是怎么解决的?
--  作者:bigc
--  发布时间:6/5/2007 9:52:00 PM

--  
我的老师研究水平,就跟我在本科的水平一样,他的工程水平要高我一些(能够接项目,骗钱)
--  作者:Logician
--  发布时间:6/8/2007 11:24:00 AM

--  
顶一个!
呵呵!
--  作者:chsffly
--  发布时间:9/22/2007 9:27:00 PM

--  
学习一下
--  作者:gumayaodao
--  发布时间:9/25/2007 12:51:00 PM

--  re
前途光明 ,道路曲折,不能太曲折。呵呵,哲学思想
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms