以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  数据挖掘人员的素质、能力要求  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=47750)


--  作者:DMman
--  发布时间:5/30/2007 12:53:00 PM

--  数据挖掘人员的素质、能力要求
讨论一下大家对数据挖掘人员需要的素质。这也是数据挖掘学习者努力的方向。一下收集了几个典型的总结。希望大家能补充,讨论!

第一楼:数据挖掘人员的能力要求
摘自 数据挖掘者的博客
  本部分是对挖掘人员本身素质的需求,包括专业技能、行业知识、合作精神、客户关系能力等各方面的能力要求。

基本能力要求
数据挖掘人员需具备以下基本条件,才可以完成数据挖掘项目中的相关任务。
一、专业技能
          硕士以上学历,数据挖掘、统计学、数据库相关专业
          熟练掌握关系数据库技术,具有数据库系统开发经验
          熟练掌握常用的数据挖掘算法
          具备数理统计理论基础,并熟悉常用的统计工具软件

二、行业知识
          具有相关的行业知识,或者能够很快熟悉相关的行业知识

三、合作精神

          具有良好的团队合作精神,能够主动和项目中其他成员紧密合作

四、客户关系能力
           具有良好的客户沟通能力,能够明确阐述数据挖掘项目的重点和难点,善于调整客户对数据挖掘的误解和过高期望
          具有良好的知识转移能力,能够尽快地让模型维护人员了解并掌握数据挖掘方法论及建模实施能力


进阶能力要求
数据挖掘人员具备如下条件,可以提高数据挖掘项目的实施效率,缩短项目周期。

          具有数据仓库项目实施经验,熟悉数据仓库技术及方法论
          熟练掌握SQL语言,包括复杂查询、性能调优
          熟练掌握ETL开发工具和技术
           熟练掌握Microsoft Office软件,包括Excel和PowerPoint中的各种统计图形技术
         善于将挖掘结果和客户的业务管理相结合,根据数据挖掘的成果向客户提供有价值的可行性操作方案



--  作者:DMman
--  发布时间:5/30/2007 12:55:00 PM

--  
第二楼:一则招聘信息
数据挖掘高级工程师需求:

工作职责:
1. 负责数据挖掘领域的分析研究,包括数据挖掘算法的分析研究,特定工程的数据挖掘模型的需求分析、建模、实验模拟;
2. 负责指导软件开发工程师进行数据挖掘系统的开发,包括需求分析、系统设计、系统测试和优化;
3. 负责研究成果在公司内的推广应用,以及对外合作交流,不断提升公司的技术能力;
4. 针对营销理论、消费者的消费行为数据结合数据挖掘领域的特点进行综合全面的业务逻辑架构及系统架构设计。

任职要求:
1. 计算机或数学相关专业毕业硕士以上学历;
2. 3年以上数据挖掘理/数据仓库相关工作经验, 具有深厚的统计学、数学、人工智能和数据挖掘知识基础;
3. 良 编程能力,C++或JAVA中至少掌握一种;
4. 了解数据挖掘的基本处理流程,能够进行包括网络、主机、数据库、应用软件等内容在内的系统架构设计和方案配置,有SAS EM/IBM IM/SPSS Clementine等数据挖掘工具使用经验者优先;
5. 有经济学,市场营销学知识及经验者优先;
6. 熟悉unix操作系统,熟悉DB2/Oracle等大型关系数据库。


--  作者:DMman
--  发布时间:5/30/2007 12:56:00 PM

--  
第三楼:一则招聘信息的要求
初级、中级、高级数据挖掘研发人员
强烈要求的技能:
1, 拥有2年以上软件研发经验
2, 熟悉Java语言
3, 熟悉数据挖掘、机器学习或者统计分析理论

拥有以下一条或多条技能者优先考虑:
4, 熟悉JBOSS、Tomcat等开源项目,有利用开源项目进行研发的经验
5, 熟悉javascript, AJAX技术
6, 熟悉数据库开发,熟悉Oracle、MySQL、PostgreSQL等主流数据库的管理和使用
7, 有SAS、SPSS、IBM IM、SQL Server Data Mining、MATLAB等数据挖掘和统计软件使
用经验


--  作者:chris
--  发布时间:5/30/2007 9:29:00 PM

--  
DMan,这个要求太高了
难找工作
请问如果想学数据库,该如何开始
请指导下
去看了你的Blog,做的很好啊
--  作者:DMman
--  发布时间:5/31/2007 1:30:00 PM

--  
以下是引用chris在2007-5-30 21:29:00的发言:
DMman,这个要求太高了
难找工作
请问如果想学数据库,该如何开始
请指导下
去看了你的Blog,做的很好啊


1 上面的要求确实太高了,不可能也没有必要全具备。我觉得从就业角度出发,关键是以不变应万变。每个职业都有宽泛的应用,我们要做的首先是学好最基本最核心的东西,然后了解相关的东西。犹如操作系统,有了内核,应用层是可以扩展的。
2 兄台所提要学习数据库,可是一个广阔的话题。具体操作起来应考虑自己的背景。我觉得应该从应用出来学习,先熟悉数据库产品的功能、操作方法等等,然后研究理论性的东西,诸如数据建模的方法、范式理论、并发性等等。现在主流的数据库是关系数据库,如SQL Server、Oracle等等,Access是基于文件的,还是不去专门研究的好。可以选一类学习操作,然后再读好书学习理论。国内最著名的数据库教程是王珊萨师煊的教材,不过到咱这个份上了,看就看外国人写的(中国人翻译的),有些好教材。


--  作者:chris
--  发布时间:5/31/2007 5:37:00 PM

--  
以下是引用DMman在2007-5-31 13:30:00的发言:
[quote]
1 上面的要求确实太高了,不可能也没有必要全具备。我觉得从就业角度出发,关键是以不变应万变。每个职业都有宽泛的应用,我们要做的首先是学好最基本最核心的东西,然后了解相关的东西。犹如操作系统,有了内核,应用层是可以扩展的。
2 兄台所提要学习数据库,可是一个广阔的话题。具体操作起来应考虑自己的背景。我觉得应该从应用出来学习,先熟悉数据库产品的功能、操作方法等等,然后研究理论性的东西,诸如数据建模的方法、范式理论、并发性等等。现在主流的数据库是关系数据库,如SQL Server、Oracle等等,Access是基于文件的,还是不去专门研究的好。可以选一类学习操作,然后再读好书学习理论。国内最著名的数据库教程是王珊萨师煊的教材,不过到咱这个份上了,看就看外国人写的(中国人翻译的),有些好教材。




谢谢DMan指导
我还是先学SQL Server的应用吧,毕竟还有几个月要找工作了
理论估计就没时间了,导师还给我布置了一个理论课题
以前导师问我想不想学DM,我说不知道,结果就没搞这个
早点看到你的Blog就好了阿
--  作者:DMman
--  发布时间:5/31/2007 5:46:00 PM

--  
chris兄台客气了,偶的博客成立不到两个月,想早点看到也不可能啊 呵呵
男怕投错行,在对数据挖掘的选择上,我也是经历了由热爱到犹豫,再由动摇到坚定的过程。经过仔细的调研,我觉得数据挖掘前景大好。
我也主要学习sql server,建议你找工作前复习一下常用的sql语句。比如我一位师兄 挺优秀的,复试时 要求写 授权 的sql语句(grant),他忘掉了,影响了成绩。有些虽然不常用,但基本的 还容易考察。
祝你找到心仪的工作!
btw,我觉得对于计算机基础较好的人来说,数据挖掘起点比较低,不到两个月全入门。然后需要的就是实战经验。


--  作者:chris
--  发布时间:5/31/2007 11:26:00 PM

--  
DMan,说的有理
现在很后悔,当时我没选,导师就把DM这个课题给另外一个同学了
她下周就去调研ms要开始实践了
我呢就只能乖乖作理论
很是郁闷
这个暑假要好好利用的
我在我的Blog介绍了你的Blog,希望你不要介意阿
--  作者:DMman
--  发布时间:6/1/2007 8:59:00 AM

--  
1 我是“DMman”, not “DMan”...
2 长路漫漫,有得有失,错过了不一定是不幸。我觉得每一步的成功都需要努力的工作加上一点运气,后者也很重要。
3 多谢兄台支持偶的Blog ,不知兄台的blog地址?偶也想光顾参观
--  作者:chris
--  发布时间:6/1/2007 5:11:00 PM

--  
Sorry,一直以来把你的ID写错了,实在不好意思
我的Blog没你的好,不属于任何类,很杂的
=我做到你那种程度了,在告知你,如何?
DMman?
--  作者:chris
--  发布时间:6/1/2007 5:40:00 PM

--  
btw,我的Blog才开张一个星期
上面几乎没什么东西
--  作者:DMman
--  发布时间:6/2/2007 9:56:00 PM

--  
:-)希望以后能与chris兄台多多交流!
--  作者:ippocket
--  发布时间:6/9/2007 9:03:00 PM

--  
我的论文选题想搞web挖掘,研究下lucene。
--  作者:bigc
--  发布时间:6/11/2007 4:14:00 PM

--  
不是把数据挖掘需要熟悉数据库么?

不明白,数据挖掘不是基于数据实例,然后采用一定的算法或者数学统计软件,
来得到一定的规则么?


--  作者:DMman
--  发布时间:6/11/2007 6:23:00 PM

--  
以下是引用bigc在2007-6-11 16:14:00的发言:
不是把数据挖掘需要熟悉数据库么?

不明白,数据挖掘不是基于数据实例,然后采用一定的算法或者数学统计软件,
来得到一定的规则么?



数据挖掘确是基于数据实例,但数据实例的主要来源还是数据库。
而且,有远见的公司都会搭建 数据仓库 来专门保存数据 用于数据挖掘。
--  作者:hongjuesir
--  发布时间:6/12/2007 6:26:00 AM

--  
说到开博,cnblogs上的文章,让我无地自容。

我个人很想拿着某个数据库的源码看看,mysql的源码一直就没找到过。


--  作者:yegouwang
--  发布时间:6/16/2007 2:01:00 PM

--  
我太阳哦,要求太高了吧!!!
--  作者:vipsupply
--  发布时间:6/18/2007 1:58:00 PM

--  
难度太高了吧。。
--  作者:lrrr
--  发布时间:7/5/2007 9:23:00 AM

--  
这要求...
--  作者:lovezhou_2006
--  发布时间:7/7/2007 9:49:00 AM

--  高要求
要求太高了!!
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
93.750ms