概率论与数理统计推荐DavidFreedman版业务建模与数据挖掘入门数据挖掘SAS编程与数据挖掘业务案例克莱曼婷数据挖掘方法与应用Excel2007VBA参考书IBM PS statistics 19 StatisticalprocessCompanion等(2)。数据挖掘工程师需要了解主流机器学习算法的原理和应用。

数据分析师与数据挖掘工程师,有什么区别

数据分析师与数据挖掘工程师,有什么区别

我上一份工作是数据分析师,现在的工作是数据挖掘工程师,因此我可以以我自己的实际经验来回答这个问题。数据分析师和数据挖掘工程师,同属于数据领域的洞察者,但是两者的工作内容却有着不小的区别。对于一个数据分析师来说,最重要的并不是编程技能,而是逻辑分析能力业务理解能力报告展示能力等。数据分析师数据分析师使用的主要工具可以是编程,但并非必要因为现在已经存在大量的强大易用的数据分析工具,比如ExcelTableauSPSSSAS等,即使你没有编程能力,仍然能胜任绝大多数的数据分析工作但是相对于数据挖掘工程师,你还额外需要一些能力,比如数据可视化的能力写数据报告的能力在领导甚至许多人面前做报告讲演的能力等同时,由于现在互联网公司都在讲大数据,数据的存储基本上在各种大数据平台和数据库中,因此你有必要掌握HiveHDFSMySQL等的使用,SQL的熟练掌握是不可避免的。

数据分析师一般有两种,一种是面向业务的,主要对各业务线产品经理运营各部门领导的需求提供支持,帮助他们分析业务了解业务,发掘出业务中的问题并提供解决方案另一种是偏宏观的分析,一般没有需求方,主要是自发地进行探索,主动找到公司业务中存在的问题,弄清公司发展的趋势,对于公司发展的方向做出指引。数据挖掘工程师虽然说不会编程也不至于完全无法做数据挖掘工作,但是好的编程技能却会成为你工作中的得力助手很多时候,数据挖掘工程师会为数据分析师提供一些支持性的工作,比如为他们搭建数据库清洗数据建立报表平台等有些时候数据分析师也会直接向数据挖掘工程师提出需求,有些数据的存储方式格式超出了数据分析师的技能覆盖范围,这时就需要数据挖掘工程师帮他们做一些前期工作另外呢,数据挖掘工程师往往还需要做一些机器学习方面的工作,因此就需要对各种机器学习算法的理论及代码实践有足够的认识。

数据挖掘工程师之中,也分很多不同的类型,比如做特征工程的数据仓库的数据平台支持的算法工程师数据科学家等,他们的工作职责各有不同,职业技能也各有侧重。对于大多数数据挖掘工程师来说,编程技能是必不可少的,但是针对不同挖掘工程师的性质,需要掌握不同的编程技能。一般来说,PythonJavaScala是常用的大数据挖掘语言,有一些数据科学家喜欢用R最常用的大数据平台是Hadoop平台和Spark平台,常用的结构化数据库是MySQL或其他关系型数据库,非结构化数据库中MongoDB较为常用。

对于数据挖掘工程师来说,必要的Linux知识也必不可少。因为数据挖掘工程师绝大多数的工作都是在远程的服务器上完成的,不能流畅地在命令行中操作各种Linux系统(常用的有CentOSUbuntu等),工作的效率会大大降低。另外Shell在数据处理上也很强大,sed awk简直是数据处理的神器。以上并不是非常系统的对比,但是是我在工作中最实际的体验,我并非码农出身,这个转型过程中遇到了很多挑战,但是他们之间并没有天堑一样的区别,很多地方是共通的,如果你编程基础较差,那么可以从数据分析师入手,之后在考虑转型数据挖掘如果编程基础较好,可以考虑数据挖掘,但是数据挖掘工程师一般情况下不会接触太多的业务。

从零开始,如何学习数据挖掘?

从零开始,如何学习数据挖掘

这个问题我想了很久。作为一个去过的人,我建议你在看我的回答之前,先了解一下数据挖掘的概念和定义。在学习数据挖掘之前,你要明白,数据挖掘目前在中国并不流行,就像屠龙一样。初始数据准备通常占整个数据挖掘项目工作量的70%左右。数据挖掘本身是统计数据库和机器学习的融合,但并不是什么新技术。数据挖掘技术更适合业务人员学习,比技术人员学习业务效率更高。数据挖掘适用于传统商业智能报表OLAP不支持的领域。


文章TAG:直接数据挖掘有哪些  挖掘  数据  学习  
下一篇