Lubrication,icml

如何学习人工智能？

人工智能是通过学习人类的数据，从中找出规律，然后代替人类在各个领域工作。如果你想知道人工智能是如何从人类的数据中学习的，可以先从机器学习的算法入手，这些算法有趣且不难理解，是很好的激发学习兴趣的着手点。机器学习的算法有比如：非监督式学习中的K-Means算法，DBSCAN，t-SNE等等，主要不是用来预测，而是对整个数据有一定的深入了解。

监督式学习中常见的有：回归算法：试图采用对误差的衡量来探索变量之间的关系的一类算法，常见的种类有最小二乘法，逻辑回归，逐步式回归，多元自适应回归样条，以及本地散点平滑估计。决策树学习：根据数据的属性采用树状结构建立决策模型，通常用来解决分类的问题。常见种类有：分类及回归树，随机森林，多元自适应回归样条，以及梯度推进机。

（虽然名字长但是内容不难理解）深度学习算法在近期赢得了很多关注，特别是百度也开始发力深度学习后，更是在国内引起了很多关注。在计算能力变得日益廉价的今天，深度学习试图建立大得多也复杂得多的神经网络。很多深度学习的算法是半监督式学习算法，用来处理存在少量未标识数据的大数据集。常见的深度学习算法包括：卷积网络，堆栈式自动编码器。

（同样是名字长但是内容不难理解）了解过一些算法后，就可以简单的跑一些数据来做自己的预测了！这时需要学习一下编程语言Python，具体的指令非常简单，几乎一行代码就能训练好预测模型，然后做出自己的预测结果了！具体资源有很多教机器学习的书籍和视频，B站和西瓜视频都有很多人在科普。如果想自己做一些预测项目自娱自乐一下，也可以去Kaggle这个网站，有很多有趣的项目，网站提供数据，自己做模型做预测然后提交，比照精确度，满满的成就感。

深度学习在哪里可以学习？

余秋雨先生说，在闲暇时，不管你在码头、在田间、地头，当你静静的读一本书的时候，你的格调将从此不同！首先，深度学习要来自于你生命深度的自觉！你自觉想学，什么地点，什么时候都不是问题，毛主席在喧闹街市，依然可以旁若无人的学习；渴望考研成功的人，在昏暗的宿舍楼楼梯拐角处，依然可以学习！其次，深度的学习，来自你生命深处浓厚的兴趣！大家可能看见过报道，农民工爬在地上，依然在心无旁骛的临摹着王義之、兰亭序，只要是你的生命深处的兴趣，在哪里都可以学习！第三，现在公园，图书馆，博物馆，朗诵者协会，会馆，都是不错的深度学习的地方！第四，即使没这些条件，拿起手机，打开今日头条，搜索你想学习的内容和教程，一切都会找到，也可以静静的躺在床上学习几小时了！[捂脸]。

从零开始，如何学习数据挖掘？

这个问题思考了很久，作为过来人谈一谈，建议在看我这篇回答之前先去了解一下数据挖掘的概念和定义。在学习数据挖掘之前你应该明白几点：数据挖掘目前在中国的尚未流行开，犹如屠龙之技。数据初期的准备通常占整个数据挖掘项目工作量的70%左右。数据挖掘本身融合了统计学、数据库和机器学习等学科，并不是新的技术。数据挖掘技术更适合业务人员学习（相比技术人员学习业务来的更高效）数据挖掘适用于传统的BI（报表、OLAP等）无法支持的领域。

数据挖掘项目通常需要重复一些毫无技术含量的工作。如果你阅读了以上内容觉得可以接受，那么继续往下看。学习一门技术要和行业靠拢，没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的（十年前做网页设计都能成立公司），一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了，一方面有利于抓住用户痛点和刚性需求，另一方面能够累计行业经验，使用互联网思维跨界让你更容易取得成功。

不要在学习技术时想要面面俱到，这样会失去你的核心竞争力。一、目前国内的数据挖掘人员工作领域大致可分为三类。1）数据分析师：在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询，商务智能，出分析报告。2）数据挖掘工程师：在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。3）科学研究方向：在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。

二、说说各工作领域需要掌握的技能。(1).数据分析师需要有深厚的数理统计基础，但是对程序开发能力不做要求。需要熟练使用主流的数据挖掘（或统计分析）工具如SAS）、SPSS、EXCEL、BI工具等。需要对与所在行业有关的一切核心数据有深入的理解，以及一定的数据敏感性培养。经典图书推荐：《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用》、《Excel 2007 VBA参考大全》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等(2).数据挖掘工程师需要理解主流机器学习算法的原理和应用。

需要熟悉至少一门编程语言如（Python、C、C 、Java、Delphi等）。需要理解数据库原理，能够熟练操作至少一种数据库（Mysql、SQL、DB2、Oracle等），能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。经典图书推荐：《数据挖掘概念与技术》、《机器学习实战》、《人工智能及其应用》、《数据库系统概论》、《算法导论》、《Web数据挖掘》、《 Python标准库》、《thinking in Java》、《Thinking in C 》、《数据结构》等。

(3).科学研究方向需要深入学习数据挖掘的理论基础，包括关联规则挖掘（Apriori和FPTree）、分类算法（C4.5、KNN、Logistic Regression、SVM等) 、聚类算法（Kmeans、Spectral Clustering）。目标可以先吃透数据挖掘10大算法各自的使用情况和优缺点。

相对SAS、SPSS来说R语言更适合科研人员The R Project for Statistical Computing，因为R软件是完全免费的，而且开放的社区环境提供多种附加工具包支持，更适合进行统计计算分析研究。虽然目前在国内流行度不高，但是强烈推荐。可以尝试改进一些主流算法使其更加快速高效，例如实现Hadoop平台下的SVM云算法调用平台--web 工程调用hadoop集群。

需要广而深的阅读世界著名会议论文跟踪热点技术。如KDD，ICML，IJCAI，Association for the Advancement of Artificial Intelligence，ICDM 等等；还有数据挖掘相关领域期刊：ACM Transactions on Knowledge Discovery from Data，IEEE Transactions on Knowledge and Data Engineering，Journal of Machine Learning Research Homepage，IEEE Xplore: Pattern Analysis and Machine Intelligence, IEEE Transactions on等。

可以尝试参加数据挖掘比赛培养全方面解决实际问题的能力。如Sig KDD ，Kaggle: Go from Big Data to Big Analytics等。可以尝试为一些开源项目贡献自己的代码，比如Apache Mahout: Scalable machine learning and data mining ,myrrix等（具体可以在SourceForge或GitHub.上发现更多好玩的项目）。

经典图书推荐：《机器学习》《模式分类》《统计学习理论的本质》《统计学习方法》《数据挖掘实用机器学习技术》《R语言实践》，英文素质是科研人才必备的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等。

三、以下是个人对数据挖掘岗位的感受真正从数据挖掘项目实践的角度讲，沟通能力对挖掘的兴趣爱好是最重要的，有了爱好才可以愿意钻研，有了不错的沟通能力，才可以正确理解业务问题，才能正确把业务问题转化成挖掘问题，才可以在相关不同专业人才之间清楚表达你的意图和想法，取得他们的理解和支持。所以我认为沟通能力和兴趣爱好是个人的数据挖掘的核心竞争力，是很难学到的；而其他的相关专业知识谁都可以学，算不上个人发展的核心竞争力。

说到这里可能很多数据仓库专家、程序员、统计师等等都要扔砖头了，对不起，我没有别的意思，你们的专业对于数据挖掘都很重要，大家本来就是一个整体的，但是作为单独一个个体的人来说，精力有限，时间有限，不可能这些领域都能掌握，在这种情况下，选择最重要的核心，我想应该是数据挖掘技能和相关业务能力吧（从另外的一个极端的例子，我们可以看，比如一个迷你型的挖掘项目，一个懂得市场营销和数据挖掘技能的人应该可以胜任。

这其中他虽然不懂数据仓库，但是简单的Excel就足以胜任高达6万个样本的数据处理；他虽然不懂专业的展示展现技能，但是只要他自己看的懂就行了，这就无需什么展示展现；前面说过，统计技能是应该掌握的，这对个人的迷你项目很重要；他虽然不懂编程，但是专业挖掘工具和挖掘技能足够让他操练的；这样在迷你项目中，一个懂得挖掘技能和市场营销业务能力的人就可以圆满完成了，甚至在一个数据源中根据业务需求可以无穷无尽的挖掘不同的项目思路，试问就是这个迷你项目，单纯的一个数据仓库专家、单纯的一个程序员、单纯的一个展示展现技师、甚至单纯的一个挖掘技术专家，都是无法胜任的）。

这从另一个方面也说明了为什么沟通能力的重要，这些个完全不同的专业领域，想要有效有机地整合在一起进行数据挖掘项目实践，你说没有好的沟通能力行吗？数据挖掘能力只能在项目实践的熔炉中提升、升华，所以跟着项目学挖掘是最有效的捷径。国外学习挖掘的人都是一开始跟着老板做项目，刚开始不懂不要紧，越不懂越知道应该学什么，才能学得越快越有效果。

我不知道国内的数据挖掘学生是怎样学的，但是从网上的一些论坛看，很多都是纸上谈兵，这样很浪费时间，很没有效率。另外现在国内关于数据挖掘的概念都很混乱，很多BI只是局限在报表的展示和简单的统计分析，却也号称是数据挖掘；另一方面，国内真正规模化实施数据挖掘的行业是屈指可数（银行、保险公司、移动通讯），其他行业的应用就只能算是小规模的，比如很多大学都有些相关的挖掘课题、挖掘项目，但都比较分散，而且都是处于摸索阶段，但是我相信数据挖掘在中国一定是好的前景，因为这是历史发展的必然。

深度学习主要是学习什么方向的？

深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构，通过组合低层特征形成更加抽象的高层属性或类别特征，从而对数据进行表征。简单来说机器学习是实现人工智能的方法，深度学习是实现机器学习的技术，主要是人工智能方向的学习，最近中公教育在出这个课程学习，他们课程和中科院自动化研究所合作的，这个也是中公老师给我朋友说的，我正好跟我朋友在一起也有所了解，你要是有这方面的兴趣可以去中公教育IT的官网了解，我朋友之前在哪里学的，他们教学质量还是可以保障的。

有哪些权威的人工智能机器人大会和AI机器人论坛？

以下是转自南大周志华教授的博客上世界顶级人工智能会议总结IJCAI (1 )AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI 实在太大, 所以虽然每届基本上能录100多篇（现在已经到200多篇了），但分到每个领域就没几篇了，像machine learning、computer vision这么大的领域每次大概也就10篇左右, 所以难度很大. 不过从录用率上来看倒不太低,基本上20%左右, 因为内行人都会掂掂分量, 没希望的就别浪费reviewer的时间了. 最近中国大陆投往国际会议的文章象潮水一样, 而且因为国内很少有能自己把关的研究组, 所以很多会议都在complain说中国的低质量文章严重妨碍了PC的工作效率. 在这种情况下, 估计这几年国际会议的录用率都会降下去. 另外, 以前的IJCAI是没有poster的, 03年开始, 为了减少被误杀的好人, 增加了2页纸的poster.值得一提的是, IJCAI是由貌似一个公司的”IJCAI Inc.”主办的(当然实际上并不是公司, 实际上是个基金会), 每次会议上要发几个奖, 其中最重要的两个是IJCAI Research Excellence Award和Computer

文章TAG：Lubrication icml

大家都在看

相关文章推荐