入门机器学习该如何入手?

作为一名科技工作者,同时也是一名计算机专业的教育工作者,我来回答一下这个问题。首先,当前学习机器学习是不错的选择,机器学习作为人工智能领域的六大研究方向之一,目前的热度也相对比较高,而且由于机器学习与人工智能领域的其他研究方向也有比较紧密的联系,所以通常也把学习机器学习作为入门人工智能的第一步。机器学习本身涉及到六个大的环节,分别是数据收集、算法设计、算法实现、算法训练、算法验证和算法应用,所以学习机器学习可以从数据收集开始学起,然后逐渐向其他环节过渡。

在当前的大数据时代,数据收集和整理的方式也越来越多,获取数据的途径也比较多,可以从基本的数据库技术开始学起。实际上,机器学习作为大数据分析的两种常见方式,大数据领域的从业者往往也需要重点掌握机器学习技术。算法设计是机器学习的核心,所以算法知识的学习是机器学习的重点,学习算法知识可以从基本的常见算法开始,比如决策树、朴素贝叶斯、支持向量机等算法都需要重点学习一下,在学习算法的过程中,一定要结合具体的案例进行学习。

在实现算法时可以采用Python语言,目前Python在机器学习领域的应用也比较普遍。最后,对于目前IT行业的开发人员来说,学习机器学习知识,可以重点结合一下大数据、人工智能平台所提供的开发环境,这样会有一个更好的学习体验,同时也会在一定程度上加强自身的实践能力,毕竟未来大量的机器学习开发都离不开平台的支撑。

如何更高效的自学机器学习?

机器学习其实是一个特别大的范畴,高效自学机器学习有两个方面的关键要素:首先要对机器学习有一个宏观的认识,知道哪些是领域是热门且重点领域,做到抓住重点,有的放矢;其次,你需要在熟练掌握一门语言工具的前提下结合具体项目实践,增加自己的实践经验,这个地方我给python打一个广告。下面说一些具体的东西,可能会对你有所帮助。

1: 机器学习可以解决哪些问题?主要分为两类问题:分类问题和回归问题,其中分类问题又可以分为多分类问题和多标签多分类问题。其他还有很多进阶版本的问题,一般由多个问题复合而成,比如物体检测,实际是把图像分割和分类问题整合到了一起;2: 机器学习算法有哪些?我们大体可以将机器学习的算法分为传统机器学习和深度学习算法。

传统机器学习算法中,常见的有SVM,决策树,随机森林等,大都在sklearn中进行了集成,可以非常方便的调用。深度学习算法主要依赖学习框架,主流的包含Tensorflow和PyTorch,各有优缺点,请自行了解做进一步选择。其次就是深度学习的网络结构又可以分为卷积神经网络,递归神经网络,自动编码器,对抗生成网络,图卷积神经网络等。

目前深度学习在各个领域都取得了巨大的性能提升,是机器学习中的重点领域,另外图卷积也逐渐成为重中之重;3: 常见的机器学习的流程是什么样的?一个不失一般性的流程由这么几部分构成:数据集整理,数据集预处理,数据集划分(训练集,测试集,验证集,常见比例7:1:2),模型训练,模型验证,模型测试。4: 怎么评价模型性能好坏?常见指标有哪些?我们通常使用验证集的数据测试并选择最终的模型,然后用测试数据集来测试我们模型的性能。

得到最终模型后,我们可以使用更大的独立测试数据集来进一步评估模型的性能。评估模型性能,我们就需要使用具体的性能指标。根据数据集中不同类别样本的比例,我们将数据集分为均衡数据集和非均衡数据集。均衡数据集我们可以使用准确率、损失值、马修斯系数、F1-score、ROC 曲线以及 AUC 值等指标,这类数据集的评估相对容易。

对于非均衡数据集,我们需要谨慎的使用准确率来衡量模型性能,结合具体问题,我们一般更多的使用F1-score和ROC-AUC等指标。5: 关于公共数据集。现在网上有很多公开的且标注完备的数据集,包括图像的、序列的、文本的等等,为机器学习提供了良好的学习环境。练手阶段需要充分利用这些资源!此外,机器学习不是万能的,很多情况下性能取决于数据和问题定义,不是每一个问题都能用机器学习解决。

重庆大学机械工程在读硕士,想转去学机器学习,应该怎么规划自己的学习?

谢谢邀请!要想从机械工程转向机器学习是可以的,但是存在一定的难度,需要一个系统的学习规划。通常情况下机械工程专业的学生往往都有一个扎实的数学基础,数学基础(包括高数、线性代数、概率论、离散数学)是学习机器学习方向的前提,但是机器学习作为人工智能领域的主要研究内容之一,还需要掌握算法设计、算法实现、计算机基础等内容,关键是如何建立机器学习的研发思路,这个往往是自学者最大的瓶颈之一。

要想入门机器学习需要遵循以下的学习路线:第一:了解机器学习的概念。在学习机器学习之前首先要知道机器学习要解决什么问题,简单的说机器学习就是从一堆杂乱无章的数据中找到背后的规律(Machine Learning in Action),这个定义感觉和数据分析有异曲同工之处,所以在大数据领域里采用机器学习的方式进行数据分析也是一个比较常见的做法。

第二:了解机器学习的步骤。机器学习的步骤包括数据收集、数据整理、算法设计、算法实现、算法验证、算法应用,通过这个步骤可以发现,数据是机器学习的前提,算法是机器学习的核心。要想实现这个步骤需要做三件事,第一件事情是找数据,第二件事情是学习算法,第三件事情是学习编程语言。目前网络上有不少数据集是可以使用的,从学习的角度来说是可以满足要求的,当然也可以编写爬虫获取一些数据,算法的学习是重点,需要掌握一些常见的机器学习算法,包括决策树、朴素贝叶斯、支持向量机、k-mean、kNN、Apriori等算法,最后需要掌握一门编程语言来实现这些算法,Python是一个不错的选择,看两个Python实现算法的小实验:第三:建立机器学习的思路。

机器学习的思路建立是一个漫长的过程,只有掌握了大量的基础知识之后,才能建立起解决问题的思路。把实际问题抽象成算法,然后通过算法建立起动态模型,再通过动态模型解决类似的问题是一个基本的机器学习思路。看一个算法的描述过程:深度学习是机器学习领域一个重要的突破,需要重点关注一下。机器学习方向的研究生通常情况下在研二的时候会进驻课题组,然后在老师的指导下进行课题研发,这个过程会让学生建立起一个比较系统的知识结构,重点就是如何建立机器学习的解决思路和实现方法。


文章TAG:如何自学机器学习  机器学习怎么学  如何  自学  机器  
下一篇