当然,在更多应用领域(如医疗、金融、军事等),机器学习算法,尤其是深度学习模型并不能满足我们需要清晰且易于理解的决策。本文着重讨论传统数学建模和机器学习建模的优缺点,并介绍一个将两者相结合的方法 —— 解耦表示学习 (Disentangled Representation Learning)。如果想在自己的数据集上尝试使用解耦表示学习的方法,可以参考 Github 上关于解耦学习的分享,以及 Google Research 提供的关于解耦学习的项目代码。

1. 深度学习存在的问题由于深度学习技术的发展,我们在许多领域都对神经网络的应用进行了尝试。在一些重要的领域,使用神经网络确实是合理的,并且获得了较好的应用效果,包括计算机视觉、自然语言处理、语音分析和信号处理等。在上述应用中,深度学习方法都是利用使用线性和非线性转换对复杂的数据进行自动特征抽取,并将特征表示为“向量”(vector),这一过程一般也称为“嵌入”(embedding)。

之后,神经网络对这些向量进行运算,并完成相应的分类或回归任务:从特征提取和准确度来看,这种 “嵌入”的方法非常有效,但在许多方面也存在不足:可解释性:嵌入所使用的N维向量无法对模型分析的原理和过程进行很好的解释,只有通过逆向工程才能找到输入数据中对分析影响更大的内容。数据需求量庞大:如果只有 10~100 个样本,深度学习无法使用。

无监督学习:大多数深度学习模型都需要有标签的训练数据。零样本学习:这是一个很关键的问题,基于一个数据集所训练出的神经网络,若不经过重新训练,很难直接应用在另一个数据集上。对象生成:除了 GANs(生成对抗网络)以外,其他模型都很难生成一个真实的对象。对象操作:难以通过嵌入调整输入对象的具体属性。理论基础:虽然我们已经掌握了比较通用的逼近理论,但这还不够。

这些问题很难用机器学习框架来解决,但在最近,我们取得了一些新的进展。2. 数学建模的优势在 20 年、50 年 甚至 100 年以前,大多数数学家都没有遇到过上述问题。其中原因在于,他们主要关注数学建模(mathematical modeling),并通过数学抽象来描述现实世界中的对象和过程,如使用分布、公式和各种各样的方程式。

在这个过程中,数学家定义了我们在标题中提到的常微分方程(ordinary differential equations, ODE)。我们通过对比深度学习存在的问题,对数学建模的特点进行了分析。需要注意的是,在下面的分析中,“嵌入”代表数学模型的参数,如微分方程的自由度集合。可解释性:每个数学模型都是基于科学家对客观事物的描述而建立的,建模过程包含数据家对客观事物的描述动机和深入理解。

 5/11   首页 上一页 3 4 5 6 7 8 下一页 尾页

文章TAG:模型  机器  学习  评估  指标  11个机器学习的模型评估指标  机器学习的模型有哪些  
下一篇