HMM 还用于语音识别,根据前面的音节序列帮助预测下一个音节。序列建模在物流应用中也很常见,例如包裹递送时间表。同样,传染病的传播和传播通常使用马尔可夫链进行建模。
何时使用判别模型
从数学上讲,判别模型用于仅条件概率相关但联合概率不相关的应用。因此,
一些例子是:
1.有监督分类问题
监督分类问题,其中类别(类别)是预先已知的。这是 KNN 和 SVM 的典型用例。
您拥有广泛的数据点集合,例如客户行为数据,包括消费模式、购买金额、购买频率、退货历史记录等。您必须使用此信息将您的客户列表分为不同的类别,例如高消费者、讨价还价者、老客户、非认真客户等。这与无监督分类问题形成鲜明对比,如前所述,无监督分类问题经常使用 GMM。
2. 预测任务
在分类和回归等预测任务中,优先考虑的通常是速度和准确性。原 BC 数据泰国 则上,生成模型也能够解决这些问题。
特别是,当存在数据点缺失、只有有限的数据集可用于训练或您希望定期添加新类别等问题时,首选生成模型。
然而,对于大多数标准用例,生成模型在预测任务中会遇到较高的错误率和较慢的推理,因为它们的计算涉及联合概率分布。因此,对于标准分类和回归问题,如果有大量且健康的数据集可用于训练,则判别模型由于其更好的性能特征而成为首选。
对于仅关注分类结果而不关注底层数据建模的任务,判别模型更可取。
例如,如果您想将录音分类为各自的语言,则不需要理解语言和语法的模型。语音识别模型对于分类问题来说有点过分了。只需使用判别模型关注决策边界即可。因此,您可以使用简单的神经网络代替法学硕士,或使用逻辑回归代替贝叶斯模型。
4. 分步决策
多步骤决策(其中各个步骤涉及明确的选择)是决策树的良好候选者。决策树通常用作初步过滤器来预先选择需要进一步分析的数据点。
例如,考虑欺诈检测,这通常是使用 GMM 等复杂模型来解决的。无论使用何种模型,人类几乎总是会调查高风险交易。因此,另一种方法是使用决策树来标记潜在欺诈交易的列表,以便以后进行手动调查。
决策树也用于许多业务运营中。目标是根据预定条件决定正确的行动方案。这些任务不需要生成模型或更复杂的判别模型,例如神经网络。
该图显示了生成模型与判别模型的应用示例
生成模型与判别模型的应用示例。使用napkin.ai创建
结论
本文解释了生成模型和判别模型(机器学习技术的两种主要方法)之间的基本原理和主要区别。
虽然大多数机器学习基于概率方法,但生成模型基于联合概率分布,而判别模型仅使用条件概率。因此,这两类模型具有不同的应用和性能特征。考虑到各种模型的可用性,为工作选择正确的工具变得至关重要。
除了对模型类型及其差异的概念性理解之外,最重要的是您自己构建模型。它从讨论监