判别式模型和生成式模型

对不同的监督学习的模型来说，它们的最终目标总是在给定测试样例的情况下，预测出其最有可能的类别，也就是说优化目标总是。但是，求解这个的过程却有着各种各样不同的方法，但是总体来来说，根据求解方法的不同，可以将这些模型分成两种类别。

判别式模型

其中一种是直接学习得到，更加准确来说，是直接学习得到,其中是模型的参数,这种方法被称为是判别式模型(Discriminant Model)。属于这种方法的模型有之前的讲过的:

对于判别式模型来说，就是要从训练数据中学习得到中的，从而在预测时候，能够直接根据计算出。

与其相对应的另外一种方法是，利用贝叶斯法则:

将进行如下的代换:

注意，上述第二个等式之所以成立，是因为在给定测试数据的情况下，是一个常量，可以不用考虑。因此，模型的求解目标就变成了和而不是原来的，这样的方法被称为生成式模型(Generative Model)。属于这种模型的有之前讲过的:

本文的后半部分还会介绍另外一种生成式模型:高斯判别分析模型¹。

其实，可以看到，这两种分类仅仅是计算的"路径"不同而已，"终点"却是相同的，都是要计算。

举例²来说，假设我们要判别一个动物是大象()还是狗()，对于判别式模型来说，它会考虑这个动物所有的特征，从中学习特征之间模式()，从而判定它是大象()还是狗()。

而对于生成式模型来说，它会考察训练数据中所有的大象，学习得到一个模型(和)，然后接着考察训练数据中所有的狗，学习得到一个模型(和)。在需要预测时，将待预测的动物分别用这两种模型进行判断，然后选择可能性大的最为最终的预测类别。

高斯判别分析模型是假设服从多变量高斯分布的，因此我们首先需要看一下多变量的高斯分布。

多变量高斯分布的密度函数是:

如果，则:

高斯判别分析模型假设服从多变量高斯分布,而本身是服从贝努力分布的，所以我们有:

将其展开就是:

其中，模型的参数是,对应的对数似然函数可以写成:

通过极大化这个似然函数，我们能够求得这个极大似然估计的参数是:

上面的公式中，其实和分别是反例的平均值和正例的平均值。

在计算出上述的这些参数之后，我们就能够求解了，只需要分别计算和，取二者中较大的类别作为预测类别。

Flyaway is the owner of this blog.