PatternRecognition-4-Fisher线性判别(LDA)
模式识别 U4 Fisher线性判别
Fisher Discriminant
- 4.1 Fisher线性判别动机
- 4.2 Fisher线性判别分析
- 4.3 Fisher线性判别算法
课程内容
Fisher线性判别 动机



Fisher判别的核心思想是:在两个类别之间找到最好的区分,进行特征降维



Fisher判别 目的

Fisher线性判别 分析
线性回归目的:找到误差最小的拟合模型
二分类问题的Fisher线性判别:学习最佳投影,它能将所有样本投影到w的方向

目标函数

代数推演过程
目标函数 \[ \begin{align*} J(\mathbf w)&=\frac{类间差异}{类内差异}\\ \mathbf{w}^* &= \arg \mathop{\max}\limits_{\mathbf w}J(\mathbf w)\\ \end{align*} \] 在上述二分类问题中,则有 \[ J(\mathbf w)=\frac{(\mathbb E[s|y=1]-\mathbb E[s|y=-1])^2}{var[s|y=1]+var[s|y=-1]} \] 对分子: $$ (E[s|y=1]-)^2\ \[\begin{align*} &=(\mathbb E[\mathbf w^T\mathbf x|y=1]-\mathbb E[\mathbf w^T\mathbf x|y=-1])^2\\ &=\Big(\mathbf w^T(\mathbb E[\mathbf x|y=1]-\mathbb E[\mathbf x|y=-1])\Big)^2\\ \end{align*}\] $$ 根据概率论知识,\(\mathbb E[\mathbf x|y=c]=\frac{1}{N}\sum_{i=1}^{N_c}[x_i|y=c]=\mu_c\)
因而我们可以改写上式: $$ (E[s|y=1]-)^2\ \[\begin{align*} &=\Big(\mathbf w^T(\mathbb E[\mathbf x|y=1]-\mathbb E[\mathbf x|y=-1])\Big)^2\\ &=\Big(\mathbf w^T(\mu_1-\mu_{-1})\Big)^2\\ &=\mathbf w^T(\mu_1-\mu_{-1})(\mu_1-\mu_{-1})^T\mathbf w \end{align*}\] $$ 对分母:
根据协方差计算方法:\(var[s|y=c]=\mathbb E[(s-\mathbb E[s|y=c])^2]\)
则有: \[ \begin{align*} var[s|y=c]&=\mathbb E[(s-\mathbb E[s|y=c])^2]\\ \\ &=\mathbb E[(\mathbf w^T\mathbf x-\mathbb E[\mathbf w^T\mathbf x|y=c])^2]\\ \\ &=\mathbb E[\Big(\mathbf w^T(\mathbf x-\mathbb E[\mathbf x|y=c])\Big)^2]\\ \\ &=\mathbb E[\Big(\mathbf w^T(\mathbf x-\mu_c)\Big)^2]\\ \\ &=\mathbb E[\mathbf w^T(\mathbf x-\mu_c)(\mathbf x-\mu_c)^T \mathbf w]\\ \\ &=\mathbf w^T\mathbb E[(\mathbf x-\mu_c)(\mathbf x-\mu_c)^T]\mathbf w\\ \\ &=\mathbf w^T\mathbb \Sigma_c\mathbf w\\ \end{align*} \] 因此: \[ var[s|y=c]=\mathbf w^T\mathbb \Sigma_c\mathbf w\\ \Sigma_c=\frac{1}{N_C}\sum^{Nc}_{n=1}[(\mathbf x_n-\mu_c)(\mathbf x_n-\mu_c)^T|y=c] \] 综上:


优化问题:线性规划+拉格朗日乘数法
$$ \[\begin{align*} J(\mathbf w)&=\frac{(\mathbb E[s|y=1]-\mathbb E[s|y=-1])^2}{var[s|y=1]+var[s|y=-1]}\\ &=\frac{\mathbf w^TS_{B(between)}\mathbf w}{\mathbf w^TS_{W(within)}\mathbf w}\\ \\ \mathbf{w}^* &= \arg \mathop{\max}\limits_{\mathbf w}J(\mathbf w)\\ \end{align*}\] $$
分式的最优化不好处理,我们利用拉格朗日乘数法将其转化为易处理的形式
我们假定分母一定,此时取得分子的最大值,即可最大化目标函数
用数学语言表示为↓ \[
\arg \max_{\mathbf w}\space\space (\mathbf w^TS_{B}\mathbf w)
\space\space Subject \space to\space\space(\mathbf w^TS_{W}\mathbf w=K)
\] \(Lagrange\space
Multipliers:\) $$ \[\begin{align*}
L(\mathbf w, \lambda)&=\mathbf w^TS_{B}\mathbf w+\lambda(K-\mathbf
w^TS_{W}\mathbf w)\\
&=\mathbf w^T(S_{B}-\lambda S_{W})\mathbf w + \lambda K\\
\\
令:
\nabla L_{\mathbf w}(\mathbf w, \lambda)&=\frac{\partial L(\mathbf
w, \lambda)}{\part \mathbf w}=2(S_{B}-\lambda S_{W})\mathbf w=\mathbf
0^T\\
则:S_{B}\mathbf w&=\lambda S_{W}\mathbf w
\end{align*}\] $$

Fisher线性判别 算法

小结

作业
纸质作业



