返回

软间隔线性支持向量机的本质---优化目标

人工智能

从上一次我们讲到支持向量机,我们主要讨论了线性可分支持向量机,那这篇我们就接着上文的内容,聊一聊线性支持向量机,即软间隔支持向量机 的本质是什么。

起源

在很多实际问题中,线性可分支持向量机往往很难使用,这是因为实际数据常常是噪声很大的,也就是说,数据点不可避免地存在一定的离散性。对于线性可分支持向量机来说,一个点被错误分类,整个分类平面就需要发生改变。

为了解决这个问题,就提出了软间隔支持向量机,它允许一些点可以不满足约束,即允许一些点可以被错误分类。这样一来,分类面就不会对单个点过于敏感,提高了泛化能力。

数学形式

我们先来看看软间隔支持向量机的数学形式:

\min\limits_{w,b,\xi} \frac{1}{2} \| w \|^2 + C\sum\limits_{i=1}^m \xi_i

其中:

  • w 为权重向量
  • b 为偏置项
  • \xi_i 为松弛变量
  • C 为惩罚参数

约束条件:

y_i (w^Tx_i + b) \ge 1 - \xi_i, \quad \xi_i \ge 0, \quad i=1,2,\dots,m
  • y_i 为第 i 个样本的标签
  • x_i 为第 i 个样本的特征

与线性可分支持向量机相比,软间隔支持向量机多了两个部分:松弛变量 \xi_i 和惩罚参数 C

本质

我们从优化目标和约束条件来理解软间隔支持向量机的本质:

  • 优化目标: 第一项是正则化项,目的是防止过拟合;第二项是松弛项,目的是允许一些点可以被错误分类。惩罚参数 C 控制了这两项之间的权衡。
  • 约束条件: 约束条件保证了大多数点都被正确分类,并且错误分类的点尽可能少。

因此,软间隔支持向量机的本质就是在正则化和松弛之间进行权衡,以找到一个既能防止过拟合,又能正确分类大多数点的分类面

通俗理解

我们可以用一个通俗的比喻来理解软间隔支持向量机:

假设我们在玩飞镖游戏,目标是尽可能多地命中靶心。线性可分支持向量机就像是一个非常严格的裁判,不允许任何飞镖射偏。而软间隔支持向量机就像是一个比较宽容的裁判,允许一些飞镖射偏,但前提是不能太多。

惩罚参数 C 就相当于裁判的宽容程度,它控制了允许射偏的飞镖数量。如果 C 很大,那么裁判非常严格,只允许很少的飞镖射偏;如果 C 很小,那么裁判比较宽容,允许更多的飞镖射偏。

通过调整 C 的值,我们可以找到一个合适的宽容度,既能保证大部分飞镖命中靶心,又能避免过分惩罚射偏的飞镖。

结语

软间隔支持向量机是支持向量机的重要拓展,它允许数据点存在一定的离散性,从而提高了分类器的泛化能力。通过理解软间隔支持向量机的数学形式和本质,我们可以更好地使用它来解决实际问题。