支持向量机(SVM)是一种有监督的非参数统计学习技术,被广泛应用于遥感影像分类,但参数设置(如惩罚函数和核参数)对SVM分类精度的影响很大。群智能算法具有并行处理能力强、寻优速度快、全局寻优能力强等特点,在支持向量机参数优化中得到了广泛的应用。然而,很少有研究在支持向量机上对不同的GI算法进行优化性能比较,特别是在高光谱遥感分类方面。
地表过程与资源生态国家重点实验室朱秀芳副教授等基于三幅免费获取的高光谱影像(图1,the University of Pavia image, Indian Pines image, and Salinas image,下载网址为ftp://ftp.ecn.purdue.edu/biehl/MultiSpec/),从参数设置的稳定性、收敛速度、特征选择能力、样本容量以及分类的准确性五个方面比较了三种不同的群体智能算法:粒子群优化(Particle swarm optimization,PSO)算法、遗传算法(Genetic Algorithm, GA)和人工蜂群(Artificial Bee Colony,ABC)算法,对支持向量机的优化性能。具体做法(图1)是分别从三幅高光谱影像对应的整个地面真实调查数据集中抽取出5%、10%、15%、20%和25%的像素作为训练样本,设置SVM的惩罚参数C取值范围为[1,150],核参数σ取值范围为[0.1,1000],波段选择的概率P为[0,1],利用PSO,G A和ABC三种优化算法对参数C、σ和P进行优化,利用优化后的参数指导SVM进行分类。记录优化后的参数C和σ的数值、参与分类的高光谱影像的波段个数(NB)、算法迭代的次数(NI),根据地面真值数据计算的分类的总体精度(OA),并计算OA的平均值、中值和标准差,最后利用方差分析比较ABC-SVM、GA-SVM和PSO-SVM的C、σ、NI、NB和OA的差异性。
研究结果:
1)三种优化算法对支持向量机C参数优化的影响小于对σ参数的影响。三种GI算法的收敛速度、选择出的特征波段个数和分类的精度在p=0.01水平上有显著性差异。遗传算法具有最强的特征选择能力,能够压缩70%以上的原始数据。此外,GA-SVM对三幅图像的总体分类精度最高(91.77%),其次是ABC-SVM(88.73%)和PSO-SVM(86.65%)。
2)样本量对三种优化算法的优化结果有显著影响,样本量越大,平均分类精度越高。对于小样本(例如 5%),三种分类方法在简单研究区域(Pavia大学和Salinas图像)的精度是相当的,在复杂研究区(Indian Pines图像)精度差异大。样本大小对ABC-SVM优化算法的精度影响最大,其次是PSO-SVM和GA-SVM。
3)数据维数、研究区域的复杂度和样本大小都影响了三种优化算法的优化性能。与ABC和PSO算法相比,GA算法在特征选择、小样本分类和分类精度等方面都具有更大的优势。
该研究为选择最优支持向量机参数优化方法提供了参考。
图1 三幅高光谱影像(Pavia University (a–c), Indian Pines (d–f) and Salinas (g–i))的分类结果
图2 三种优化算法的性能比较
(供稿人:刘莹)