前沿研究

基于自适应混沌粒子群和支持向量机的医学图像分类

发布时间:2017-02-15 16:29:11      浏览  次

作者:岳丽娟 , 姜英姿

单位:解放军第四〇四医院 (山东威海 264200)

〔关键词〕支持向量机;特征选择;粒子群优化;混沌序列; 

〔中图分类号〕TP3   〔文献标识码〕A

〔文章编号〕1002-2376(2017)03-0023-04

支持向量机(support vector machine,SVM)从本质上说 是一种适用于小样本的两类学习分类方法,与传统的神经网络相比,具有出色的性能,运用结构风险最小化原则, 折中经验风险和模型复杂度,被广泛应用于解决医学领域 的图像分类问题。 SVM 的分类[1]是建立在对训练数据进行训练而得到的分类模型上的。核函数的选择和参数的设置,能够直接影响到分类器的性能,径向核函数由于对复杂多因子的样本 分类问题有较好的学习能力被广泛应用[2]。在径向核函数的 SVM 中,惩罚因子 C 以及核函数参数 σ 是影响 SVM分类正确率的主要参数,要想得到好的分类效果,这两个参数必 须合理。其中惩罚因子 C 是在特征空间中对学习机的置信范围和经验风险比例进行调节,C值过大导致泛化能力降低,过小分类精度降低,导致分类模型失效;核函数 σ 的值影响特征空间的分离结果,也在一定程度上影响系统的泛化能力,因此选择最佳的 C 和 σ,可以有效地提高 SVM 的分类正确率。

不适合的参数和特征都会导致不好的分类结果。对于具体的分类来说,所有的特征并不都是同等重要的,其中会包含一些冗余的甚至是不相关的特征信息,丢弃这些不重要的特征会使分类效果更佳。另外,降低输入特征的空间维数也可能会降低计算用时,提高速率。由此可见,要获得一个快速精确的 SVM 分类器,需要解决最优特征子集和最优参数的选择问题,而参数的选择会影响特征子集的选择。

过去已有一些学者针对 SVM 的参数估计和特征选择进行了相关研究。遗传算法、粒子群算法 (particle swarm optimization,PSO) 等被广泛应 用于 SVM 的参数优化。 Frohlich和Chapelle[3]采用遗传算法对数据集进行特征选择,所选的特征子集被用于SVM分类器。Zhang和Mao[4]将利用PSO的寻优能力对原始特征进行选择,用于训练SVM分类器。Huang等[5]提出利用遗传算法同步优化特征选择和参数估计的 SVM分类模型,之后,将此模型成功应用于信用 评分。Gao 等[6]提出将遗传算法和 PSO 同时用于特征选择和参数优化,并将该模型应用于高质谱图像分类。以上这些方法都取得了不错的效果,在一定程度上改进了SVM的性能。但是也存在一些问题 , 如对于遗传算法来优化 SVM时需要大量的种群和迭代次数来保证稳定性,这浪费了计算时间。根据目前已有的 SVM优化算法,PSO 与SVM结合 的分类算法比较常见,有研究提出了一种利用量子粒子群 算法进行 SVM 的特征选择和参数优化方法(AQPSO)用于 SVM 的特征和参数优化上,取得了良好的效果[7]。此外,用混沌策略与 PSO 的结合也已有不少尝试,该文在 AQPSO 算法的基础上,将自适应混沌粒子群算法与 SVM 相结合,较好地解决了 SVM 参数设置和特征选择问题,并且加快了 收敛速度。实验证明了该方法的可行性和良好的分类能力。

1  自适应混沌粒子群算法

1.1  粒子群优化算法

PSO是一种基于群体智能的高效并行搜索进化算法。PSO是在 1995年由美国的Kennedy和Eberhart 通过分析模拟鸟群觅食过程共同提出的。PSO的数学模型是:假设优化一个包含D 个变量的连续函数,搜索空间为D维,将第i个粒子的位置表示为 Xi =(Xi1,Xi2,…XiD) T ,粒子速率表示为 Vi =(Vi1,Vi2,…ViD) T 。找到 第 n 次迭代时第 i 个粒子粒子的当前最优解Pidn,整个群体的全局最优解 Pgdn。每次迭代,种群中的粒子的位置和速度可以按照以下公式进行更新:

其中 d=1,2,…,D,i=1,2,…,N(N为粒子数);ω表示惯性权重;c1,c2表示加速系数,分别调节跟踪个体最优和全局最优方向飞行的程度;r1,r2是在 [0,1] 范围内变化的随机数,增加了粒子飞行的随机性。 Vidn表示粒子 i 在第n次迭代中第d维的速度;  Xidn表示粒子 i 在第n次迭代中第d 维的当前位置。

1.2  改进的粒子群优化算法

PSO 存在早熟收敛、易于陷入局部极值、解的精度较低等问题。针对这些不足 , 产生了很多有效的改进方法。Eberhart 和Shi[8]改进了惯性权值,即其随着运行次数的增加而线性递减,随后又了提出基于模糊系统的惯性权重动态调整方法;Jin等[9]提出把标准PSO算法改进为带有邻域选择特性的PSO,提高了算法克服局部极小值的能力;Sun等[10]通过对PSO中粒子收敛行为的研究,借用量子力学思想提出了量子粒子群算法,具有较强的全局搜索能力,并具有很好的精度;有研究提出了自适应加速粒子群优化算法(AAEPSO)以解决多模函数求解中的早熟和解质量差的问题[11];但这些算法在收敛速度、分类精度等方面仍然存在一些问题,需要进一步改进。混沌粒子群优化算法的基本思想[12]:利用混沌序列对 粒子的速度和位置进行初始化,在不改变随机性的同时利用混沌序列提高粒子搜索的遍历性和种群的多样性,产生大量的初始群体并从中寻找优的初始群体。以当前整个粒子群迄今为止搜索到的最优位置为基础产生混沌序列,把产生的混沌序列中的最优位置粒子代替当前粒子群中一个粒子的位置。引入混沌序列的搜索算法在迭代中产生局部最优解的许多邻域点,以此快速搜寻到最优解。该文采用的是混沌系统中的一种满映射,Logisic映射,方程为:

式中,μ 表示控制参数,βik(i=1,2,…,N)是迭代 k 次 的 N 维混沌向量。 令 xk=(x1k,x2k, …xNk) 是当前要进行混沌运算的向量映射 到 [0,1] 区间后的向量,βk=(β1k, β2k, …βNk) 为迭代 k 次后的混沌向量,则施加了随机扰动后的混沌向量xk+i可以表示为:xki=(1-a)xk+aβk,(0i为粒子当前迭代次数时的适应度值,fg为最优粒子 的适应值,favg为所有粒子当前适应度值的平均值,f'avg为优于favg的适应值的平均值。则适应值为fi的粒子自适应调 整其惯性权重ω的具体方法为:(1) 当粒子为群体中较优的 粒子,此时fi优于 f'avg,接近全局最优,惯性权重应该较小,以加速像全局最优收敛,根据粒子适应值调整惯性权重的公式为:

式中,ωmin=0.5,为ω的最小值。取适应值越好,相应的惯性权重越小,能够加强局部寻优。(2) 当粒子为群体中的一般粒子,此时fi优于favg但次于f'avg。此时惯性权重的修正公式调整为:

式中,ωmax为搜索开始时最大的惯性权重,ωmin为搜索结束时最小的惯性权重,T为迭代步数,maxST为允许的最大迭代步数。(3)当粒子时群体中较差的粒子,此时fi次于favg,惯性权重的调整公式为:

式中,k1,k2 通常取大于 1 的常数。 favg -f'avg的值可以用来评价粒子群的早熟收敛程度,该值越小时,粒子群越趋于早熟收敛。当粒子群到达局部最优附近时,粒子的更新速度通常越来越小甚至会停止,此时改变惯性权重可以有效跳出局部最优,以避免早熟收敛。

1.3  自适应混沌粒子群优化算法的步骤描述

自适应混沌粒子群优化算法(ACPSO)的基本步骤如下。

Step1:初始化粒子群,设置允许最大的迭代次数,惯 性权重 ω,学习因子 c1,c2 混沌扰动范围 [-β,β]=[-0.5,0.5] 等相关参数。

Step2:混沌初始化粒子群。随机产生一个 D 维每个分 量数值在 0-1 间的向量 z=(z1,z2,…,zD), 采用 Logisic 映 射迭代产生 N 个向量 z1,z2,…,zN,将各个分量载波 到对应的粒子群的取值范围,计算粒子群的适应值,从 N 个初始群体中选择性能较好的 M 个解作为初始解,随机产 生 M 个初始速度。

Step3:评价每个粒子的适应度,如果粒子适应度 fi 优于 个体极值或全局极值,则相应的更新个体极值和全局极值。

Step4:按照粒子群的位置和速度更新公式、更新粒子 的位置和速度。

Step5:对最优位置进行混沌优化。根据 Logistic 混沌映 射方程产生混沌变量序列,并将其通过逆映射,返回到原 解空间。在原解空间对混沌变量的每个可行解计算其适应 度值 fi ,得到性能最好的可行解。

Step6:用性能最好的可行解,替代当前群体中粒子的位置。

Step7:判断是否满足条件,若满足则停止,输出最优位置,否则根据粒子适应度值 fi 的不同采取相应的自适应策略调整惯性权重 ω,并转到第三步继续计算。

2  SVM结合自适应混沌粒子群的图像分类算法

该文将自适应混沌粒子群算法用于SVM的特征选择和参数设置,并将其应用于医学图像的分类,具体步骤描述 如下。

Step1:图像数据预处理,对图像提取底层视觉特征 , 包括纹理、形状等 , 共D维。由于特征数据的值横跨不同的数值范围 , 为了防止具有较大数值范围的特征弱化了那些只有较小数值范围的属性,所以必须对特征数据进行归一化处理。

Step2:初始化 ACPSO,对种群中每个粒子的速度和位置进行混沌初始化。

Step3:SVM分类器训练,选择特征子集和参数,根据粒子的最新位置得到相应的惩罚因子和核参数,并将它们用于训练SVM分类器,训练时可以采用五折交叉验证,输出平均交叉验证精度作为分类精度。

Step4:种群更新,计算粒子的适应度,根据适应度值,进行自适应调整,调整个体最优位置和全局最优位置,更新每个粒子的速度和位置,对最优位置进行混沌优化,得到性能好的可行解,用可行解取代当前群体中任意粒子的位置。

Step5:终止条件,当满足终止条件时,完成 SVM 分类器的训练,得到最优化的参数组合和特征子集。否则继续返回Step3迭代计算。

Step6:根据优化的参数组合和特征子集重新训练SVM分类器,对测试数据进行测试分类。

3  实验结果及分析

实验环境为 CPU:Intel Intel(R) Dual, 内存 :1 GB,操作系统为 Windows XP, 软件平台:Matlab 2010。实验数据为转化为 BMP 格式的脑CT图像 (包含正常和异常两种类别的图像,大小均为300×353,图像共64张,其中正常图像36张,异常图像28张。

图 1 脑CT图像

注:(a1)和(a2)显示的是正常的脑部 CT 图像,(b1)和(b2)是发生病变之后存在异常的脑CT图像

对脑 CT 图像进行contourlet变换时,LP和DFB; 同样采用的是“9-7”金字塔和“PKVA”方向滤波器组,分为3尺度,每个尺度的方向数均为8,得到24个方向子带。在每个方向子带提取出均值、方差、7个不变矩特征之后,对于图像的7个不变矩特征,前3阶矩的数据影响比较大, 后 4 阶矩由于其数据很小接近于0,前3阶矩比后4阶矩更容易描述图像对象的形状,为了减少特征的维数,缩短分类的时间,在之后的计算中选择均值、方差、HU 不变矩的前3阶矩这5个特征作为分类的依据,这5个特征在图像 进行了Contourlet变换之后得到的3个方向上一共可以形成一个15维的特征组合。将这些特征作为libSVM分类器的 输入向量,需要对这些特征进行归一化处理,使个特征值的范围被限制在 [-1,1] 之间。此处对SVM的训练采用的是高斯径向基核函数:

实验的初始参数设置如下:容错率为0.02,粒子选择60,最大迭代次数500,特征维数15,变异步数控制参数 FailtureMax=10,变异尺度参数为 0.1。使用 SVM 分类器将 图像分为两类:正常类和异常类,此时将正常的脑 CT 图像标注为 2,异常图像标为 1。图 2 表示一次对脑CT图像进行分类的结果。

图 2 分类结果示意

为了验证算法的分类效果,采用五折交叉验证法进行分类实验。使用命中率标准进行分类效果的对比分析,令正命中率:pT=numT/NumT;反命中率:pF=numF/NumF;总体命中率:pT=(numT+ numF)/(NumT+NumF)。 其中,T 表示正例(即正常脑 CT 图像),F 表示反例(异 常脑 CT 图像),num 表示分类正确的数目,Num 表示原数集的数目。 对比5次分类的结果可以看出,对于不同的训练集和测试集,分类的精度不同,这可能是由于在算法的执行过 程中最优解的不同导致惯性权重和特征选择不同引起的。在每次的分类实验中,并不是所有的15维特征数据在每次的训练中都能够被选中,被选中的特征是经过自适应混沌粒子群优化算法搜寻的最优向量,这样可以达到降低特征维数的目的。见表1。

表 1 ACPSO-SVM 分类算法分类结果

为了验证算法在分类精度上有所提高,将其与 PSOSVM 以及 QPSO-SVM 算法进行对比。评价标准为平均正命 中率、平均反命中率及平均总体命中率、平均特征数目。 通过引用混沌粒子群及自适应调整策略优化 SVM,在一定 程度上提高的脑 CT 图像的分类准确度。由此在小样本情况 下,实验证明了 ACPSO-SVM 的可行性,其用于医学图像 分类的有效性,见表 2。

表 2 分类算法对比



4  结语

本研究在已有的自适应量子行为粒子群优化SVM的特征选择和参数估计的算法上,提出自适应混沌粒子群与SVM结合的分类方法,避免PSO陷入局部最优的问题,加快收敛速度,通过寻找最优解进行SVM的特征选择和参数优化。这种结合优化算法的SVM经过实验应用于脑部CT的分类,能够得到较满意的分类效果,证明了该算法的可行性。

[参考文献]
[1]J Neumann,C Schnorr,G Steidl.Combined SVM-based feature selection and classification [J]. Mach.Learn,2005(61):129-150.
[2]赵莹 . 支持向量机中高斯函数的研究[D]. 上海:华东师范大学,2007.
[3]Frohlich H,Chapelle O.Feature selection for support vector machines by means of genetic algorithms[C].Proceedings of the 15th IEEE International conference on tools with artificial intelligence,Sacrame nto,2003:142-148.
[4] Zhang HT, Mao HP.Feature Selection for the Stored-grain Insects Based on PSO and SVM[C]. International Workshop on Konwledge Discovery and Data Mining,2009:586-589.
[5]Huang CL,Chen MC,Wang CJ.Credit scoring with a data mining approach based on support vector machines[J].Expert Syst Appl,2006,33(4):847-856.
[6]Gao HZ,Mandal MK,Wan JW. Classification of Hyperspectral Image with Feature Selection and Parameter Estimation[C].International Conference on Measuring Technology and Mechatronics  Automation,2010:783-786.
[7]刘一鸣 . 自适应量子行为粒子群算法及其在图像分类中的应用研究[D]. 杭州:浙江大学,2011.
[8]Eberhart RC, Shi Y. Particle Swarm Optimization: Developments, Applications and Resource [C].IEEE Conference on Evolutionary Computation. Seoul, 2001:81-86.
[9]J Jin, Q Wang, Y Shen. High-performance  medical image registration using improved partiele swarm optimization[C]. Instrumentation and Measuremen Technology Conference Proeeedings,Vietoria,BC, 2008:736-740.
[10]Sun J,Feng B,Xu WB.Particle Swarm Optimization with Particles Having Quantum Behavior [C]. Proc. Congress on Evolutionary Computation, Piscataway, 2004 :325-331.
[11]Sabat, S L, Ali, etc. Adaptive accelerated exploration particle swarm optimizer for global multimodal functions [C]. In: World Congress on Nature and Bio-logically Inspired Computing, Coimbatore, India, 2009,12:654-659.
[12]高雷阜 , 刘旭旺 .一种基于混沌的自适应粒子群全局优化方法 [J].计算机工程与应用,2010,46(3):51-53.

投稿系统

本系统为《医疗装备》唯一投稿平台,以方便作者在线投稿、查询、缴费等;《医疗装备》未授权其他任何单位、个人进行网站建设或收稿、收费等行为!

官方信息

  • 欢迎关注《医疗装备》官方公众号

《医疗装备》杂志社有限责任公司   版权所有   Copyright(c)2001-2017
ylzbzz.org.cn All Right Reserved    京ICP备17008523号-1   网站构建:Blovemedia