赵小强1,2,3,张莺莺2(1.兰州理工大学电气工程与讯息工程学院,甘肃兰州;2.甘肃省产业进程先进管束中心熟练室,甘肃兰州;3.兰州理工大学国度级电气与管束工程熟练讲授中间,甘肃兰州)择要:针对乳腺肿瘤的诊断率及精确度较低的环境,提议一种基于改良的矢量量化(LVQ)神经网络乳腺肿瘤诊断算法。首先,基于LVQ1算法和LVQ2算法在网络熬炼进程中革新神经元数量的不同,设立贯串LVQ1算法和LVQ2算法的复合LVQ神经网络;尔后,思虑到不同的比赛层节点数对LVQ神经网络诊断率的影响,采取K交织考证法肯定复合LVQ最好网络布局;末了,研讨了稳固的进修率在网络熬炼后期对约束速度的影响,采取自适应速度算法调度进修率,削减迭代次数。以WisconsinBreastCancerDatabase为熟练模范,应用改良算法构造乳腺肿瘤与病症之间的非线性映照瓜葛,用混淆矩阵的观点抒发算法诊断确切率。熟练成效说明,提议的改良算法诊断确切率达97.1%,比拟LVQ1算法和LVQ2算法,误诊率别离消沉了5.8%和2.9%。关键词:乳腺肿瘤诊断;改良LVQ神经网络;K交织考证法;自适应速度;混淆矩阵;算法改良中图分类号:TN?34;TP3?05文件标帜码:A文章编号:?X()01??引言
乳腺肿瘤是女性疾病中最罕见的恶性肿瘤之一[1],在病发初期没有显然的临床病症,阻挡易被觉察,其病发率正在逐年上涨,而且慢慢呈低龄化趋向[2]。是以,初期发掘、初期医治是医治乳腺肿瘤的最好路径。保守肿瘤诊断法子有医学影象、老手判定等,但这种法子较依赖大夫的主观意识,诊断确切率较低[3?4]。
比年来,由于人为智能手艺迅猛进展,人为神经网络具备雄壮的自适应性,给肿瘤诊断供应了新的法子。文件[5]将BP神经网络用于展望乳腺肿瘤,其确切性、麻利度和稀奇度别离为96.9%,95.5%和97.6%,不过BP神经网络进修速度慢、轻易呈现“过拟合”表象;文件[6]用几率神经网络对平常乳腺机关、良恶性乳腺肿块举办诊断,确切率较好,诊断历时少,易于完结,不过较依赖于模范;文件[7]将多模子卷积神经网络用于乳腺肿瘤诊断,诊断精度为97.64%,不过多模子卷积神经网络的大批模范使熬炼速度迟缓,而且完结对照繁杂;文件[8]设立深度神经网络模子Alexnet对乳腺肿瘤举办诊断,确切率到达了87.0%,差错局限为±0.03,不过深度神经网络对模范的请求很高;文件[9]将进修向量量化(LearningVectorQuantization,LVQ)神经网络应用到乳腺肿瘤诊断中,诊断精度为91.51%,表现了其高度的非线性运算手腕和如同特性聚类成效、大范围并行处置和强容错性等特性,但未思虑LVQ神经网络在乳腺肿瘤诊断现实应用中,其比赛层的初始权值、神经元个数和进修率对诊断功效的影响。
是以,本文针对乳腺肿瘤的诊断率及精确度较低的环境,提议一种改良的LVQ神经网络诊断算法。首先设立复合LVQ神经网络,尔后采取K交织考证法肯定最好网络布局,在网络熬炼进程中采取自适应速度法调度进修率,末了哄骗WisconsinBreastCancerDatabase数据举办仿的确验。
1算法理论
LVQ神经网络是一种应用于形式分类的监视式神经网络,它将比赛进修和监视进修相贯串,颠末近来邻准绳找到得胜神经元后一直批改神经元之间的权向量,进而区别形式典范。
LVQ神经网络布局如图1所示,其有R个输入层神经元,S1个比赛层神经元,S2个输出层神经元。首先S1个比赛层神经元颠末与R个输入层神经元全面连贯,将P×R维的输入向量按照参考向量的监视进修区分为较精密的子典范,尔后S2个输出层神经元颠末与S1个比赛层神经元部份连贯来归并比赛层的子分类成效,末了输出渴望的宗旨典范。
2基于改良LVQ神经网络的乳腺肿瘤诊断2.1乳腺肿瘤诊断旨趣医学探索说明,按照细针穿刺获得的乳腺肿瘤病灶机关细胞与平常机关细胞之间的特性数据的差别可将乳腺肿瘤分为良恶性。是以,颠末设立细针穿刺获得的乳腺肿瘤细胞核10个量化特性与细胞良恶性之间的瓜葛,诊断出乳腺肿瘤的良恶性。设x1,x2,?,x10别离为细胞核的半径、质量、周长、面积、滑腻性、精密度、凹下度、凹下点数、对称度、断裂度这10个属性特性,y为乳腺肿瘤的良恶性,取值为1(良性)或2(恶性),则有:y=f(x1,x2,?,x10)(1)f(x)为细胞属性特性与乳腺肿瘤良恶性之间对应的函数瓜葛。是以,能够用上述属性特性做为乳腺肿瘤良性、恶性诊断特性。图1LVQ神经网络布局2.2设立复合LVQ神经网络
根底的LVQ1算法惟独一个得胜神经元,即只革新一个权值,这使得比赛层神经元讯息被浪掷,而LVQ2算法强调了“次得胜”神经元,能够进一步哄骗两个得胜神经元革新权值。
为了提升诊断精度,在数据熬炼阶段将LVQ1网络与LVQ2网络举办循序组合,设立复合LVQ神经网络。即先用数据熬炼曾经设立好的LVQ1网络,基于LVQ1网络熬炼获得权值矩阵,尔后用数据从头熬炼由权值矩阵构造的LVQ2网络,循序组合获得终究训0练好的复合LVQ网络用于乳腺肿瘤诊断。
首先初始化输入层、比赛层权值和进修率η(η0),摆设进修率为0.1;尔后把乳腺肿瘤的10个属性特性x=(x1,x2,?,x10)输入复合LVQ神经网络,按式(2)祈望比赛层权值向量与输入向量的间隔di。
di=,i=1,2,?,S(2)
按照式(2)抉择出间隔输入向量x近来的两个比赛层神经元i,j,即间隔di最小,若是神经元i,j餍足如下两个前提:神经元i和神经元j对应于不同的典范;神经元i和神经元j与目下输入向量的间隔di和dj餍足公
式(3):
此中,ω与模范维度相关,在0.2~0.3之间取值。
按照法则1)、法则2)改正神经元i,j的权值:1)若比赛层神经元i对应的典范Ci与输入向量x对应的典范Cx不一致时,即Cx≠Ci,则输入层与比赛层权值的第i行按式(4)举办改正:ωinew=ωiold-a(x-ωiold)(4)2)若比赛层神经元j对应的典范Cj与输入向量对应的典范Cx一致时,即Cx=Ci,则输入层与比赛层权值的第j行按式(5)举办改正:ωjnew=ωjold+a(x-ωjold)(5)式中a是进修步长。
如许,若是两个权向量最逼近输入向量,此中一个所属典范切确,而另一个所属典范过错,复合LVQ神经网络能颠末两个得胜神经元一直地革新权值。
2.3K交织考证法肯定比赛层神经元数量
比赛层神经元的数量时时采取试凑法肯定[9?10],文件[9]和文件[10]采取试法将比赛层神经元数设为20和16.本文思虑到网络熬炼耗时和差错巨细,肯定比赛层神经元数量时采取了K交织考证法,此法子的益处是轮回哄骗模范数据优化了网络布局,提升了网络熟练确切率。
首先,设算法中K值为5,马上乳腺肿瘤数据集均匀分为5个子集,熬炼集与考证集比例为4∶1;其次,按照复合LVQ网络布局将式(6)初始化:
n1=+a(6)
式中:n为输入层神经元数;n1为比赛层神经元数;m为输出层神经元数;常数a=1~10。
n1=log2n(7)n1=2n+1(8)
由式(6)~式(8),求n1的局限为2≤n1≤14。
按照上头推导得悉,n1的局限为2~14,轮回5次,用均匀分派的5个乳腺肿瘤子纠合的随便4个子集熬炼复合LVQ网络,余下子集考证复合LVQ网络,获得5次熬炼的乳腺肿瘤均匀分类切确率,把它做为复合LVQ神经网络的诊断率。颠末交织考证,获得最好神经元数量n1=10,此时复合LVQ神经网络熬炼速度最快,乳腺肿瘤诊断切确率最高,故哄骗比赛层神经元数10设立复合LVQ最好神经网络模子。2.4自适应速度算法
自适应速度算法在网络熬炼初期分母较小,进修率较大,进修对照快,熬炼后期时,进修会慢慢放慢,而且它适当于处置荒芜梯度,自适应速度算法能够主动地调度进修速度。在复合LVQ网络熬炼进程中,若所选的进修速度η取值太小,能够适本地增添η值;若所选进修速度η过大,此时该当减小η值,消除对网络形成的过调度,按照式(9)举办进修速度的调度。
(9)
式中:lr_inc为递加乘因子;η为进修速度;k为迭代次数;E(k)代表第k次迭代的差错函数;lr_dec为递减乘因子;err_ratio为差错速度。
3熟练成效与解析3.1数据处置
本文的仿的确验数据采取WisconsinBreastCancerDatabase数据集,该数据集公有×32个double典型的病例数据,此中良性肿瘤数据组,恶性肿瘤数据组,32为每组病例所含的字段,第1个字段为病例编号,第2个字段为确诊成效,成效1示意良性,2示意恶性,残余字段为每组病例10个量化特性的均匀值、准则差和最坏值,共30个属性值.表1给出了熟练所需的部份熟练数据。
本熟练熬炼集与测试集比例为∶69,用于网络熬炼和测试的数据集如表2所示。
为了提升算法诊断精度,颠末式(10)对×32个输入数据举办归一化处置,使其映照到[0,1]局限之间,xt为现实值,xt′为归一化后的值,xmax与xmin为数据纠合的最大值与最小值。
按式(11)将获得的网络展望输出值y′反归一化为现实值yt。
yt=y′(xmax-xmin)+xmin(11)3.2熟练参数摆设
基于改良LVQ神经网络的乳腺肿瘤诊断算法,总公有30个特性数据做为神经网络的输入,乳腺肿瘤的良恶性典范做为神经网络的输出,由此,能够肯定输入层30个节点,输出层2个节点。按照K交织考证法肯定的比赛层节点数量为10,网络拓扑布局为30?10?2。其参数摆设如表3所示。
3.3熟练成效与解析
改良的LVQ神经网络的输入是30维乳腺肿瘤特性数据,渴望输出是乳腺肿瘤的良恶性,符号为1或2。对复合LVQ神经网络哄骗K交织考证法肯定了最好网络布局后,先用组熬炼数据熬炼复合LVQ神经网络,在熬炼进程中由自适应速度算法一直调度进修率,尔后,随便拔取69组不同的测试集举办仿的确验,其仿的确验的均方差错约束图如图2所示,均方差错颠末6次熬炼趋于安稳,仿真成效如图3所示。
图2仿的确验的均方差错约束图图3改良的tLVQ神经网络仿真成效
同时,针对LVQ2神经网络,一样用K交织考证法肯定最好网络布局后,输入组肿瘤病例数据熬炼LVQ2神经网络,采取自适应速度算法调度进修率,末了用69组病例数据举办仿的确验,获得仿真成效如图4所示。
图4LVQ2神经网络仿真成效
在类似的熟练前提下,由图3,图4可知,改良LVQ神经网络的良性、恶性肿瘤确诊率均高于LVQ2神经网络。再借助混淆矩阵[11]抒发改良LVQ神经网络和LVQ2神经网络针对乳腺肿瘤的集体诊断确切率,混淆矩阵的界说如表4所示。
此中,行代表模范的展望典范(OutputClass),列为的确典范(TargetClass)。精度(Accuracy)、调回率(Recall)、F值、精确率(Precision)、F1值为其机能评估目标,祈望公式如下:
由熟练仿真成效贯串式(12)~式(16),得出改良的LVQ神经网络与LVQ2神经网络的评估成效如表5所示,改良的LVQ神经网络的精度比LVQ2神经网络精度高2.9%,其F值、精确率、F1值也均高于LVQ2神经网络。
从表6中看出,在69组测试集数据中,改良的LVQ神经网络能切确诊断67组测试集数据,有2组恶性肿瘤被误诊,此中被切确诊断的良性肿瘤个数占69组测试集数据的66.7%,被切确诊断的恶性肿瘤个数占测试集数据的30.4%。集体诊断确切率达97.1%、精确率Recall为95.8%、F值为91.3%、误诊率为2.9%。一样熟练前提下,LVQ2神经网络切确诊断的肿瘤个数为65组,集体诊断率为94.2%,精确率、F值、F1评分都较低,误诊率为5.8%。文件[5]中LVQ1神经网络测试的误诊率为8.7%。
看来,改良的LVQ网络提升了乳腺肿瘤的诊断率,高于LVQ2神经网络和文件[9]中LVQ1神经网络的诊断率,说明改良的LVQ神经网络对乳腺肿瘤良性、恶性诊断的功效更好。
将本文给出的算法与LVQ1神经网络[9]、核极限进修机[12]、LVQ2神经网络、MLP神经网络[13]、改良的AlexNet深度卷积神经网络[14]、深度进修分类的部分二值形式(LBP)主动诊断算法[15]、DPSO?SVM算法[16]、BP神经网络[5]举办对照,成效如图5所示。
由图5可知,改良的LVQ神经网络算法应用于乳腺肿瘤诊断时确切率显然高于其余几种诊断算法。
4论断
针对乳腺肿瘤的诊断率及精确度较低的环境,本文提议了改良的LVQ神经网络算法。首先设立了复合LVQ神经网络,尔后用K交织考证法肯定了最好网络布局,在熬炼进程中采取自适应速度法调度学率,末了对WisconsinBreastCancerDatabase数据举办仿的确验。成效说明,改良的LVQ神经网络提升了诊断确切率,具备必要的优良性。
注:本文通信做家为张莺莺。
参考文件[1]SAYEDAM,NASERMA,WAHBAAA,etal.Breasttu?mordiagnosisusingfinite?elementmodelingbasedonclinicalinvivoelastographicdata[J].Journalofultrasoundinmedi?cine:officialjournaloftheAmericanInstituteofUltrasoundinMedicine,,39(12):?.[2]TOAARM,?ZKURTKB,ERGENB,etal.BreastNet:anovelconvolutionalneuralnetworkmodelthroughhistopathologi?calimagesforthediagnosisofbreastcancer[J].PhysicaA:statisticalmechanicsanditsapplications,,:.[3]张庆,庄治国,耿小川,等.乳腺MRI影象组学模子对小乳腺癌诊断效用的探索[J].中华喷射学杂志,,54(8):?.[4]HEYK,XUGH,RENJ,etal.Mammography