评论文章
更多的信息

提交:2019年12月18日|批准:2020年1月29日|发表:2020年1月30日

本文引用:阴户AL-Taie FA,卡西姆操作系统。疾病分类使用一种混合模糊互信息技术与二进制蝙蝠算法。安Proteom Bioinform。2020;4:001 - 005。

DOI:10.29328 / journal.apb.1001009

版权:©2020 AL-Taie FAY, et al。这是一个开放存取物品在知识金博宝app体育共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确引用。

关键词:分类;二进制蝙蝠算法(BBA);互信息;模糊;Bigdata

全文PDF

疾病分类使用一种混合模糊互信息技术与二进制蝙蝠算法

Firas Ahmed阴户AL-Taie *和奥马尔军刀卡西姆

大学数学系的摩苏尔,伊拉克摩苏尔

*通信地址:Firas Ahmed阴户AL-Taie、数学系、摩苏尔,伊拉克摩苏尔大学电子邮件:firas_a.al_taie@uomosul.edu.iq;omar.saber@uomosul.edu.iq

文摘

基因数据集有大量的特性可能显著影响疾病分类过程,特别是数据集相关癌症的疾病。进化算法(EA)被用来找到最快和最好的方法来执行这些计算,如蝙蝠算法(BA)通过减少搜索区域后的尺寸变化连续,离散。基因选择的方法,提出了两个连续的阶段:在第一阶段,模糊互信息(FMI)方法用于选择最重要的基因选择通过一个模糊模型,建立了基于数据集的大小。在第二阶段,英国银行家协会是用来减少和确定固定数量的基因影响分类的过程中,来自第一阶段。FMI_BBA算法,描述了效率,获得更高的分类精度和几个数字选择基因比其他算法。

介绍

当处理bigdata,我们努力减少这个数据的大小通过使用现代技术,最重要的是特征选择过程。在前几年,一些算法已经提出,模拟一些生物体的行为在寻找食物和他们使用的方法的研究方法[1]。在使用它们作为一个数学模型来解决一些复杂的问题。肯尼迪和埃伯哈德提出的二进制版本已知的粒子群优化(PSO)称为全局搜索,在传统PSO算法修改为了解决二进制优化问题[2、3]Rashedi等人提出了一个引力搜索算法的二进制版本(GSA) (BGSA)呼吁特征选择[4]、拉莫斯等人提出了他们的版本的和谐搜索(HS)的上下文中相同的目的盗窃检测配电系统。本文的工作分为两个阶段,第一阶段开始的地方使用模糊为了确定影响工作结果的功能,然后使用MI互信息技术进入只有重要的数据在研究过程[5]。第二阶段是使用BBA二进制蝙蝠算法[6]。

蝙蝠算法

蝙蝠是唯一的哺乳动物,有翅膀,有巨大的能力和效率,使它们从这些特性研究人员感兴趣的是他们的回声定位能力这一特性可以被认为是一种天然的声纳[7]。蝙蝠工作产生声脉冲的不同频率和非常快,然后等待这些脉冲返回后,他们与猎物相撞,然后计算它和猎物之间的距离根据声波的频率和时间来回[8]。这样,蝙蝠中考虑生物能够吞噬自己晚上在黑暗的黑暗,他们的蝙蝠能够区分移动和固定目标和知道这些目标的方向运动,这一过程中完成的一小部分时间[8]。这个算法的作者杨认为蝙蝠的行为是一个理想的选择和路径的改进方法[1](图1)。然后他发达他们像一群蝙蝠寻找食物/猎物使用echo-positioning (9、10)。开发了一些改进规则如下:


下载图片

图1:蝙蝠算法的伪代码。

1。所有蝙蝠回声定位属性来估计距离,也知道之间的区别(障碍和猎物)以惊人的方式。

2。蝙蝠在随机飞行速度(V)和位置(X)和恒频fmin变化波长(λ)和声音响度(一个o),蝙蝠有能力调整波长或脉冲频率产生,能够调整的速度脉冲rϵ[0,1]根据猎物维度。

3所示。蝙蝠的响度变化在许多方面,但杨假设响度可以改变在一个给定的曲线从大的积极价值一个o一个最小值一个最小值和常数。默认的蝙蝠是由更新位置和速度更新使用以下数学模型:

V k ( t ) = V k ( t 1 ) + ( X k X k ( t 1 ) ) f ( 1 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGwbWdamaaDaaaleaapeGaamyAaaWdaeaapeGaam4Aaaaakmaabmaapaqaa8qacaWG0baacaGLOaGaayzkaaGaeyypa0JaamOva8aadaqhaaWcbaWdbiaadMgaa8aabaWdbiaadUgaaaGcdaqadaWdaeaapeGaamiDaiabgkHiTiaaigdaaiaawIcacaGLPaaacqGHRaWkdaqadaWdaeaadaWfGaqaa8qacaWGybaal8aabeqaa8qacqGHsislaaGcpaWaaWbaaSqabeaapeGaam4AaaaakiabgkHiTiaadIfapaWaa0baaSqaa8qacaWGPbaapaqaa8qacaWGRbaaaOGaaiikaiaadshacqGHsislcaaIXaGaaiykaaGaayjkaiaawMcaaiaadAgapaWaaSbaaSqaa8qacaWGPbaapaqabaGcpeGaaiiOaiabgAci8kabgAci8kaacIcacaaIXaGaaiykaaaa@5B22@

在哪里 V k ( t ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGwbWdamaaDaaaleaapeGaamyAaaWdaeaapeGaam4Aaaaakmaabmaapaqaa8qacaWG0baacaGLOaGaayzkaaaaaa@3BE1@ 代表新的蝙蝠的速度。

X k ( t ) = X k ( t 1 ) + V k ( t ) ( 2 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGybWdamaaDaaaleaapeGaamyAaaWdaeaapeGaam4AaaaakiaacIcacaWG0bGaaiykaiabg2da9iaadIfapaWaa0baaSqaa8qacaWGPbaapaqaa8qacaWGRbaaaOGaaiikaiaadshacqGHsislcaaIXaGaaiykaiabgUcaRiaadAfapaWaa0baaSqaa8qacaWGPbaapaqaa8qacaWGRbaaaOWaaeWaa8aabaWdbiaadshaaiaawIcacaGLPaaacaGGGcGaeyOjGWRaeyOjGWRaeyOjGWRaaiikaiaaikdacaGGPaaaaa@5258@

在哪里 X k ( t ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGybWdamaaDaaaleaapeGaamyAaaWdaeaapeGaam4AaaaakiaacIcacaWG0bGaaiykaaaa@3B94@ 代表了新职位, X k MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaCbiaeaaqaaaaaaaaaWdbiaadIfaaSWdaeqabaWdbiabgkHiTaaak8aadaahaaWcbeqaa8qacaWGRbaaaaaa@398A@ 是最好的一个网站,当前全球解决方案为决策变量可以被认为是最好的。

f = f n + ( f 一个 x f n ) β ( 3 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGMbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbiabg2da9iaadAgapaWaaSbaaSqaa8qacaWGTbGaamyAaiaad6gaa8aabeaak8qacqGHRaWkdaqadaWdaeaapeGaamOza8aadaWgaaWcbaWdbiaad2gacaWGHbGaamiEaaWdaeqaaOWdbiabgkHiTiaadAgapaWaaSbaaSqaa8qacaWGTbGaamyAaiaad6gaa8aabeaaaOWdbiaawIcacaGLPaaacaGGGcGaeqOSdiMaaiiOaiabgAci8kabgAci8kabgAci8kaacIcacaaIZaGaaiykaaaa@541D@

在哪里f1频率为每一个蝙蝠b,β是一个随机数,它的值是在[0,1]。

杨引入了使用随机路径的概念技术改善明显的对比可能的解决方案通过选择当前最好的解决方案之一,然后使用它来创建一个新的解决方案中所有蝙蝠组[11]:

X = X + ε 一个 ( t ) ( 4 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaqGybWdamaaBaaaleaapeGaaeOBaiaabwgacaqG3baapaqabaGcpeGaeyypa0Jaaeiwa8aadaWgaaWcbaWdbiaab + gacaqGSbGaaeizaaWdaeqaaOWdbiabgUcaRiabew7aL9aadaWfGaqaa8qacaWGbbGaaiiOaaWcpaqabeaapeGaeyOeI0caaOGaaiikaiaabshacaGGPaGaaeiOaiabgAci8kabgAci8kaacIcacaaI0aGaaiykaaaa@4DE8@

ϵ在哪一个随机数,价值[1], 一个 ( t ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaCbiaeaaqaaaaaaaaaWdbiaadgeacaGGGcaal8aabeqaa8qacqGHsislaaGccaGGOaGaaeiDaiaacMcaaaa@3BAB@ 是平均的声音来自所有蝙蝠在这一步。技术是通过调整平衡响度和脉冲发射率如下:

一个 ( t + 1 ) = α 一个 ( t ) ( 5 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGbbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbmaabmaapaqaa8qacaWG0bGaey4kaSIaaGymaaGaayjkaiaawMcaaiabg2da9iabeg7aHjaadgeapaWaaSbaaSqaa8qacaWGPbaapaqabaGcpeWaaeWaa8aabaWdbiaadshaaiaawIcacaGLPaaacaqGGcGaeyOjGWRaeyOjGW7aaeWaa8aabaWdbiaaiwdaaiaawIcacaGLPaaaaaa@4A8C@

r ( t + 1 ) = r ( 0 ) ( 1 经验值 ( y t ) ] ( 6 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGYbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbmaabmaapaqaa8qacaWG0bGaey4kaSIaaGymaaGaayjkaiaawMcaaiabg2da9iaadkhapaWaaSbaaSqaa8qacaWGPbaapaqabaGcpeWaaeWaa8aabaWdbiaaicdaaiaawIcacaGLPaaadaWadaWdaeaapeGaaGymaiabgkHiTiGacwgacaGG4bGaaiiCamaabmaapaqaa8qacqGHsislcaWG5bGaamiDaaGaayjkaiaawMcaaaGaay5waiaaw2faaiaacckacqGHMacVcqGHMacVcaGGOaGaaGOnaiaacMcaaaa@53E3@

α,y是常数,第一步的算法和发射率 r ( 0 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGYbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbiaacIcacaaIWaGaaiykaaaa@3A7E@ 和响度 一个 ( 0 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGbbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbiaacIcacaaIWaGaaiykaaaa@3A4D@ 随机选择和期限内吗 r ( 0 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGYbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbmaabmaapaqaa8qacaaIWaaacaGLOaGaayzkaaaaaa@3ACD@ ϵ[0,1] 一个 ( 0 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGbbWdamaaBaaaleaapeGaamyAaaWdaeqaaOWdbiaacIcacaaIWaGaaiykaaaa@3A4D@ ϵ[0,1]从前面的方程,它将指出,蝙蝠跟踪频率变化,可以加速他们获得最好的解决方案[6]。

为了解决问题在离散空间中,蝙蝠的复制算法的二进制版本已经更新处理问题基于向量[0,1],分子可以前往任何过多的材料的各个角落只使用[12]0或1的值。这意味着蝙蝠算法(BBA)有点类似的基本算法(BA),但根据搜索空间,英航在连续距离虽然BBA搜索是基于离散空间由0和1这个过程需要一个函数值在0和1之间变化,称为传递函数[13]。选择这个函数的过程取决于它必须满足一定的前提条件:

1。这个函数的范围必须与范围[0,1],因为它代表一个粒子的概率改变其位置。

2。传递函数应该提供最大可能的变化的位置改变的绝对速度值。一些粒子与一个伟大的绝对值可以移动的速度远离最优解,因此必须开关重新定位在以下迭代。

3所示。前面的词适用于最小的概率改变位置即使绝对速度太小了。

在本文中,我们依靠(乙状结肠函数)作为传输函数的所有分子转化为二进制值的位置:

年代 ( V ) = 1 1 + e v k ( 7 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGtbWaaeWaa8aabaWdbiaadAfapaWaaSbaaSqaa8qacaWGPbaapaqabaaak8qacaGLOaGaayzkaaGaeyypa0ZaaSaaa8aabaWdbiaaigdaa8aabaWdbiaaigdacqGHRaWkcaWGLbWdamaaCaaaleqabaWdbiabgkHiTiaadAhapaWaa0baaWqaa8qacaWGPbaapaqaa8qacaWGRbaaaaaaaaGccaGGGcGaeyOjGWRaeyOjGWRaaiikaiaaiEdacaGGPaaaaa@4A47@

根据这个函数可以更换与情商Eq。(2)。(8):

X k = { 1 f 年代 ( V ) > σ 0 o t h e r w 年代 e ( 8 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGybWdamaaDaaaleaapeGaamyAaaWdaeaapeGaam4Aaaaakiabg2da9maaceaapaqaa8qacaGGGcWdauaabeqaceaaaeaapeGaaGymaiaacckacaWGPbGaamOzaiaacckacaWGtbWaaeWaa8aabaWdbiaadAfapaWaaSbaaSqaa8qacaWGPbaapaqabaaak8qacaGLOaGaayzkaaGaeyOpa4Jaeq4WdmNaaiiOaaWdaeaapeGaaGimaiaacckacaWGVbGaamiDaiaadIgacaWGLbGaamOCaiaadEhacaWGPbGaam4CaiaadwgacaGGGcaaaiaacckaaiaawUhaaiaacckacqGHMacVcqGHMacVcqGHMacVcaGGOaGaaGioaiaacMcaaaa@5F0E@

在哪里 U ( 0 , 1 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeyipI4NaaeyvaiaabccadaqadaqaaiaaicdacaGGSaGaaeiiaiaabgdaaiaawIcacaGLPaaaaaa@3D1F@ (正态分布)。

最后给二进制值方程是一种机制,任何从一群蝙蝠蝙蝠空间。

互信息(MI)

我们经常发现很多随机相干的信息和相关的变量,这些变量的相关程度和影响他们中的一些人可以推断通过互信息[14]。

( X , Y ) = H ( X ) H ( X Y ) ( 9 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGjbWaaeWaa8aabaWdbiaadIfacaGGSaGaamywaaGaayjkaiaawMcaaiabg2da9maalaaapaqaa8qacaWGibWaaeWaa8aabaWdbiaadIfaaiaawIcacaGLPaaaa8aabaWdbiaadIeadaqadaWdaeaapeWaaSaaa8aabaWdbiaadIfaa8aabaWdbiaadMfaaaaacaGLOaGaayzkaaaaaiaacckacqGHMacVcqGHMacVcaGGOaGaaGyoaiaacMcaaaa@4A73@

H是离散随机变量X的熵条件的离散随机变量Y采取一定的价值。这意味着y,我们得到信息,是相互的信息(X, Y)。

否则,(X, Y)= 0,如果X和Y是完全无关的。

相互的信息主要是应用于滤波器特性设置测量特定特性之间的相关性和一些类分类[15]。有一个经典的实现互信息方法的一些特性分类指标[16](图2)。这一理论最重要的应用之一是选择功能,因为它将评估功能的重要性,安排他们根据他们的重要性,换句话说这个理论将安排的特性以升序排序根据每个特性的影响最终结果的数据,因此会减少特性包括在计算,加快了工作的计划[17]。在接下来的关系,它将显示一个广泛的功能和分类:


下载图片

图2:过滤的策略控制。

( F , G ) = P ( F , G ) 日志 P ( F , G ) P ( F ) * P ( G ) dfdc 。。 ( 10 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaqGjbWaaeWaa8aabaWdbiaabAeacaGGSaGaae4raaGaayjkaiaawMcaaiabg2da9iaabckapaWaaubiaeqaleqabaGaaGzaVdqdbaWexLMBbXgBd9gzLbvyNv2CaeHbnfgBNvNBGC0B0HwAJbacfaWdbiaa = XIiaaGccaqGqbWaaeWaa8aabaWdbiaabAeacaGGSaGaae4raaGaayjkaiaawMcaaiaabYgacaqGVbGaae4zamaalaaapaqaa8qacaqGqbWaaeWaa8aabaWdbiaabAeacaGGSaGaae4raaGaayjkaiaawMcaaaWdaeaapeGaaeiuamaabmaapaqaa8qacaqGgbaacaGLOaGaayzkaaGaaeOkaiaabcfadaqadaWdaeaapeGaae4raaGaayjkaiaawMcaaaaacaqGKbGaaeOzaiaabsgacaqGJbGaaeiOaiabgAci8kabgAci8kaac6cacaGGUaWaaeWaa8aabaWdbiaaigdacaaIWaaacaGLOaGaayzkaaGaaeiOaaaa@6BE0@

推断特定特性之间进行信息交换的过程,这个过程很容易,但是难就难在评估一套完整的功能和发现每个特性的链接与一系列的其他特性。每个特性可能不会给一个完整的画面,但它们之间的加成法可以澄清形象(18、19)。N变量之间(X1, X2…XN)和变量(Y),链式法则是:

( X 1 , X 2 , Xn ; Y ) = = 1 N ( ; Y / 1 , 2 , x 1 ) ( 11 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaqGjbWaaeWaa8aabaWdbiaabIfacaaIXaGaaiilaiaabIfacaaIYaGaaiilaiabgAci8kaabIfacaqGUbGaai4oaiaabMfaaiaawIcacaGLPaaacaqGGcGaeyypa0ZaaybCaeqal8aabaWdbiaabMgacqGH9aqpcaaIXaaapaqaa8qacaqGobaan8aabaWdbiabggHiLdaakiaabMeacaGGOaGaaeiwaiaabMgacaGG7aGaaeywaiaac + cacaqGybGaaeyAaiabgkHiTiaaigdacaGGSaGaaeiwaiaabMgacqGHsislcaaIYaGaaiilaiabgAci8kaabIhacaaIXaGaaiykaiaabckacqGHMacVcqGHMacVcaGGOaGaaGymaiaaigdacaGGPaaaaa@632B@

f t n e 年代 年代 ( X ) = ( X , G ) ( 12 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq = Jc9vqaqpepm0xbba9pwe9Q8fs0 = yqaqpepae9pg0FirpepeKkFr0xfr = xfr = xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8qacaWGMbGaamyAaiaadshacaWGUbGaamyzaiaadohacaWGZbWaaeWaa8aabaWdbiaadIfacaWGPbaacaGLOaGaayzkaaGaeyypa0Jaamysamaabmaapaqaa8qacaWGybGaamyAaiaacYcacaWGhbaacaGLOaGaayzkaaGaaiiOaiabgAci8kabgAci8kaacIcacaaIXaGaaGOmaiaacMcaaaa@4DF7@

可以指定交换信息作为一种措施来减少不确定性分类标签,在“适应度函数最大化的价值信息交换(3,20)。

特征选择

特征选择方法减少的数量特性用于描述一组大型数据集,以改善算法的性能。这种方法的目的是减少使用的功能,并减少所需的时间来获取结果,导致增加分类的准确性(18、21)(图3)。特征选择算法可以表示为三个阶段:


下载图片

图3:特征选择的样本子集的解决方案。

1。搜索算法:评估功能的总数输入和选择的重要组成部分。

2。适应度函数:它将数据传输到双星系统选择1号对应的功能。

3所示。分类器:它分析了输入数据的适应度函数给出更准确的结果。

提出的算法

该方法FMI_BBA包含两个基本阶段。在第一阶段,模糊互信息(FMI)方法用于确定由模糊Mamdani模型最重要的特性的基础上创建两个变量代表的输入数据的大小和数量的特性为每种类型的数据。三个变量被选为每个输入和输出的图片(低、中、高),然后这些输出之间确定的范围(10 - 50)为了确定的特性,将进入数量的MI技术,反过来,被发送到第二阶段第二阶段,英国银行家协会算法是用来减少并指定一定数量的特性,来自第一阶段通过随机同步向量[0,1],相对应的特征值1输入对应的分类函数和忽视特性值0。

F F = 0.2 * C + 0.8 * ( p ) , MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY = Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY = biLkVcLq = JHqpepeea0 = as0Fb9pgeaYRXxe9vr0 = vr0 = vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiaadAeacaWGgbGaeyypa0JaaGimaiaac6cacaaIYaGaaiOkaiaadoeacqGHRaWkcaaIWaGaaiOlaiaaiIdacaGGQaWaaeWaaeaadaWcaaqaaiaadghaaeaacaWGWbGaeyOeI0IaamyCaaaaaiaawIcacaGLPaaacaGGSaaaaa@45F6@

在哪里C分类模型的准确性,是长度的选择特性,p是功能的总数。

第二阶段的算法FMI_BBA关注英国银行家协会,具体特征选择的包装器。后通过FMI方法获取最重要的特性,这些特性引入BBA算法减少作为第二阶段(算法1)。一个特定数量的功能安排使用BBA算法采用和选择在最后使用朴素贝叶斯分类器分类操作。(图4)提出了一个提议FMI_BBA框架的详细流程图。

算法1:拟议中的FMI_ BBA,算法
1:设置初始参数:r, n, cc1, dd1, Max_iteration,
2:MI过滤技术应用于选择一个子集的特性取决于它们的重要性
3:设置初始速度和位置使用,Eq。(1)和(2)式。
4:评估数据集通过适应度函数和设置 X k MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY = Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY = biLkVcLq = JHqpepeea0 = as0Fb9pgeaYRXxe9vr0 = vr0 = vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaabaaaaaaaaapeGaamiwa8aadaqhaaWcbaWdbiaadMgaa8aabaWdbiaadUgaaaaaaa@392D@
5:我从1到Max_iteration设置迭代。
6:根据情商更新速度和位置数据。,(1)和(2)式。
7:当我≤Max_iteration停止满意并返回得到最好的全球性的解决方案。
8:选择BBA特性的特定子集的算法。
9:返回功能的好(选择功能)。


下载图片

图4:提出的架构FMI_BBA算法。

实验结果

建议算法FMI_BBA评估并与其他进化算法。

数据集

应用该算法对一群bigdata验证其效率解决分类问题的一种方法。表1说明了将该算法应用于从UCI获得一些数据存储库[22]。

表1:描述所使用的数据集。
数据集 #样品 #特性 目标类
卵巢 253年 15155年 2
Dlbcl 77年 7130年 2
评估标准

分类效率是衡量质量(SP),马修相关系数(MCC),分类精度(AC)和敏感(SE)这些指标定义如下:

年代 E = T P T P + F N × One hundred. % ( 14 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY = Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY = biLkVcLq = JHqpepeea0 = as0Fb9pgeaYRXxe9vr0 = vr0 = vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaabaaaaaaaaapeGaam4uaiaadweacqGH9aqpdaWcaaWdaeaapeGaamivaiaadcfaa8aabaWdbiaadsfacaWGqbGaey4kaSIaamOraiaad6eaaaGaey41aqRaaGymaiaaicdacaaIWaGaaiyjaiaacckacqGHMacVcqGHMacVcaGGOaGaaGymaiaaisdacaGGPaaaaa@4ADA@

年代 P = T N F P + T N × One hundred. % ( 15 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY = Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY = biLkVcLq = JHqpepeea0 = as0Fb9pgeaYRXxe9vr0 = vr0 = vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaabaaaaaaaaapeGaam4uaiaadcfacqGH9aqpdaWcaaWdaeaapeGaamivaiaad6eaa8aabaWdbiaadAeacaWGqbGaey4kaSIaamivaiaad6eaaaGaey41aqRaaGymaiaaicdacaaIWaGaaiyjaiaacckacqGHMacVcqGHMacVdaqadaWdaeaapeGaaGymaiaaiwdaaiaawIcacaGLPaaaaaa@4B33@

一个 C = T P + T N T P + F P + F N + T N × One hundred. % ( 16 ) MathType@MTEF@5@5@ + = feaaguart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY = Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY = biLkVcLq = JHqpepeea0 = as0Fb9pgeaYRXxe9vr0 = vr0 = vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaabaaaaaaaaapeGaamyqaiaadoeacqGH9aqpdaWcaaWdaeaapeGaamivaiaadcfacqGHRaWkcaWGubGaamOtaaWdaeaapeGaamivaiaadcfacqGHRaWkcaWGgbGaamiuaiabgUcaRiaadAeacaWGobGaey4kaSIaamivaiaad6eaaaGaey41aqRaaGymaiaaicdacaaIWaGaaiyjaiaacckacqGHMacVcqGHMacVcaGGOaGaaGymaiaaiAdacaGGPaaaaa@5266@

TP、TN、FP和FN真阳性的数量,真正的负面,假阳性和假阴性的混淆矩阵,分别,这些标准的值代表分类过程的强度以及它们之间的比例是直接的。

讨论和分析

相比,本文提出的算法与二进制遗传算法(BGA)和原算法(BBA)。

数据集分为30%作为我们的实验测试组,其余用作训练数据。20倍将获得最好的可靠ratingt表2,评价标准与其他进化算法。这表明不到总数的特征选择和分类算法的准确性比其他分类算法。

表2显示的数据对培训组和测试组实现最好的结果分类。例如,在白血病数据集,数据的准确性(AC)火车组代表97%,该算法FMI_BBA BBA的90%。在BGA和92%。

表2:分类算法的性能平均20多个部分(括号中的数字表示标准错误)。
数据集 方法 训练数据集 测试数据集
卵巢 FMI-BBA 18.2 (0.3071) 0.9768
(0.0591)
0.9965
(0.0195)
0.9559
(0.0455)
0.9725
(0.0257)
0.9044
(0.0958)
BBA 483.15
(0.3170)
0.6610
(0.0383)
0.6105
(0.0507)
0.8062
(0.0368)
0.3643
(0.0552)
0.7544
(0.0891)
BGA 399.2500
(0.3230)
0.8880
(0.0871)
0.9533
(0.1310)
0.8458
(0.1240)
0.9627
(0.1654)
0.9299
(0.0364)
Dlbcl FMI-BBA 14.2 (0.2608) 0.9721
(0.0358)
0.9256
(0.0745)
0.91769
(0.0812)
0.9346
(0.0419)
0.9711
(0.0824)
BBA 474年
(0.2721)
0.9048
(0.0416)
0.9148
(0.0547)
0.8880
(0.1030)
0.7205
(0.1284)
0.9640
(0.0448)
BGA 383.55
(0.3021)
0.9548
(0.248)
0.9658
(0.0258)
0.9320
(0.0403)
0.8992
(0.0541)
0.9366
(0.0096)
结论

本研究提出了一个BBA与FMI进化算法的分类性能取决于数据集的一个子集。朴素贝叶斯分类器是用于分类数据集获得所有算法。结果从FMI-BBA相比全局搜索和BGA在表2。与四个数据集的实验结果表明,该算法,FMI-BBA略有成就一个更好的分类与选择的基因。

引用
  1. 杨XS。一个新的metaheuristic bat-inspired算法。Nat Coop开发Optim。2010;65 - 74。
  2. Alhafedh MAA,卡西姆操作系统。两级基因选择在微阵列数据集使用模糊互信息和二进制粒子群优化。印度J法医Toxicol。2019;13:1162 - 1171。
  3. 卡西姆OS, Algamal ZY。特征选择使用粒子群文中针对逻辑回归模型。Chemom智能实验室系统。2018;182年。41-46。
  4. Jadidi Z, Muthukkumarasamy V, Sithirasenan E, Sheikhan m . flow的异常检测使用神经网络在2013年与GSA算法优化。IEEE 33国际会议分布式计算系统研讨会。2013;76 - 81。
  5. 陈W,徐W .蝙蝠混合多目标模糊投资组合优化算法与现实世界的约束。Int J模糊系统。2019;21日:291 - 307。
  6. 王Pourpanah F, Lim CP, X,谭CJ,尹浩然,Seera。模糊min-max和头脑风暴的混合模型优化为特征选择和数据分类。Neurocomputing。2019;333:440 - 451。
  7. 罗伊·D, PK, Banerjee t s二进制算法应用于解决MISO-Type PID-SSSC-Based负荷频率控制问题。伊朗J Sci抛光工艺。2019;43:323 - 342。
  8. 古普塔D, Arora J Agrawal U,卡纳德阿尔伯克基VHC。优化的二进制蝙蝠白细胞分类算法。测量。2019;143:180 - 190。
  9. Pebrianti D, Ann NQ Bayuaji L,阿卜杜拉•NRH Zain ZM评选,et al .扩展蝙蝠算法(EBA)作为一种改进的搜索优化算法。第十届国家技术研讨会于2018年水下系统技术。2019;229 - 237。
  10. Al-Azzawi科幻。稳定性和分岔的锅混沌系统通过使用Routh-Hurwitz和Gardan方法。数学:第一版。2012;219:1144 - 1152。
  11. Jayabarathi T, Raghunathan T, Gandomi啊,蝙蝠算法,变异和一些实际工程应用程序:一个回顾。产品表面算法和应用优化。施普林格。2018;313 - 330。
  12. 李G, Le c混合二进制蝙蝠算法与熵特征选择的方法。第四届国际会议上控制和机器人技术工程学(ICCRE)。2019;165 - 169。
  13. 香港WC,李兆瓦,耿J,张y小说混乱的蝙蝠算法预测浮动平台的复杂运动。:数学模型。2019;72:425 - 443。
  14. 这几年会PA, Tesmer M,佩雷斯CA, Zurada JM。归一化互信息的特征选择。IEEE反式神经网络。2009;20:189 - 201。PubMed:https://www.ncbi.nlm.nih.gov/pubmed/19150792
  15. Patel H,沙m .粗糙集特征选择使用蝙蝠算法。2016。
  16. Bennasar M,希克斯Y, Setchi r .特征选择使用联合互信息最大化。专家系统:2015;42:8520 - 8532。
  17. 杨H,穆迪j .基于联合互信息的特征选择。学报》国际研讨会上调查先进的智能数据分析。1999;22日至25日。
  18. 陈h .基于蝙蝠的分布式文本特征选择算法优化。10日IEEE国际会议上智能数据采集和先进的计算系统:技术和应用程序(IDAACS)。2019;1:75 - 80。
  19. Entesar,军刀啊,Al-Hayani w .杂交的遗传算法解决部分偏微分方程的同伦分析方法。
  20. Al-Thanoon NA,卡西姆OS, Algamal ZY。一个新的混合萤火虫算法和粒子群优化的调优参数估计处罚与化学计量学中的应用支持向量机。Chemom智能实验室系统。2019;184:142 - 152。
  21. Al-Thanoon NA,卡西姆OS, Algamal ZY。调优参数估计SCAD-support向量机用萤火虫算法应用在癌症基因选择和分类。第一版医学杂志。2018;103:262 - 268。PubMed:https://www.ncbi.nlm.nih.gov/pubmed/30399534
  22. 布莱克C,梅尔兹CJ。UCI机器学习数据库的存储库、部门的信息和计算机科学。加州大学欧文CA。1998。55。