非平衡数据处理方法在癫痫发作检测中的应用-自然科学版

当前位置：首页 > 文章导读 > 自然科学版

非平衡数据处理方法在癫痫发作检测中的应用

野梅娜,李艳艳,杨陈军,张瑞

西北大学医学大数据研究中心

全文: PDF

摘要：

非平衡数据集是指数据集中的某类样本数量远大于其他样本的数量。对于此类数据，类分布的不平衡会直接导致很多分类算法的失效。文中基于K-means聚类，Silhouette 指标和M．近邻下采样提出一种新的数据平衡方法（K．S．M）。该方法首先用K-means算法对多数类样本进行多次聚类并选取最优聚类个数，然后采用M．近邻下采样对聚类后的数据进行采样，将采样后的点最终构成平衡数据，并对得到的平衡数据进行癫痫性发作的自动检测。实验结果表明，文中所提方法可以很好地处理非平衡数据，减少数据信息损失，同时可以提高非平衡数据分类的有效性。

关键词： 非平衡数据集；Silhouette指标；K-means算法；M．近邻下采样；癫痫性发作；癫痫脑电信号

发表年限: 2016年

发表期号: 第6期

上一篇：癫痫脑电的特征提取方法综述

下一篇：AI+化学：从自动化迈向智能化探索