当前位置: X-MOL 学术Appl. Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
EvoSplit:一种将多标签数据集拆分为不相交子集的进化方法
Applied Sciences ( IF 2.5 ) Pub Date : 2021-03-22 , DOI: 10.3390/app11062823
Francisco Florez-Revuelta

本文提出了一种新的进化方法EvoSplit,用于将多标签数据集分布为不相交的子集,以进行有监督的机器学习。当前,数据集提供者要么将数据集随机划分,要么使用迭代分层法,该方法旨在将原始数据集的标签(或标签对)分布保持为不同的子集。为了达到相同的目的,本文首先介绍了一种单目标进化方法,该方法试图获得一个分裂,从而最大程度地独立地分配这些分布之间的相似性。其次,提出了一种新的多目标进化算法,以同时考虑两个分布(标签和标签对)来最大化相似性。两种方法均使用众所周知的多标签数据集以及当前在计算机视觉和机器学习应用程序中使用的大图像数据集进行了验证。与采用不同度量的迭代分层相比,EvoSplit改进了数据集的拆分:标签分布,标签对分布,示例分布,具有零个正例的折叠和折叠标签对。



"点击查看英文标题和摘要"

更新日期:2021-03-22
down
wechat
bug