当前位置: X-MOL 学术Knowl. Inf. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
可解释的表格数据生成
Knowledge and Information Systems ( IF 2.5 ) Pub Date : 2023-01-31 , DOI: 10.1007/s10115-023-01834-5
Yishou Zhang , Nayyar Zaidi , Jiahui Zhou , Gang Li

生成对抗网络 ( GAN ) 模型已成功应用于广泛的机器学习应用中,表格数据生成领域也不例外。值得注意的是,一些最先进的表格数据生成模型,如 CTGANTableGan、  MedGAN等都是基于GAN的楷模。尽管这些模型在对一系列数据集进行训练时在生成人工数据方面表现出色,但仍有很大的改进空间(和愿望)。更不用说现有的方法确实存在性能以外的一些弱点。例如,当前的方法仅关注模型的性能,而对模型的解释给予有限的重视。其次,当前的模型仅对原始特征进行操作,因此它们无法利用任何关于可在数据生成过程中使用的显式特征交互的先验知识。为了缓解上述两个限制,在这项工作中,我们提出了一种新颖的表格数据生成模型——G生成对抗 网络建模,灵感来自 朴素 贝叶斯和逻辑回归的关系( \({ { \texttt {GANBLR} } }\) ) 不仅解决了现有基于表格GAN的模型的解释限制,而且还提供了处理显式特征交互的能力. 通过对广泛的数据集进行广泛的评估,我们展示了 \({ { \texttt {GANBLR} } }\)与现有状态相比的卓越性能以及更好的可解释能力(合成生成过程中特征重要性的解释)最先进的表格数据生成模型。





"点击查看英文标题和摘要"

更新日期:2023-02-01
down
wechat
bug