当前位置: X-MOL 学术arXiv.cs.LG › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
使用扩散模型生成的具有混合类型变量的综合健康相关纵向数据
arXiv - CS - Machine Learning Pub Date : 2023-03-22 , DOI: arxiv-2303.12281
Nicholas I-Hsien Kuo, Louisa Jorm, Sebastiano Barbieri

本文介绍了一种使用扩散概率模型 (DPM) 模拟电子健康记录 (EHR) 的新方法。具体来说,我们展示了 DPM 在合成纵向 EHR 方面的有效性,这些纵向 EHR 捕获混合类型的变量,包括数字、二进制和分类变量。据我们所知,这是首次将 DPM 用于此目的。我们将我们的 DPM 模拟数据集与之前基于生成对抗网络 (GAN) 的最先进结果进行了比较,用于两种临床应用:急性低血压和人类免疫缺陷病毒 (ART for HIV)。鉴于之前对 DPM 缺乏类似的研究,我们工作的核心组成部分涉及探索在广泛的方面使用 DPM 的优势和注意事项。除了评估合成数据集的真实性,我们还在合成数据上训练了强化学习 (RL) 代理,以评估它们在支持下游机器学习模型开发方面的效用。最后,我们估计我们的 DPM 模拟数据集是安全的,并且对公众访问的患者暴露风险较低。



"点击查看英文标题和摘要"

更新日期:2023-03-23
down
wechat
bug