3342
当前位置: 首页   >  课题组新闻   >  课题组在医疗文本分类方面的研究成果发表在Journal of Supercomputing
课题组在医疗文本分类方面的研究成果发表在Journal of Supercomputing
发布时间:2023-09-01

文本分类是自然语言处理中的一个重要课题,随着社交网络的发展,许多有关医疗保健和医学的问答对充斥社交平台。 对医学文本进行挖掘和分类,为患者提供针对性的医疗服务具有重要的社会价值。 现有的文本分类算法只能处理简单语义文本,尤其是中文医学文本领域,文本结构复杂,包含大量医学术语和专业术语,患者难以理解。 我们提出了一种中文医学文本分类模型,使用基于 BERT 的中文文本编码器,通过 N-gram 表示(ZEN)和胶囊网络,其中表示特征使用 ZEN 模型并通过胶囊网络提取特征,我们还设计了一个 N-gram 医学词典增强医学文本表示。我们所提出的模型在3个公开数据集上的实验结果表现优秀,准确率等指标均优于基线模型。