当前位置:
X-MOL 学术
›
arXiv.cs.CL
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
RaceBERT -- 一种基于 Transformer 的模型,用于从名称预测种族
arXiv - CS - Computation and Language Pub Date : 2021-12-07 , DOI: arxiv-2112.03807 Prasanna Parasurama
arXiv - CS - Computation and Language Pub Date : 2021-12-07 , DOI: arxiv-2112.03807 Prasanna Parasurama
本文介绍了 RaceBERT——一种基于转换器的模型,用于从名称中的字符序列预测种族,以及随附的 Python 包。使用在美国佛罗里达州选民登记数据集上训练的基于转换器的模型,该模型预测姓名属于 5 个美国人口普查种族类别(白人、黑人、西班牙裔、亚洲和太平洋岛民、美洲印第安人和阿拉斯加原住民)的可能性。我在 Sood 和Laohaprapanon (2018) 的基础上,将他们的 LSTM 模型替换为基于转换器的模型(预训练的 BERT 模型和从头开始训练的 roBERTa 模型),并比较结果。据我所知,raceBERT 在使用名称进行种族预测方面取得了最先进的结果,平均 f1 得分为 0.86——比之前的最先进技术提高了 4.\1% , 并对非白人名称进行了 15-17\% 的改进。
"点击查看英文标题和摘要"
更新日期:2021-12-08
"点击查看英文标题和摘要"