当前位置:
X-MOL 学术
›
Syst. Biol.
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
Integrating Deep Learning Derived Morphological Traits and Molecular Data for Total-Evidence Phylogenetics: Lessons from Digitized Collections.
Systematic Biology ( IF 6.1 ) Pub Date : 2025-01-18 , DOI: 10.1093/sysbio/syae072
Roberta Hunt,José L Reyes-Hernández,Josh Jenkins Shaw,Alexey Solodovnikov,Kim Steenstrup Pedersen
Systematic Biology ( IF 6.1 ) Pub Date : 2025-01-18 , DOI: 10.1093/sysbio/syae072
Roberta Hunt,José L Reyes-Hernández,Josh Jenkins Shaw,Alexey Solodovnikov,Kim Steenstrup Pedersen
Deep learning has previously shown success in automatically generating morphological traits which carry a phylogenetic signal. In this paper we explore combining molecular data with deep learning derived morphological traits from images of pinned insects to generate total-evidence phylogenies and we reveal challenges. Deep learning derived morphological traits, while informative, underperform when used in isolation compared to molecular analyses. However, they can improve molecular results in total evidence settings. We use a dataset of rove beetle images to compare the effect of different dataset splits and deep metric loss functions on morphological and total evidence results. We find a slight preference for the cladistic dataset split and contrastive loss function. Additionally, we explore the effect of varying the number of genes used in inference and find that different gene combinations provide the best results when used on their own vs in total evidence analysis. Despite the promising nature of integrating deep learning techniques with molecular data, challenges remain regarding the strength of the phylogenetic signal and the resource demands of data acquisition. We suggest that future work focus on improved trait extraction and the development of disentangled networks to better interpret the derived traits, thus expanding the applicability of these methods in phylogenetic studies.
中文翻译:
整合深度学习衍生的形态学特征和分子数据以进行总证据系统发育学:数字化收藏的经验教训。
深度学习之前已经证明,它可以自动生成携带系统发育信号的形态特征。在本文中,我们探索了将分子数据与深度学习从固定昆虫图像中得出的形态特征相结合,以生成完全证据的系统发育,并揭示了挑战。深度学习衍生的形态学特征虽然信息量很大,但与分子分析相比,单独使用时表现不佳。然而,它们可以改善总证据设置中的分子结果。我们使用漫游甲虫图像数据集来比较不同数据集拆分和深度度量损失函数对形态学和总证据结果的影响。我们发现对分支数据集 split 和 contrastive loss function 略有偏好。此外,我们探讨了改变推理中使用的基因数量的影响,发现不同的基因组合在单独使用与整体证据分析相比提供最佳结果时。尽管将深度学习技术与分子数据相结合具有广阔的前景,但在系统发育信号的强度和数据采集的资源需求方面仍然存在挑战。我们建议未来的工作侧重于改进性状提取和解开网络的发展,以更好地解释衍生性状,从而扩大这些方法在系统发育研究中的适用性。
更新日期:2025-01-18
中文翻译:
整合深度学习衍生的形态学特征和分子数据以进行总证据系统发育学:数字化收藏的经验教训。
深度学习之前已经证明,它可以自动生成携带系统发育信号的形态特征。在本文中,我们探索了将分子数据与深度学习从固定昆虫图像中得出的形态特征相结合,以生成完全证据的系统发育,并揭示了挑战。深度学习衍生的形态学特征虽然信息量很大,但与分子分析相比,单独使用时表现不佳。然而,它们可以改善总证据设置中的分子结果。我们使用漫游甲虫图像数据集来比较不同数据集拆分和深度度量损失函数对形态学和总证据结果的影响。我们发现对分支数据集 split 和 contrastive loss function 略有偏好。此外,我们探讨了改变推理中使用的基因数量的影响,发现不同的基因组合在单独使用与整体证据分析相比提供最佳结果时。尽管将深度学习技术与分子数据相结合具有广阔的前景,但在系统发育信号的强度和数据采集的资源需求方面仍然存在挑战。我们建议未来的工作侧重于改进性状提取和解开网络的发展,以更好地解释衍生性状,从而扩大这些方法在系统发育研究中的适用性。