当前位置:
X-MOL 学术
›
Biometrics
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
Operating characteristics of the rank-based inverse normal transformation for quantitative trait analysis in genome-wide association studies
Biometrics ( IF 1.4 ) Pub Date : 2020-01-13 , DOI: 10.1111/biom.13214
Zachary R McCaw 1 , Jacqueline M Lane 2 , Richa Saxena 2 , Susan Redline 3 , Xihong Lin 1, 4
Biometrics ( IF 1.4 ) Pub Date : 2020-01-13 , DOI: 10.1111/biom.13214
Zachary R McCaw 1 , Jacqueline M Lane 2 , Richa Saxena 2 , Susan Redline 3 , Xihong Lin 1, 4
Affiliation
Quantitative traits analyzed in Genome-Wide Association Studies (GWAS) are often non-normally distributed. For such traits, association tests based on standard linear regression are subject to reduced power and inflated type I error in finite samples. Applying the rank-based Inverse Normal Transformation (INT) to non-normally distributed traits has become common practice in GWAS. However, the different variations on INT-based association testing have not been formally defined, and guidance is lacking on when to use which approach. In this paper, we formally define and systematically compare the direct (D-INT) and indirect (I-INT) INT-based association tests. We discuss their assumptions, underlying generative models, and connections. We demonstrate that the relative powers of D-INT and I-INT depend on the underlying data generating process. Since neither approach is uniformly most powerful, we combine them into an adaptive omnibus test (O-INT). O-INT is robust to model misspecification, protects the type I error, and is well powered against a wide range of non-normally distributed traits. Extensive simulations were conducted to examine the finite sample operating characteristics of these tests. Our results demonstrate that, for non-normally distributed traits, INT-based tests outperform the standard untransformed association test (UAT), both in terms of power and type I error rate control. We apply the proposed methods to GWAS of spirometry traits in the UK Biobank. O-INT has been implemented in the R RNOmni, which is available on CRAN. This article is protected by copyright. All rights reserved.
中文翻译:
全基因组关联研究中数量性状分析的基于秩的逆正态变换的操作特征
在全基因组关联研究 (GWAS) 中分析的数量性状通常是非正态分布的。对于此类特征,基于标准线性回归的关联测试在有限样本中会降低功效并增加 I 型错误。将基于秩的逆正态变换 (INT) 应用于非正态分布特征已成为 GWAS 中的常见做法。然而,基于 INT 的关联测试的不同变体尚未正式定义,并且缺乏关于何时使用哪种方法的指导。在本文中,我们正式定义并系统地比较了直接 (D-INT) 和间接 (I-INT) 基于 INT 的关联测试。我们讨论他们的假设、潜在的生成模型和联系。我们证明了 D-INT 和 I-INT 的相对能力取决于底层数据生成过程。由于这两种方法都不是最强大的,我们将它们组合成一个自适应综合测试 (O-INT)。O-INT 对模型指定错误具有鲁棒性,可以保护 I 类错误,并且可以很好地应对各种非正态分布特征。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。我们将它们组合成一个自适应综合测试 (O-INT)。O-INT 对模型指定错误具有鲁棒性,可以保护 I 类错误,并且可以很好地应对各种非正态分布特征。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。我们将它们组合成一个自适应综合测试 (O-INT)。O-INT 对模型指定错误具有鲁棒性,可以保护 I 类错误,并且可以很好地应对各种非正态分布特征。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。并且对广泛的非正态分布特征有很好的作用。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。并且对广泛的非正态分布特征有很好的作用。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。基于 INT 的测试在功率和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。基于 INT 的测试在功率和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。
更新日期:2020-01-13
中文翻译:

全基因组关联研究中数量性状分析的基于秩的逆正态变换的操作特征
在全基因组关联研究 (GWAS) 中分析的数量性状通常是非正态分布的。对于此类特征,基于标准线性回归的关联测试在有限样本中会降低功效并增加 I 型错误。将基于秩的逆正态变换 (INT) 应用于非正态分布特征已成为 GWAS 中的常见做法。然而,基于 INT 的关联测试的不同变体尚未正式定义,并且缺乏关于何时使用哪种方法的指导。在本文中,我们正式定义并系统地比较了直接 (D-INT) 和间接 (I-INT) 基于 INT 的关联测试。我们讨论他们的假设、潜在的生成模型和联系。我们证明了 D-INT 和 I-INT 的相对能力取决于底层数据生成过程。由于这两种方法都不是最强大的,我们将它们组合成一个自适应综合测试 (O-INT)。O-INT 对模型指定错误具有鲁棒性,可以保护 I 类错误,并且可以很好地应对各种非正态分布特征。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。我们将它们组合成一个自适应综合测试 (O-INT)。O-INT 对模型指定错误具有鲁棒性,可以保护 I 类错误,并且可以很好地应对各种非正态分布特征。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。我们将它们组合成一个自适应综合测试 (O-INT)。O-INT 对模型指定错误具有鲁棒性,可以保护 I 类错误,并且可以很好地应对各种非正态分布特征。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。并且对广泛的非正态分布特征有很好的作用。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。并且对广泛的非正态分布特征有很好的作用。进行了广泛的模拟以检查这些测试的有限样本操作特性。我们的结果表明,对于非正态分布的特征,基于 INT 的测试在功效和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。基于 INT 的测试在功率和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。基于 INT 的测试在功率和 I 类错误率控制方面都优于标准的未转换关联测试 (UAT)。我们将所提出的方法应用于英国生物银行肺量测定特征的 GWAS。O-INT 已在 R RNOmni 中实现,可在 CRAN 上使用。本文受版权保护。版权所有。