2023年9月,Kendall TJ, Jimenez-Ramos M, Turner F 等在Nature Medicine上发表的关于代谢功能障碍相关的脂肪肝病(MASLD)的文章(An integrated gene-to-outcome multimodal database for metabolic dysfunction-associated steatotic liver disease),不仅提供了如何研究MASLD的思路,还提供了全球第一个MASLD数据共享平台——SteatoSITE。
代谢功能障碍相关的脂肪肝病(MASLD)
非酒精性脂肪性肝病(NAFLD)和非酒精性脂肪性肝炎(NASH)被两度更名。第一次是建议NAFLD和NASH分别更名为代谢相关脂肪性肝病(metabolic dysfunction associated fatty liver disease,MAFLD)和代谢相关脂肪性肝炎(metabolic dysfunction associated steatohepatitis,MASH)。第二次则是2023年6月24日在欧洲肝脏研究学会年会上正式对外发布的《脂肪性肝病新命名的多学会的德尔菲共识》。 2023年发布的这项共识提出将脂肪变性肝病(SLD)作为涵盖脂肪变性的各种病因的总体术语,代谢功能障碍相关脂肪变性肝病(MASLD)替代NAFLD,没有代谢因素且没有已知病因的人被认为是隐源性SLD。在单纯MASLD之外,代谢和酒精相关脂肪变性肝病(MetALD)描述每周饮酒量较大的MASLD患者。
代谢功能障碍相关的脂肪肝病(MASLD),先前称为非酒精性脂肪肝病(NAFLD),是一个逐渐增加且被低估的全球公共卫生问题,影响超过四分之一的成年人(超过20亿人),并带来重大的健康和社会经济问题,它的特征是存在心脏代谢风险因素,如肥胖、2型糖尿病、高血压和血脂异常,并与心血管疾病、慢性肾脏疾病以及许多癌症的发病率和死亡率增加有关。值得注意的是,在过去的十年中,患有MASLD相关肝硬化需要肝移植的患者数量增加了十倍,贝叶斯建模预测到2040年全球患病率将惊人地达到55.7%。据2019年的数据显示,我国MASLD患者已超过3.1亿人。
MASLD的发病机制是复杂且多因素的。过多的脂质积聚是主要的原因,随后由病理驱动因子包括脂毒性和免疫介导的炎症产生可变的影响,而疾病的进展又受到遗传变异和肠道菌群失调等调节因素的增强或抑制。并非所有患有脂肪肝的人都会进展为不良事件或死亡,目前存在缺乏重要的预后生物标志物和尚无用于治疗MASLD的已批准药物,以改善临床上针对MASLD的护理途径和个性化治疗及用药指导。
SteatoSITE数据库 https://steatosite.com)
为了解决MASLD研究中存在的问题,并提供一个适用于在MASLD中开发精准医学策略的资源,作者建立了SteatoSITE。这是全球第一个MASLD研究的数据共享平台。SteatoSITE整合了来自苏格兰的940个病例的多模式多维度回顾性数据,包括对存档肝组织的定量组织病理评估、肝组织总RNA测序(RNA-seq)以及从电子健康记录和其他行政来源中提取的例行临床数据。SteatoSITE具有丰富的结果数据,包括了5.67百万天的临床随访,使得可以进行转化分析以阐明MASLD的发病机制,并加速潜在的预后生物标志物和治疗靶点的发现。
数据库提供病理学信息
每个病例的H&E染色和PSR染色切片的扫描由三名专业从事肝脏病理学的顾问病理学家之一进行评估。从H&E染色的切片中,给出了非酒精性脂肪肝病(NAFLD)活动分数(NAS),脂肪变性、活动性和纤维化(SAF)评分系统的组成部分以及对NASH的独立于分数的临床组织学诊断。从PSR染色的切片中,给出了非酒精性脂肪性肝病(NASH-CRN)和修改后的Ishak纤维化分期评分。图1c显示了NAS关键特征如脂肪变性等与NASH-CRN纤维化分数之间的关系。图1d显示了NASH-CRN纤维化程度与病人生存时间之间的关系。图1e显示了NASH-CRN纤维化程度与病人肝硬化失代偿的关联。这些结果都可在SteatoSITE中根据自己的研究需求复现。
图1:数据库搭建流程和样本病理信息的应用
数据库提供转录组信息
SteatoSITE队列中包括668例肝RNA-seq数据,包括538例活检、39例切取和130例切除。从生物库中检索了正常肝组织对照(n = 39),用于进行RNA-seq分析进行比较。 在对RNA测序数据进行变异检测时,作者还检测了影响MASLD进展最相关的SNPs,分别是基因PNPLA3、HSD17B13、TM6SF2和MBOAT7中的rs738409、rs72613567、rs58542926和rs641738。当样本根据纤维化分期分类时,作者发现在将F0/F1、F2、F3和F4的肝与正常肝对照样本进行比较时,分别有218、478、1,114和2,800个不同表达的蛋白编码基因,在所有阶段与对照组相比则有99个基因差异表达)。
KEGG富集分析表明,从F2阶段开始,与细胞外基质相关的通路呈富集状态,符合预期。值得注意的是,其他上调的通路与心肌病相关(q < 0.05)。相反,下调的基因呈现出与信号传导相关的通路富集,主要出现在早期疾病(F0/F1)阶段,而从F2到F4,脂肪酸代谢和过氧化物酶体通路呈富集状态(q < 0.05)。
除了纤维化程度,SteatoSITE提供根据NAS评分以及性别等分组的转录组信息分析,读者可自行根据需求在作者开发的开放式基因浏览器上(https://shiny.igc.ed.ac.uk/SteatoSITE_gene_explorer/)进行可视化分析。
数据库提供单细胞信息
为了确定MASLD疾病谱系中是否存在特定的致病细胞亚群,作者使用来自健康和肝硬化患者的完全注释的scRNA-seq参考数据集,通过对SteatoSITE数据库的RNA-seq数据进行解卷积,估计每个SteatoSITE样本中特定肝细胞类型的比例,并将其与组织病理学特征和患者结果相关联。
作者的研究表明,肝纤维化的关键调节因子——肝瘢痕相关巨噬细胞(SAMacs)与整个MASLD谱系中的肝纤维化阶段和脂肪肝活动呈正相关。相反,组织驻留巨噬细胞的比例在进展的纤维化阶段显著下降。在一个独立的MASLD组织学数据集(n = 43)中使用专门的肝脏多重免疫荧光分析验证了这些转录组学的发现,确认了肝脏HLA-DR+、CD9+、CD14+和SAMacs细胞数量与肝纤维化阶段呈显著正相关。解卷积分析还揭示了纤维化与瘢痕相关的间质细胞、肝动脉内皮细胞和淋巴内皮细胞比例之间存在统计学上显著的正相关关系,浆细胞的扩增也与进展的肝纤维化相关联。
通过对SteatoSITE数据库RNA-seq数据进行单细胞解卷积分析,肝脏中瘢痕相关的巨噬细胞、瘢痕相关的间质细胞、肝动脉内皮细胞、淋巴内皮细胞和浆细胞的比例增加与更高的死亡率和肝失代偿事件正相关。而血管平滑肌细胞和肝窦内皮细胞,则呈负相关。肝脏细胞组成的变化可能为MASLD患者提供关键的预测信息。
风险模型预测肝脏失代偿
SteatoSITE数据库还可提供预后模型开发。为了演示,作者使用了SteatoSITE RNA-seq数据和相关的临床结果,开发了一个新型的基于转录组的肝脏失代偿风险预测模型。
作为初始特征集,作者使用了在晚期(F3/F4)与早期(F0/F1)疾病阶段之间差异表达的1,127个蛋白编码基因(P<0.05,对数折叠变化(FC)≥1)。单变量Cox回归确定了与失代偿事件显著相关的955个不同评估基因(DEGs)(P<0.01)。作者进行了十次十折Lasso正则化Cox回归,并推导出所选基因的系数。最终预测肝脏失代偿的模型由15个基因的表达组成:MT1F、KCNH7、COL25A1、RASD2、CTGF、STC1、GDNF、PRRX1、FGF7、LCNL1、DPEP1、CHRDL2、LHX6、POU4F1和 CDH16。读者可在可视化浏览器上看到这几个基因在不同纤维化阶段的表达。
根据模型将患者分为高风险组和低风险组。有趣的是,风险分数较高的样本不仅具有较高的纤维化阶段,而且还具有较高的肝细胞球形变分数。使用ROC曲线评估模型在活检后特定时间的预测能力,1年、3年和5年的失代偿风险AUC值为86.24%,80.97%和83.26%。所有活检样本都可以使用模型分为高风险组和低风险组,同样的,其肝失代偿轨迹差异显著。
疾病进展的调节因子分析
SteatoSITE数据库还可提供疾病相关调控网络分析。调控子根据活性分为两大类群:在晚期纤维化中活性高且在早期阶段活性低的类群,以及呈相反模式的类群。作者研究表明,三个调控子AEBP1、THRB和BNC2调控的基因网络可能对MASLD疾病进展并发生失代偿事件起关键作用。
推断的AEBP1、THRB和BNC2调控子之间的关系,标注了每个靶基因的调控方向。AEBP1和BNC2的大多数靶基因呈正调控,而THRB对与AEBP1和BNC2共享的靶基因主要施加负调控。
考虑到THRB可能对促病核心靶基因具有抑制作用,并且因为THRB激动剂目前正在进行MASLD的临床试验,作者更详细地研究了THRB调控子的活性并作为示范。作者在进行活检之前没有发生肝脏失代偿的病例中,估计了调控子活性的差异,并检验了THRB调控子活性对失代偿事件的预测价值。THRB调控子差异活性排序图证实了在仅限于活检的子集中THRB调控子活性与疾病阶段之间的负相关关系,生存分析图表明较低的THRB调控子活性与肝脏失代偿有关。除了THRB外,读者也可根据自己感兴趣的调控因子在SteatoSITE数据库中进行相关分析。
SteatoSITE为MASLD研究提供了基础,其中包括MASLD病理信息、转录组信息、以及单细胞信息等多模态数据库。该资源可用于引导药物和生物标志物的开发,SteatoSITE还包含高分辨率的全玻片图像目录,可作为新型数字病理学算法的宝贵测试平台。
关于SteatoSITE数据库:
https://shiny.igc.ed.ac.uk/SteatoSITE_gene_explorer/
This app allows users to visualise the RNA-seq data in SteatoSITE. SteatoSITE is a retrospective multicentre national cohort of 940 patients, across the complete NAFLD spectrum, integrating quantitative digital pathology, hepatic bulk RNA-seq and 5.67 million days of longitudinal electronic health record follow-up into a secure, searchable platform to accelerate new biomedical discoveries in NAFLD. A total of 632 NAFLD-spectrum cases and 32 controls with successful sequencing are analysed here. NASH-CRN fibrosis stage is included as a factor.
For access to the full SteatoSITE resource, including rich clinical outcome annotation please visit https://steatosite.com/
Features
Visualise the data:
clustering (PCA plots, heatmaps)
group comparisons (scatterplots, volcano plots)
gene-level boxplots of expression values
NASH-CRN fibrosis stages: in patients with biopsies showing early disease (fibrosis stages F0 to F2), bridging fibrosis (stage F3) and cirrhosis (stage F4)
App Info
The app has been developed by Tim Kendall (University of Edinburgh), heavily based upon the START app developed by Jessica Minnier, Jiri Sklenar, Anthony Paul Barnes, and Jonathan Nelson (Oregon Health & Science University, Knight Cardiovascular Institute and School of Public Health, https://doi.org/10.1093/bioinformatics/btw624 ).
Kendall等人建立了SteatoSITE,这是世界上第一个专门致力于MASLD研究的数据共享平台,使用来自3个苏格兰国家卫生服务生物库的数据,包括940例具有详细临床、实验室和组织学数据的病例,涵盖超过567万天的临床随访。在队列中,55.4%为男性,44.6%为女性,总体平均BMI为31.3 kg/m²,32%被诊断为2型糖尿病。该团队在668例病例和39例对照中进行了肝脏大量RNA测序,分析了MASLD严重程度全谱系中的不同肝脏基因表达和细胞类型组成,旨在开发肝衰竭风险预测模型。
转录组分析识别了与MASLD进展相关的基因表达改变。在评估性别特异性差异时,发现女性MASLD患者的失调基因数量显著多于男性。有趣的是,大多数识别出的通路在两性中都是共同的,除了那些涉及胆汁酸、胆汁盐代谢和O-连接糖基化的通路,这些通路仅在男性中发现。
单细胞去卷积分析显示,增加的肝脏疤痕相关间充质、血浆、动脉和淋巴内皮细胞比例被认为可以预测更高的全因死亡率和失代偿事件,而更高比例的稳态肝脏驻留细胞类型,包括血管平滑肌细胞和肝窦内皮细胞,则具有保护作用。
Kendall等人随后开发了一个15基因的新型转录风险评分,用于预测肝衰竭,分别在预测1年、3年和5年失代偿事件风险的受试者工作特征曲线下面积达到86.24%、83.26%和80.97%。
最后,他们研究了与疾病进展相关的转录因子调控基因网络,称为调控子,确定甲状腺激素受体β(THRB)调控子活性是MASLD进展的关键抑制因子。使用THRB调控子活性截止值,团队能够在早期,纤维化0-1阶段,区分出有快速进展到失代偿事件高风险的个体。
这项研究的主要局限性在于研究人群的同质性,这挑战了发现的普遍性。目前,分析的成本和复杂性限制了其在临床的转化。尽管如此,Kendall等人已经展示了如何利用丰富的多模态疾病数据库结合最近的转录组发展,可以识别新的预后标志物和治疗靶点,为MASLD患者未来个性化方法提供了希望。
原文摘要:Abstract
Metabolic dysfunction-associated steatotic liver disease (MASLD) is the commonest cause of chronic liver disease worldwide and represents an unmet precision medicine challenge. We established a retrospective national cohort of 940 histologically defined patients (55.4% men, 44.6% women; median body mass index 31.3; 32% with type 2 diabetes) covering the complete MASLD severity spectrum, and created a secure, searchable, open resource (SteatoSITE). In 668 cases and 39 controls, we generated hepatic bulk RNA sequencing data and performed differential gene expression and pathway analysis, including exploration of gender-specific differences. A web-based gene browser was also developed. We integrated histopathological assessments, transcriptomic data and 5.67 million days of time-stamped longitudinal electronic health record data to define disease-stage-specific gene expression signatures, pathogenic hepatic cell subpopulations and master regulator networks associated with adverse outcomes in MASLD. We constructed a 15-gene transcriptional risk score to predict future hepatic decompensation events (area under the receiver operating characteristic curve 0.86, 0.81 and 0.83 for 1-, 3- and 5-year risk, respectively). Additionally, thyroid hormone receptor beta regulon activity was identified as a critical suppressor of disease progression. SteatoSITE supports rational biomarker and drug development and facilitates precision medicine approaches for patients with MASLD.
DOI: https://doi.org/10.1038/s41591-023-02602-2
参考文献:Kendall, T.J., Jimenez-Ramos, M., Turner, F. et al. An integrated gene-to-outcome multimodal database for metabolic dysfunction-associated steatotic liver disease. Nat Med 29, 2939–2953 (2023).