科研进展

当前位置: 首页  >  科学研究  >  正文

【科研动态】生命学院人工智能生物学中心(筹)取得突破性进展

时间:2021-03-16     浏览次数:

32日,Cell Metabolism上线了人工智能生物学(AIBIO)中心陈卫华项目组的研究论文。至此,AIBIO团队在短短两年内,在Cell Metabolism (影响引子IF21.56)、Immunity (IF22.553)Nature Biomedical EngineeringIF18.95)、Gut (IF: 19.8) Science Translational MedicineIF16.3)等国际著名期刊上发表重要论文。

人工智能生物学中心”(Center for Artificial Intelligence Biology)2019年筹立,专注于人工智能生物学新方法研究和在生命科学重要领域的应用,研究方向包括多模态数据大整合、肿瘤免疫、衰老、新冠诊断、蛋白结构预测和微生物组等。自2019年筹建以来,已发表多篇以18luck新利电竞 为第一单位的高质量研究论文,其中IF>202篇,15-204篇,10-1514篇。团队多项工作于20192020连续两年入选中国生物信息学十大进展,包括宁康项目组的《基于人工智能网络的微生物组蛋白结构预测》(2019)和薛宇项目组的《新冠肺炎人工智能诊断系统—HUST-19》(2020)。

生命是高度复杂的系统。生命体系的相互作用和调控往往是多因素、多层次协同作用的结果,这些因素之间存在一对多、多对一和多对多的关系。以细胞生物学、生物物理学、生物化学和分子生物学等方法为基础的现代生物学,主要是在微观分子层面上探讨生物分子组成及其特定时空状态与宏观表型之间的相关性和线性因果关系。

近年来,随着前沿人工智能技术如深度学习、图像识别、视频分析和自然语言处理等方面的迅猛发展,基于大数据和强监督的机器学习方法已经在传统人工智能领域取得巨大进展,并逐渐渗透到生物学领域。作为新兴的前沿交叉学科,人工智能生物学(Artificial intelligence biology, AIBIO)旨在设计、发展和应用面向生物学数据的新型机器学习理论与方法,重点解决人工智能生物学中的高维度、小样本、弱标记、变分布、强交互的核心难点。对现代分子生物学和细胞生物学中的一些热点的问题,进行人工智能生物学和方法学的科学探索。随着AI在生命科学当中的进一步应用,预计未来几年将会有更多更高质量的研究结果出现。

AIBIO团队目前由薛宇、郭安源、宁康、陈卫华四位教授组成;2016年入选我校学术前沿青年团队2019年底筹建人工智能生物学中心。团队代表性成果简介如下。

  1. Open resource of clinical data from patients with pneumonia for the prediction of COVID-19 outcomes via deep learning, Nat Biomed Eng, 2020, 4, 1197-1207

    研究组:薛宇教授

    亮点:来自新型冠状病毒肺炎患者的数据对于指导临床决策,加深对该病毒疾病的了解以及进行诊断建模至关重要。在这里,我们描述了一种开放资源,其中包含来自1,521例肺炎(包括新型冠状病毒肺炎)患者的数据,该数据包括胸部计算机断层扫描(CT)图像,130种临床特征(来自血液和尿液样本的生化和细胞分析)和实验室确诊的严重急性呼吸系统综合症冠状病毒2(SARS-CoV-2)的临床状况。我们展示了数据库的实用性通过使用深度学习算法预测COVID-19发病情况和死亡风险,该算法是根据来自1,170例患者和19,685例人工标记的CT切片的数据训练而成的。在351名患者的独立验证队列中,该算法区分阴性,轻度和严重病例的受试者工作特征曲线下的面积分别为0.944、0.860和0.884。该开放数据库可进一步用于诊断和管理COVID-19的患者。该成果入选2020年“中国生物信息学十大进展”。

     

  2. Plasma Proteomics Identify Biomarkers and Pathogenesis of COVID-19, Immunity, 2020, 53, 1108-1122.e5

    研究组:薛宇教授

    亮点:新型冠状病毒疾病2019(COVID-19)大流行是全球性的公共卫生危机。然而,关于COVID-19的发病机理和生物标志物知之甚少。在这里,我们通过对一组COVID-19患者(包括非幸存者和从轻症或重症中恢复的幸存者)队列进行血浆蛋白质组学分析来展现宿主对COVID-19的反应,并发现了许多与COVID-19相关的血浆蛋白改变。我们开发了一种基于机器学习的方法识别了11种蛋白质生物标志物以及通过一个独立的队列对一组生物标志物组合进行了验证,并准确区分和预测了COVID-19结局。一些生物标志物已在较大队列上通过酶联免疫吸附测定(ELISA)进行了进一步验证。这些显着改变的蛋白质(包括生物标志物)介导病理生理通路,例如免疫或炎性反应,血小板脱颗粒和凝血以及新陈代谢,可能会有助于发病机理。我们的发现提供了有关COVID-19生物标记物的有用知识,并阐明了COVID-19的发病机理和潜在的治疗靶标。

     

  3. Extracellular vesicles deposit PCNA to rejuvenate aged bone marrow–derived mesenchymal stem cells and slow age-related degeneration. Science Translational Medicine 2021,13(578), eaaz8697

    研究组:郭安源教授

    亮点:发现脐带MSCs细胞(UC-MSCs)来源的细胞外囊泡(UC-EVs)可以逆转成人骨髓MSCs(AB-MSCs)的衰老,显著增强后者成骨和损伤修复能力;特别是体内应用UC-EVs可明显延缓自然衰老小鼠的衰老,对骨骼、肾脏以及血管平滑肌等多种组织器官的退行性变有显著影响。通过测序和生物信息学比较分析发现,UC-EVs中富含细胞周期、DNA复制和修复相关的“年轻信息”,这些UC-EVs可以显著提高衰老MSCs的增殖、自我更新和DNA复制能力;通过转录组数据的生物信息分析发现,富含“年轻信息”的UC-EVs可以使衰老细胞在基因表达上呈现从衰老向年轻切换的转变模式,其中PCNA可能是关键的效应分子,UC-EVs的逆转效应至少部分是通过水平传递PCNA实现。

     

  4. Fueling ab initio folding with marine microbiome enables structure and function predictions of new protein families. Genome Biology, 2019, 20, 229

    研究组:宁康教授

    亮点:利用将近2TB的微生物组大数据,利用智能聚类等方法鉴定出了超过9千万的非冗余基因和超过3万个微生物物种。结合国际顶尖的蛋白质结构预测方法,辅助预测出了27个之前没有任何结构信息的蛋白质结构。进一步利用人工神经网络等人工智能数据挖掘方法,对预测结果及其所蕴含的生物学意义进行了解读。结果显示,微生物组的特征(结构组成与功能分布)和预测出的蛋白结构之间存在着很强的关联性;基于结构的蛋白功能预测结果也显示,预测出的特定蛋白家族功能如光合作用只在特定环境中分布。该研究结果提供了一种通过利用微生物组提高蛋白质结构和功能建模能力的新途径,特别是对于缺乏已知同源模板的蛋白质靶标。成果被评为2019年度“中国生物信息学十大应用”。

     

  5. Treatment regimens may compromise gut-microbiome derived signatures for liver cirrhosis, Cell Metabolism, 2021, 33, 455-456

    研究组:陈卫华教授

    亮点:利用机器学习中的随机森林算法构建了基于肠道菌群数据的肝硬化诊断模型,并探讨了肝病治疗中常用药物质子泵抑制剂(Proton Pump Inhibitor, PPI)对肠道微生物的影响。结果显示,机制学习模型可以很好的区分肝硬化与对照人群,但其中起重要作用的菌可能受PPI药物的影响。PPI在抑制胃酸分泌方面十分有效,除了治疗肝硬化,也应用于其它各种胃肠道疾病和糖尿病等代谢疾病,约10%~20%的健康人群也在使用。我们的研究结果发现,PPI的使用在各种疾病中都会引起一些口腔源细菌的相对丰度显著增加,包括Streptococcus和Veillonella。PPI使用会有一些长期的副作用,这些菌的增加可能与PPI的副作用有关,包括加速肝病恶化。此项研究为从肠道菌群的角度诊断、干预肝病提供了理论基础。