生命学院郭安源团队在基因表达数据分析方面取得多项进展
发布时间:2020.06.12

来源:生命学院 编辑:郭雨辰 浏览次数:

  新闻网讯 6月8日,我校生命学院郭安源教授团队在生物信息学一区杂志Briefings in Bioinformatics发表了题为CCLA:an accurate method and web server for cancer cell line authentication using gene expression profiles的科研成果。该研究首次报道了一种基于基因表达谱数据(芯片或转录组)鉴定癌症细胞系的新方法CCLA,并构建了方便易用的网站 (http://bioinfo.life.hust.edu.cn/web/CCLA/)供研究者使用。郭安源团队博士后张琼为第一作者,博士生罗妹为共同第一作者,郭安源为通讯作者。


  癌症细胞系(CCL)是生命科学和医学研究中至关重要和不可缺少的材料。但是,CCL被污染或用错的情况常有发生,导致错误的发现,阻碍相关研究进展。研究领域内已认识到该问题,要求研究者在成果发表前对涉及的CCL进行鉴定,如NIH,Nature,Science等多种期刊都要求提供细胞系的鉴定证据。迄今为止,鉴定CCL的方法都是基于DNA多态性信息,如检测特定的短串联重复序列(STR),还没有可以直接应用基因表达数据鉴定CCL的方法。而开发基于基因表达数据鉴定CCL的方法将可以避免原细胞株无法获取、额外做STR鉴定的时间和费用等弊端,并促进目前大规模的CCL表达谱数据的重利用。


  不同的CCL有特异的表达谱信息,可以用于CCL鉴定。基于该想法,郭安源团队从CCL基因表达数据中提取CCL的特征基因集,对CCLE和GDSC数据库中的1291种CCL进行单样本基因集富集分析(ssGSEA),并结合机器学习模型来鉴定CCL。评估结果表明,CCLA方法可快速而准确地对CCL进行鉴定,并有卓越的速度和精度优势,其中芯片和RNA-Seq验证数据(总共719个样本)的准确度分别为96.58%和92.15%。


  近半年来,郭安源团队在基因表达数据分析方法学及其应用方面取得了多项进展。2019年12月,基于自主开发的特异表达基因分析方法SEGtool,团队系统挖掘了多种癌症中的特异表达基因及其可能的癌症诊断标志物,发表在Briefings in Bioinformatics。2020年1月,Advanced Science杂志在线发表了团队开发的ImmuCellAI方法,这是一种可以从混合转录组测序样本中准确预测免疫细胞类型特别是T细胞亚型及其含量的方法,其独特的优势是能预测18种T细胞亚型,并且对大多数免疫细胞含量的预测准确度比之前方法有了显著的提高。2020年4月,Bioinformatics杂志发表了团队开发的FFLtool方法,这是一个在线分析人类转录因子与miRNA前馈环(Feed forward loop)调控模块的方法,同时也集成展示了TCGA不同癌症中的转录因子与miRNA前馈环调控模块。2020年5月,Bioinformatics杂志在线发表了团队开发的CATT方法,这是一个超灵敏的在高通量测序数据中检测T细胞受体CDR3序列的方法,该方法可以适用于多种数据类型,包括混样和单细胞的转录组及TCR测序数据等。这些工具和方法都公开在郭安源实验室网站(http://bioinfo.life.hust.edu.cn/)上供研究人员使用。在这些工作中,张琼博士后均发挥了重要作用,是文章的主要作者之一。


  得益于国家自然科学基金委优青和面上项目的长期支持,以及科技部项目、中国博士后基金和学校学院的支持,郭安源团队长期专注于癌症基因表达数据分析中的数据库、方法和应用研究,近5年来以通讯作者在Advanced Science、Nucleic Acids Research、Cancer Research、Cell Reports、Theranostics、Briefings in Bioinformatics和Bioinformatics等权威期刊发表论文30多篇,包括多篇ESI高被引论文。

学校微博
单周单篇点击量排名