LOGO LOGO
科研方向
大数据

本研究方向围绕大数据技术与理论的热点问题,着重研究大数据基础理论、大数据处理、大数据管理与大数据分析等问题。主要包括:1)大数据的新型算法理论,主要研究设计严格亚线性复杂度分布式算法以及在并行分布式环境下对大数据处理问题难度的精细划分;2)大数据处理系统,侧重于新型软硬件架构上的系统优化,如内存计算、异构计算、流计算等;3)大数据管理系统,重点研究图计算与图数据库、知识管理、大数据管理查询等;4)大数据分析,主要针对大规模数据的有效机器学习算法的设计与实现,以及对海量数据的有效信息进行挖掘,并构建典型系统等。经过多年的研究积累,本方向研发了图数据处理系统(包括大规模RDF图数据库TripleBit、图数据处理系统PathGraph、多版本动态图存储系统Pensieve)、高维时序数据库系统ByteSeries、流计算系统PStream、Whale、流连接处理系统FastJoin、Simois、FJoin等、内存计算数据处理系统Mammoth、智能计算框架Capuchin、内存计算GC优化系统Deca、高性能计算机数据密集型应用高速缓冲系统SSDUP等,相关成果获得Computer杂志亮点技术推荐、湖北省优秀自然科学论文一等奖等同行认可,相关技术应用于字节跳动数据中心、神威海洋之光/太湖之光高性能计算机、南方航空、同济医院、中国武汉协和医院、华为公司大数据处理系统等平台或企业。

本研究方向得到了国家973计划、科技创新 2030 重大项目、国家科技支撑计划、科技部国际合作专项、宽带移动业务关键技术开放式研究课题、国家863计划、国家自然科学基金重点项目、科技部国家重点研发计划、教育部-中国移动科研基金、国家自然科学基金优秀青年科学基金、全国优博专项、湖北省科技条件平台、华为技术合作项目等重要科研项目的资助。本方向的部分论文发表在ASPLOS、SIGMOD、VLDB、SC、WWW、RTSS、AAAI、IJCAI、SOCC、ICS、IPDPS、ICDCS、ICNP、IWQoS、TOCS、CSUR、TPDS、TKDE、TC、TKDD、TBD、TSC等重要学术会议和期刊上,获得国际发明专利4项、国家发明专利40余项。


图数据库TripleBit

流处理系统Whale


智能计算框架Capuchin