“其实我没有‘上过一天班’。”这位语出惊人的科学“痴人”就是中国科学院上海营养与健康研究所研究员李海鹏。以科研为乐,不觉“上班”之义的他实际上稳坐十余年基础研究“冷板凳”,并怀着对计算生物学的一腔热爱迎来“硕果”。
40年前,在云南省通海县一所小学内,全校唯一一台电脑Apple II周围围满了跃跃欲试的学生,其中便有李海鹏。这是李海鹏第一次接触计算机。“那时热爱的种子就已经悄悄埋在心里了。”他回忆道,遗憾的是小学毕业后,读中学的6年间再无缘得见这个稀罕物。
大学时,国产微机刚刚问世,身为生物系学生的李海鹏再一次触碰到了计算机。他一有机会就跑到隔壁计算机系“蹭”性能更好的386微机,就这样一路自学到了研究生。在中国科学院昆明动物研究所读研期间,李海鹏遇到了张亚平、许榕生以及符云新这3位对他产生关键影响的恩师。后来,从美国到德国,李海鹏辗转3所大学,先后跟随符云新、Wolfgang Stephan以及Thomas Wiehe教授度过了5年的博后时光。
李海鹏从国内外多位导师那里学习到了不同的优秀品质,并将这些精神融会贯通,总结了管理研究组的一套准则和方法。谦虚好学、淡泊名利、潜心研究、无私奉献都是他的处事原则,但在这其中,以爱国主义为底色的科学家精神是他认为最重要的品质。在得知当时的中国科学院上海生命科学研究院计算生物学研究所正在组建与自己所学相关的科研团队时,李海鹏选择回国,为祖国相关事业发展出一份力。
李海鹏钻研进化基因组学的两大核心概念——遗传变异和自然选择。这使他在利用与数学、计算机多学科交叉的方式“解码过去”的同时,能够通过“编码”在一定程度上预测未来。他长期致力于发展进化生物学新理论和计算生物学新方法的研究,从数学和计算视角解析与基础研究、社会生活相关的重要生物学问题。
2023年9月,李海鹏研究组与华东师范大学脑功能基因组学研究所潘逸萱研究组合作的研究成果在线发表于《科学》,创建了快速极小时间溯祖(FitCoal)新理论和方法,并发现人类祖先由于气候变化等原因曾经历严重的群体瓶颈,近乎灭绝。这项研究始于2013年,十年才磨成一剑。2015年,他们的研究陷入低谷,理论推导的方向一度走进死胡同,计算结果也有极大误差。
面对这样的困境,经过多次讨论,团队最终决定将所有代码删除,从头开始新的数学推导和编程。推倒重来,需要极大的勇气,而团队的坚持使他们最终攻克了技术难关,为后续研究奠定了坚实的科研基础。
2017年第三版代码完成后,是长达6年的优化与验证。经过对分析结果反复的交叉验证,李海鹏等人确认发现了一个重要的人类远古群体瓶颈,但依然缺乏古生物学证据。
在经过对风险的全盘考量后,2021年,李海鹏团队最终决定提前公布文章预印本,并向全世界提供FitCoal软件的下载服务。这个提前与同行公开交流的大胆决定,使他们次日就收到了合作意向反馈——意大利佛罗伦萨大学法比奥·迪·文森佐博士发邮件告知李海鹏,他们的发现与其化石考古学上的现象一致。于是,双方展开了近一年的合作与修改,于2022年4月将文章投寄给《科学》。
这一研究基于群体基因组公共数据,首次精确解析了百万年内人类远古群体数量变化历史,为抢占科技制高点发现新的基因靶点提供了精确的算法体系,为实现重大慢病防治的“关口前移”奠定了理论基础。而李海鹏并没有停下脚步,他带领团队聚焦100万年前至10万年前远古人类的物种形成与进化,研究远古群体瓶颈导致的现代人群整体2型糖尿病患病风险,并通过精准溯祖计算揭示肿瘤的演化。
他们将继续在基础研究领域解码过去,编码未来。