作为一名高校教授,常珊在 2020 年决定,担任 AI 制药公司普美瑞生物的 CTO 。
那一年,他 38 岁,巧合的是当年国内成立了 38 家这样的公司。这是一种偶然,但也有不少机缘,因为像他这样具有高校或研究院背景的公司技术负责人,几乎占据了 AI 制药的半壁江山。后来业界约定俗成,把 2020 年称作“中国 AI 制药元年”。
那时常珊早已是江苏理工学院的一名教授,还担任该校生物信息与医药工程研究所的所长,教研和行政两重职务,让他那几年尤其拼命,“仍像学生一样,每天早早去实验室,工作到很晚。”
在旁人看来,常珊是个时间再难挤出一丝的人,但他自己不这么觉得,还会在每两年一届的 CASP 竞赛开启之时,拿出扎实的三个月时间专注于此。
CASP 是被誉为“生物界的奥林匹克竞”的全球性赛事,比拼的是对蛋白质三维结构的预测,2020 年由谷歌旗下DeepMind 开发的名为 "AlphaFold 2" 的 AI 系统,就是在此夺冠扬名立万。因此,对于想在生命科学领域建立声名,跻身全球前沿科研梯队的初创公司和高校学者来说,此赛是一条出路。
可想而知,这非常消耗体力。常珊说到,“CASP 的压力非常大,要求在三个月内完成上百道题目,如果是其他竞赛我能边做题目边进行学位论文研究,但 CASP 要求参赛者全心投入,掐着表计算时间,每天都要提交结果,处理新题目。”
2022 年底,常珊在 CASP 15 中拿下“蛋白/RNA-配体复合物结构预测”赛道的冠军。
他笑着承认了,紧接着又低调表示,这只是一个小领域的评估,“这里我们还可以这样优化...这个技术可以这样落地...”但变化还是有的,赛后请他做报告的更多了,他的研究有人关注了,专程来请教他干湿实验结合的人也多了,这是常珊成立独立实验室以来的重要时刻--他被注意到了。
由于常珊夺冠的这一赛道与药物设计紧密,不久后,人民邮电出版社找到常珊,提议由他编写一本书籍,名字就叫做《人工智能辅助药物设计》。要求只有一个:通俗易懂,还要反映最新的技术应用。
常珊直言,即便早在博士时参与过导师编写的专著,但当时更多是呈现核心研究成果,现在则是给相关从业人员、相关专业的学生做参考,经验不可直接复制。经过两年筹备,这本新书在今年六月正式面市。常珊感慨,这段工作终于告一段落,又有精力投入到今年的 CASP 16 竞赛中。
在与我们的交谈中,他多次用平稳的声音表示,参赛是一件严肃的事,“这相当于一种‘’压力测试‘,考验你是否能在短时间内快速适应问题,并提出解决方案。”
常珊做了一个形象的比较:通常我们博士期间做一个项目,如果没有时间限制,可能花上两年也未必能完成。但在竞赛环境里,可能你会在一周或两周内解决一个实际问题。
为了迎接今年的竞赛,常珊早在赛前半个月就做了复盘,一是对程序进行了彻底的审查和整理,二是引入了更自动化的处理流程,降低人为错误并提效。
和他组队的人说,常珊做什么事都是这样提早安排。而常珊也想知道,他还能窥探多少未知。
近日,至顶科技&《码客人生》对话常珊教授,探讨了他持续参赛的动力所在、新书的创作过程,并对他过往二十余年的学术经历做了回顾。
以下是对话内容(经编辑):
▋ 01 AI 正在改变生物学和药学
《码客人生》:首先请您介绍下《人工智能辅助药物设计》这本书的创作初衷。
常珊:这本书是与同校的谢良旭博士联手打造的成果。
最初人民邮电出版社找到我,提议编写一本AI辅助药物设计的书籍,我立刻想到与在该领域经验丰富的谢博士合作,我们迅速组建了一支研究生团队,并明确分工。
首先,书中内容要立足于基础,旨在作为教材。
因为我们发现,许多学生急需一本基础扎实的教材来打牢基础,如果缺乏必要的计算机或Python编程知识,他们难以跟上专业应用的深入讨论。因此,我们与人民邮电出版社一道,力求以浅显易懂的方式呈现内容,降低入门难度,吸引更广泛的读者群体,帮助他们轻松迈入AI辅助药物设计的世界。
其次,书中内容要反映最新的技术应用,覆盖行业内实际应用案例。
在我们着手编写这本新书之前,市面上虽有相关书籍,如上海药物研究所出版的书籍,以及北大徐筱杰教授早期的作品,但这些大多出版于2010年以前,对当下最新人工智能技术的介绍相对较少。特别是在2020年AlphaFold技术取得突破后,AI与药物设计的结合变得热门,市场迫切需要反映这一领域最新进展的书籍。
《码客人生》:那么书籍结构是怎样的,创作周期多久?
常珊:这本书是从2022年开始规划,大约花了一年多的时间编写完成。我们原计划在2023年完成并出版这本书的,但似乎时间上有些仓促,我们不得不将出版计划推迟到了2024年。
书的前几章主要是介绍Python的基础知识,随后的章节则深入到药物设计的具体应用,包括分子生成、结构预测、分子对接等专业领域,通过代码示例让读者更深入地理解。
《码客人生》:您和谢良旭博士在专业背景上有哪些异同,你们合作著书的优势是什么?
常珊:我们各有所长。我的专长是计算数学和算法开发;谢博士是化学出身,硕博士研究都集中在计算化学和药物设计领域,特别是在应用场景方面。我们这样的组合,较好地融合了AI与药物设计。
常珊、谢良旭
这确实是我们首次尝试合作的书籍。
自2020年AlphaFold技术在生命科学领域引起轰动以来,虽然当时它在药物设计方面的应用尚未成熟(或者说在小分子预测方面还没有完全发挥其功能),主要集中在蛋白质结构预测上,但我们已开始关注这一趋势。
到了2022年,药物设计和结构预测都成为了CASP竞赛的热点。我们团队在CASP15药物设计竞赛中获得第一名,这不仅证明了我们预测方法的准确性,也为我们提供了深入洞悉行业的机会。
因此,我们与出版社的合作,可谓恰逢其时,我们成为了最早策划此类专业书籍的团队之一。
《码客人生》:您之前是否参与过其他书籍的编写?
常珊:我参与过大概4本书的编写,但都是以合作者的身份,并非主编。
其中一些书籍是我博士导师是王存新教授(北京工业大学)所主导的,他提议编写专著来总结我们实验室的研究成果,书名是《蛋白质模拟—原理、发展和应用》。
王老师还出版了“新生物学丛书”这套丛书中的另一本书《蛋白质模拟的多尺度方法》,是国外教材的中文译作。
还有是成都大学胡建平教授编写的《计算机化学实践基础教程》和《计算机辅助药物设计理论及应用》,我在其中负责了代码编写的部分章节。
这些书籍记录了我们博士期间的科研探索和对其他学者工作的翻译整理,专注于专业领域,不涉及基础内容,对普通读者而言可能较难理解。
与以往专著不同,此次编写《人工智能辅助药物设计》这本书时,我们特别注重内容的通俗易懂,同时不失深度和准确性,力求让复杂的知识变得易于消化。
《码客人生》:今年AI制药的市场情绪有些低迷,AI至今还没有成功研发出一款新药上市。然而现在大家又非常看好AI,将技术融入到药物开发的各个环节。您是怎么看待这种矛盾的?
常珊:我认为这可能与药物研发的长周期性有关。尽管AI可以加速早期分子设计,但后续的动物体内实验和临床试验环节不可或缺,且AI无法替代,这是AI在药物研发中的限制之一。
同时我们也要认清楚,AI在技术能力和应用场景上仍在探索中,并非万能。
例如,在视频生成领域,尽管AI技术如Sora令人印象深刻,但转化为商业产品还需时间。
同样,在药物设计中,AI虽能解决初步问题如构效关系预测、毒性评估,但整体药物研发过程仍需大量实验和验证,这些AI暂时无法替代。而且药物最终是要被人体摄入的,其安全性和有效性会受到严格的审查和评估。所以,AI在解决单一问题上表现出色,但要提供一个整体的解决方案却难。
以AlphaFold为例,自问世以来,尽管许多人联名要求公开源码,但开发者出于商业保护的考虑并未公开。即便如此,一些制药公司如礼来和诺华,已经看到了AlphaFold在药物设计方面的潜力,并与之签订了合作协议。这表明业界对AI在药物设计领域的应用充满期待。
但同时我们也要认识到,AI应与人类专家的知识经验结合,共同推动药物研发,而非单独行动。换句话说,这也是我们编写此书的原因,让更多人生物医药的从业人员可以应用AI这个工具。
▋ 02 CASP竞赛的十年老兵
《码客人生》:今年5月,AlphaFold 3亮相,您在朋友圈提到“这个时间点推出,意味着今年参加CASP竞赛的难度更高了。”为什么会有这样的感受?
常珊:实际上,每两年一度的CASP竞赛不仅是生命科学界的一场盛会,也是我们一窥AlphaFold功能演进的重要窗口。
AlphaFold 1,由DeepMind精心打造的革命性AI程序,于2018年CASP 13上首次亮相,便以卓越的表现在98支参赛队伍中脱颖而出,荣获第一。
继此之后,AlphaFold 2在2020年发布,并在同年11月30日的CASP 14中刷新了历史,其预测的蛋白质结构精度已经达到可与实验结果比较的程度,标志着蛋白质结构预测的新时代。
直至2024年5月8日,AlphaFold 3在《Nature》杂志上隆重发布,它不仅继承了前代的优势,更在预测精度和生物分子类型的覆盖面上实现了飞跃。
用一句话来说,AlphaFold 1主要解决了蛋白质单体结构预测的基础问题,而AlphaFold 2则引入了Transformer模型,进一步提升了预测的准确性。AlphaFold 3则解决了前代的局限,不仅能够处理单体蛋白质,还能精准预测多体蛋白质结构,甚至是小分子和RNA。
简而言之,AlphaFold 3不仅拓宽了预测范围,提高了精度,更激发了人们对其在药物设计领域应用的无限遐想。
尤为引人注目的是,AlphaFold 3的发布恰逢CASP 16之前,甚至于DeepMind在2023年11月就已透露AlphaFold 3将能预测多种分子间的相互作用,这似乎预示了组委会的前瞻性布局,为竞赛增添了更多悬念,使得这场科学竞技更加激动人心。
要知道,2022年的CASP 15新增的Ligand和RNA预测赛道,无疑是对2020年发布的AlphaFold 2的全新挑战。尽管AlphaFold 2并未参加CASP 15竞赛。但今年CASP组委会和DeepMind看来都做了一些准备。
《码客人生》:今年的CASP 16,组委会增加了什么难度呢?
常珊:第一大难点:比例未知的情况下预测蛋白质和RNA的组合结构。
目前AlphaFold 3具备预测蛋白质与RNA组合结构的能力。若A代表蛋白质,B代表RNA,你自然能够预测A与B结合后的形态,这似乎顺理成章。
然而,现实情况远比这复杂。我们只知道存在A链和B链的若干条,却不清楚它们的确切比例。可能是2A+3B,1A+1B,又或是3A+5B等组合,这使得已知条件显得有些不足,AlphaFold 3能否直接预测出来?
这显然是非常困难的。因为如果给定足够的输入,AlphaFold 3是能够预测出来的,但现在输入的具体组合不知道,这就增加了难度。
显然,若输入条件充分,AlphaFold 3尚能应对,但在具体组合未知的情况下,难度便陡然上升。若参赛者在实际比赛中,面对如3A+4B的真实组合,却预测出了其他比例,那结果便谬以千里。即便预测的细节再精确,一旦组合错误,一切便前功尽弃。这无疑增加了竞赛的难度,组委会的出题策略确实颇具挑战性。
在自然界,蛋白质或分子的组合遵循一定规律,但这些规律往往过去的算法暂时还没考虑这一类问题。算法或许能根据提供的确切数量和组合方式预测结构,但若连这些基本信息都不全,却要求算法自行组合、推测比例,难度便成倍增加。
第二大难点:AlphaFold 3在预测分子间相互作用的基础上,暂时还未评估这些分子的亲和力,尤其是在众多候选分子中识别出最强结合分子的能力。
具体来说,在药物设计领域,现实场景更为复杂。CASP组委会不仅希望算法能预测数百个分子的结合姿态——AlphaFold 3在这方面已有所成就——更关键的是,我们想知晓哪些分子的亲和力更强?哪些更可能成为有效的药物?哪些与药物靶点的结合最为紧密?
但这有可能不在AlphaFold 3的训练数据范围。因此,AlphaFold 3是否参与今年的竞赛,以及它如何应对这些挑战,成为了一个值得关注的问题。如果它选择参赛,那么必须找到有效的方法来攻克这些难题。
《码客人生》:总体来说,今年的竞赛与往年有哪些不同?已经有人指出,今年的预测目标主要集中在核酸结构预测、Protein-ligand预测。
常珊:还有一个新增的挑战:构象多样性的预测。
这个概念可能有些不容易理解,它指的是即使输入条件,即序列完全相同,蛋白质或RNA的结构也可能呈现不同的状态,如何让模型输出不同的结果呢?
AlphaFold 3在其论文中提到,这是它目前还无法实现的一个方面。但如果给不同的随机数,有可能能够预测出不同的状态,但这并不完全可靠。
《码客人生》:随着CASP竞赛的不断发展,它是否还主要是一个竞技活动,未来能否通过这个竞赛促进技术落地?在今年5月竞赛报名通道开启前,已有实验派教授主动联系我,表达了他们希望与生物信息学专家合作的愿望,以期补齐AI的实验验证。对于未来比赛的展望,您作为资深参赛者,是否考虑过技术转化或合作的可能性?
常珊:我认为落地是肯定的。以本届比赛中的Ligand预测题目为例,其中有4道非常复杂的题目,它们的设计并不像是出自一般学术实验室,而更可能是由制药公司提出。
这些题目要求对上百个蛋白质-Ligand复合物的结合姿态和亲和力进行预测,这在学术研究中并不常见,反而更像是制药公司在药物筛选过程中的实际需求。他们汇总了多年的药物筛选数据,希望参赛者能够进行预测,从而评估不同分子的潜力。如果参赛者在这方面表现出色,很可能会引起制药公司的关注,进而寻求合作机会。
这相当于进行了一次盲测,而如果你很好地解决了盲测问题,他们有理由相信,你在面对实际问题时也能给出优秀的答案。
因此,我认为CASP竞赛的组织者已经充分考虑了技术落地的问题,使比赛不仅限于学术展示,而是真正帮助产业界解决实际问题。通过这种方式,比赛能够选拔出真正能够解决产业界实际挑战的算法,这样的技术才是真正有价值的。
《码客人生》:您从2004年硕博连读时期就开始参加CASP竞赛和CAPRI竞赛,能回顾下这些年来的参赛经历吗?
常珊:我们不是单独参赛的,而是课题组一起参加。
因为我是当时实验室唯一拥有计算数学背景的学生,导师很自然地将我安排到了负责预测的小组。我们实验室有多个小组,包括生物组、生命科学实验组、模拟组。但我的博士导师王存新教授认为,预测工作的核心是算法,这是一项基础性的工作,因此,我顺理成章地加入了这个小组。
我们更多参与的是CAPRI竞赛。CASP由于难度较大,当时课题组没有特别可靠且高效的算法,我们较少参与。CAPRI竞赛的题目较少,比赛节奏和强度也没有CASP那么大。
我从2004年开始参加CAPRI竞赛,当时对这些还一无所知,就被拉进了团队。起初主要是向师兄师姐们学习,逐渐了解竞赛的具体情况。到了博士后期我就成为了团队的主力,主要负责打分函数专题。从打分函数的算法设计到最终提交,所有工作都是由我完成的。
2008年王存新教授课题组合影
总体而言,当时国内参与这两类高水平竞赛的学者并不多。中科院物理研究所的江凡教授有参加、华中科技大学的肖奕教授也会参加,但王存新教授一直坚持参赛。他在中科大时期就开始从事分子模拟和生物信息学的研究,可以说是国内最早一批从事这一领域的科学家。而且王教授应该是当时国内成绩最好的,因为在当时的多次赛后评估会议上,他都被邀请做口头报告。
经过这样的经历,我在五年博士期间一直参与竞赛,也获得过一些好的预测结果。随着时间的推移,我曾考虑过转换研究方向,但命运让我在从事博士后工作时加入了密苏里大学邹晓勤教授的团队,她也是长期参与这一竞赛的学者之一,而且邹教授的先生--陈世杰教授,也在进行RNA结构预测的研究,所以我也继续深入结构预测的研究。
邹晓勤、陈世杰
回国后,我决定继续沿着这一方向前进,因为我相信,不继续这一领域的研究会让我感到遗憾。
如今,国内在这一领域已有显著成长,许多课题组取得了优异的成绩。比如上一届比赛中的大部分排名第一的参赛者,都曾是密歇根大学张阳教授课题组的成员。
《码客人生》:从2004年至今有十年了,今年您依旧参赛,是什么激发了持续参赛的动力?
常珊:作为多届竞赛参与者,我认为CASP和CAPRI竞赛的时限性,教会了我如何在压力下快速适应并提出解决方案,这是在任何快节奏的工作环境中达成目标的关键能力。
这两种竞赛具有明确的时限性,每道题目都要求在短短的半个月或一周内完成。
通常我们在读博士期间做一个项目,如果没有时间限制,我可能花上两年也未必能完成。但在一周或两周内解决一个实际问题,这有点像我们之前参加的数学建模竞赛,它实际上是对你的一种极大的“压力测试”。它考验你是否能在短时间内快速适应问题,并提出解决方案。
这在实际工作中非常重要,因为当你真正进入公司或应用场景,公司会给你设定里程碑,比如给你三个月时间,不会像做研究那样给你几年时间。
这些竞赛教会了我一个非常重要的技能:如何在有限的时间内对一个问题找到解决方案,哪怕这个方案不是完美的,但至少我能拿出一个可行的解决方案,并取得不错的成绩,这是非常关键的。
《码客人生》:CASP和CAPRI竞赛在考察程度和做题过程上有所不同,具体是哪些方面?今年参赛CASP 16,您有哪些准备工作?
常珊:两者的规则有所不同。
CASP每两年举办一次,要求在三个月内完成上百道题目,而CAPRI则是时间随机的竞赛,每年可能只比3~5道题左右,时间更充裕,压力相对较小。我们参加CAPRI时可以边做题目边进行学位论文研究,但CASP的高强度则要求参赛者全心投入。就像我们今年参加CASP 16一样,这三个月我几乎很难做其他事情,必须掐着表计算时间,每天都要提交结果,处理新题目。
坦白而言,2004年时,国内鲜有团队在CASP竞赛取得佳绩,至少在我参与的学术会议中,未曾听闻国内团队在此赛事上取得突出成绩。那时,我们更多地将目光投向国外,以他们的研究进展为学习榜样。
今年参与CASP 16的征程并非我孤身一人,而是有一支由不同课题组的博士生、研究生以及年轻教师组成的团队。赛前半个月,我对我们的程序进行了彻底的审查和整理,复盘了上届比赛的代码,并针对之前遇到的难题开发了新的代码,力求在本届竞赛中能有更好的表现,减少紧张感。我们还引入了更自动化的处理流程,降低人为错误,提升工作效率。
当然竞赛中总有一些出人意料的挑战,例如组委会给出的新挑战,我尚未找到一个完美的解决方案,因为未知的分子组合给我的预测工作带来了不确定性,今年对我们团队来说挑战巨大。
《码客人生》:今年您选择了哪些赛道参赛?同时作为普美瑞生物公司的首席科学家,您的参赛选择是否也考虑了公司的实际需求?
常珊:今年,我参与了蛋白质和多体预测赛道,两个领域我们一直在参与,这次也不例外。
对于涉及RNA的问题,我们也会进行尝试,因为这类题目常常与蛋白质相互作用的题目混合出现。我们的目标是全面覆盖这些领域,确保不错过任何可能的得分机会。
在竞赛中,每个题目都至关重要,放弃任何一个都可能意味着失去重要的分数。这就如同参加十项全能,放弃任何一项都会影响最终的总成绩。
我们的选择还基于算法的适应性和团队的专长。我们在蛋白质结构预测方面有比较多的积累,尽管RNA结构预测也是我们涉猎的范围,但相对来说,我们在这方面的经验较少。在药物设计领域,我们更多地关注抗体、多肽和小型分子药物,而不是RNA。
至于QA(Quality Assessment)预测,我对其规则尚不够熟悉。浙江工业大学的张贵军教授在这一领域是专家,我期待有机会向他学习,以便更好地理解这一赛道的具体要求和挑战。
▋ 03 “既要模拟,又要实验”
《码客人生》:能否概述您的学术旅程和关键转折点?您参与了哪些课题和项目?
常珊:我的学术之旅是不断探索的过程。从北京工业大学,经华南农业大学,到美国密苏里大学,我一直在寻找最适合自己的研究环境。
博士时期我更侧重理论研究。
我在王存新教授的实验室,我所在的课题组以计算生物学为主攻方向,开发和优化蛋白质对接的算法及其评分函数。这些工作都是纯粹的算法研究,并未深入到药物设计的具体应用场景中。
我虽未亲自在实验台前动手操作,但在王教授实验室深受前沿计算与实验结合的研究环境影响。
王教授的团队成功构建了一个多学科交叉的创新平台,这是当时国内实验室是不多见的。而且我的博士舍友是一位专注于实验科学的研究者,我们频繁交流,让我得以深入理解实验工作的细节。这为我后来在江苏独立搭建实验室时提供启发,我还向他咨询了许多关于实验室建设和管理的意见。
2014年,我选择加入江苏理工学院,也是因这里能提供干湿实验结合的平台。就像陈润生院士经常强调,“生物信息学研究应将计算与实验紧密结合,以确保算法的实用性。”
正如你刚才提到的,许多从事生物实验的研究人员也想了解计算方法,甚至参与CASP这类的竞赛。实际上,从事计算模拟的人也有这样的需求,但能否在同一个实验室内很好地满足这种需求,紧密衔接计算与实验,这是我一直以来想要做好的事情。
而且因为有过去的经历,即便我没有直接投身于实验操作,我也能比较准确把握实验人员的需求或困难。
目前,我定期与实验团队交流,他们向我展示实验成果和数据,而我则提出一些解决方案,确保我们的计算工作能够满足实验需求。例如近期成果是蛋白质降解剂的设计。
这种能力至关重要,它教会了我算法开发必须脚踏实地,紧密联系实际问题。一个优秀的算法不仅要在技术上合理,更要在解决现实问题中发挥关键作用。
《码客人生》:现在您的研究领域涵盖了AI辅助药物设计、机器学习、高性能计算、分子识别,还有脑机接口和穿戴式智能设备。软硬件都关注吗?这对您有何挑战?
常珊:我的教研工作背后,有着一些现实的考量。
由于我们学校的硕士课程设置偏向机械工程,而非信息学科,我指导的研究生课题自然也倾向于这一领域,这也是我会涉及到脑机接口和穿戴式设备研究的原因之一。
对我而言,无论是哪个领域的研究,关键在于能否将其转化为数学问题或模型。无论是分子生物学、信号处理还是穿戴式设备数据分析,最终都可以通过数学模型来求解。
而且这些跨学科的研究令人兴奋,也为我们提供了解决复杂问题的新视角和工具。我致力于寻找一个平衡点,既能满足学术培养的要求,又能充分发挥我们团队在算法研究上的优势。
《码客人生》:能否分享您近期的一些成果,具体课题或落地项目?
常珊:近期我们在分子设计领域取得了显著进展,这是我们特别擅长的领域,而且像AlphaFold 3这样的新技术也非常专注于这一领域,特别是在“降解剂”的设计上。
传统药物设计侧重于开发“抑制剂”,以控制异常蛋白质的过度表达,如激酶的过度表达可能导致细胞的异常增殖,白血病就属于中性粒细胞快速增殖。
这种情况下,我们需要找到一种“抑制剂”,来抑制这些蛋白的活性,防止它们引起细胞的过度增殖。但问题在于,使用“抑制剂”治疗时,蛋白质其实仍然存在于体内,抑制剂的作用仅仅是抑制该蛋白质的功能。因此,这种治疗方式可能会引发一些问题:如果蛋白质仍然存在,为了维持治疗效果,可能需要保持“抑制剂”的剂量。否则,新的蛋白质被合成或有抑制剂脱靶,则抑制作用还会收到影响,异常蛋白质仍然可能引发疾病。
而我们的研究则探索了一种创新策略——通过设计“降解剂”,不仅希望抑制异常蛋白的功能,更通过促进其降解来降低蛋白水平,为治疗一些难以用传统“抑制剂”应对的疾病提供了新思路。
具体来说,这种降解策略是将目标蛋白与E3泛素连接酶结合,利用人体内的自然降解机制。这类似于使用双面胶,一端粘附目标蛋白,另一端粘附E3连接酶,泛素化并降解异常蛋白。通过这种方式,异常蛋白质被直接降解,提供了一种从根本上解决问题的新途径。
然而,开发这种降解剂面临一些挑战。
因为它需要一个小分子药物同时与目标蛋白和E3泛素连接酶发生作用,这就涉及到“小分子与蛋白质的相互作用”,以及将这两种蛋白拉近后的“蛋白质-蛋白质相互作用”。这种相互作用是多体间的,或者说是三体或更多体的相互作用,这比传统的“单一小分子与单一蛋白质的相互作用”要复杂得多。
目前,计算上还没有非常成熟的、通用的方法来解决这个问题。
幸运的是,我们课题组在“小分子-蛋白质相互作用预测”和“蛋白质-蛋白质相互作用预测”方面都有较强的实力,因此我们开发了一种新算法--能够迅速设计出潜在的分子,并在合成获得分子后,迅速进行细胞降解实验。
我们的分子设计数量不多,大约4~5个,但效果较好,几乎每次都能发现降解活性在纳摩尔水平的分子。表明这些分子在较低的剂量下就能实现目标蛋白的有效降解。通常在两个月内,我们就能筛选出这样的分子。
我们在4个不同的体系上进行的实验都已证实了我们分子的降解能力,目前我们正在进行体内实验,主要是动物实验,以进一步观察这些分子在体内的作用效果,并验证它们的降解效率。
《码客人生》:这个过程中哪一步最难?
常珊:一个关键的限制步骤是--获取分子实体。
设计分子本身很快,我可能在一周内就能完成,但合成实际的分子实体却需要更长的时间,这是AI辅助药物研发中的一大难题。尤其是对于结构复杂的大分子,即便拥有自动化合成技术,合成路径的确立和实现依然充满挑战,往往需要依靠经验丰富的化学合成专家。
缺乏实体分子会严重影响后续实验的进行。我们常常需要等待长达一个多月,甚至两个月的时间才能获得所需的分子。一旦分子到手,我们的实验进度便会加快,通常在两周内就能完成验证实验。
此外,获得分子实体仅是开始,我们还需对其进行一系列深入的实验,全面评估其药代动力学特性,包括毒性和代谢等方面的数据。我们仍在不断探索之中,有时还需委托外部专业机构来协助完成。
因此,实验设备、专业技能和外部合作都是我们研究中不可或缺的部分。
《码客人生》:外部专业机构,是指与其他学术机构合作,还是找外包公司?
常珊:我们更倾向于外包的形式,同时也积极与胡机构合作。
但如果与学术机构合作,有时可能难以控制进度和时间。我们希望能快速获得实验数据,但如果合作方的响应不够迅速,这可能会影响到我们的研究速度。这也是为什么我们更愿意自己进行实验,这样可以更专注、更有效地推进项目。
▋ 04 技术如何更好落地?
《码客人生》:您还在普美瑞生物公司担任首席技术官,这家公司与您目前的课题研究有什么衔接点?
常珊:我们在学术研究方面主要是在学校进行,但要将研究成果和设计的分子推向实际应用,就需要企业的力量。
虽然学校能够完成算法的开发和初步验证,但要进行临床前或临床阶段的研究,特别是在药物开发的后期阶段,则超出了高校的常规能力范围。
公司官网:https://pumeirui.com
因此,我们通过普美瑞生物公司,旨在将AI辅助药物设计的技术从理论转化为实践,不仅停留在设计阶段,而是要推进至制药公司满意、市场认可的成熟阶段,最终实现商业化。通过公司这一平台,我们希望能够将科研成果转化为具有实际应用价值的产品,推动科学发现向技术创新和产业发展的转化。
《码客人生》:普美瑞生物公司的业务重点是什么?公司是否致力于新药的研发?针对的是哪些疾病领域?
常珊:目前我们专注于肿瘤治疗领域。我们的目标是在药物研发的早期阶段发挥关键作用,致力于推进到临床前候选化合物(PCC)的阶段。
我们相信,这一阶段的创新对于整个药物开发过程至关重要。虽然在国内,投资者可能更关注后期成果,但是具有国际化视野的公司会更倾向于关注这些早期项目,愿意投资于具有潜力的先导分子,这为我们提供了与他们建立合作关系的机会。
对我们来说,我们的目标是将这些早期研发成果或知识产权(IP)商业化,通过出售或合作开发的方式与合作伙伴共同推进项目。我们并不打算自己走完整个药物开发的全过程,因为这通常需要大型制药企业从早期研发一直做到临床试验并最终推向市场。我们目前的能力更专注于早期阶段,所以我们希望在这个阶段能够快速发现并实现价值,从而实现盈利。
《码客人生》:目前公司是否仍在进行技术方面的验证,还是说已经有了一些盈利模式?
常珊:公司目前在积极探索将研发管线商业化的途径,也在提供技术服务。
我们正积极与潜在企业进行接触,寻求合作或技术转让的机会。为了增强我们分子的市场吸引力,我们正致力于补充关键的实验数据,以全面验证其成药潜力。
我们清楚地认识到,只有通过深入的实验研究和充分的数据支持,才能准确评估分子的潜力,进而吸引合作伙伴的兴趣。不完整的数据,如缺少毒性测试或代谢特性不佳,都可能影响合作机会。我们致力于展示技术在早期阶段的优势,以获得更多商业化变现的机会。
我们实际上一直面临一种现状:我们与国内一些制药企业有过交流,他们更倾向于一种更安全的购买方式,比如希望我们的产品推进到更后期的临床试验,风险降到最低后,他们才愿意付费。
但国外的大型国际化企业,它们更倾向于早期介入和创新。虽然这可能涉及更高的风险,但也伴随着更大的收益潜力。
所以我们希望国际化的企业能够了解我们,对我们有印象,甚至有机会与我们进一步交流,这样我们就能向他们介绍我们优秀的项目,并让他们认识到我们确实具备较强的研发能力,实现共赢。
《码客人生》:回顾您的职业道路,哪些决策对您的学术生涯产生了显著影响?是否有某个关键时刻,让您在学术界及更广领域中确立了声誉?
常珊:我职业生涯中一个重大的转折点是我决定转到江苏工作,建立独立实验室。
起初,在华南农业大学独立开展研究时,我的工作主要集中在计算模拟上,那时我的研究成果可能并没有引起太大的关注。我曾担忧自己是否只能遵循传统的学术路径,即发表论文和职称晋升。
然而,当我结束了在美国的博士后研究并回国后,我选择来到江苏,这一决策极大地丰富了我的职业经历。这里的工作环境为我提供了一个能够充分发挥自己能力的平台,让我能够整合资源,探索更前沿的问题。
现在,我们在报告中不仅展示了在CASP竞赛中取得的卓越成绩,还将这些竞赛中检验过的算法应用于实际场景,开发了多个研发管线。这种将计算与实验相结合的研究方法,极大地激发了听众的兴趣。
实验人员也对我的算法是否能够提升他们的实验成功率表示好奇,我发现自己还扮演着衔接干湿实验的翻译员,这在跨学科领域研究中是一种重要的能力。
尽管我可能不是计算领域的领军人物,也不是实验操作的大师,但我在这两个领域的交叉点上正在做一些工作,这让我能够发挥积极的作用。我能够与不同领域的专家进行有效沟通,他们对我们团队的研究工作表现出了一定的兴趣。这一切让我确信,我的选择应该是正确的。
《码客人生》:作为学校的生物信息与医药工程研究所所长,您在招聘招生方面有何规划?在选拔时,您会优先考虑哪些背景?
常珊:在招生方面,我倾向于选择具有电子信息、计算机或数学背景的人才。这些领域我非常熟悉,能够更好地指导他们。随着学校即将增设相关硕士点,我相信这将为我们吸引更多优秀学生提供机会。
对于研究人员的招聘,我们更看重具有丰富实验经验的人才。尽管我们在算法研究方面相对顺利,但实验环节仍面临挑战。因此,我们希望引入在特定领域有深厚实验背景的专业人才,以增强我们团队的实验研究能力。
我们致力于打造一个多元化的团队,既有坚实的理论基础,又有出色的实验技能,这样才能在科学研究的征途上不断前行。
我相信,让每个人在自己擅长的领域发挥,不仅提高了工作效率,也响应了国家对有组织科研和团队合作的倡导。这标志着我职业生涯的一个重要转变,也是科研发展的重要趋势。
本文作者 吴彤 长期关注AI技术和落地,系统记录科技的每一次变革,欢迎各位同道加好友交流,微信号:icedaguniang。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。