4月26日,清华大学讲席教授、深圳医学科学院院长、生物学家颜宁连发两条长微博,言辞犀利地回应了网络上长期以来针对她本人及结构生物学领域的种种非议。对于普通人来说,看到了颜宁的回击,却没看懂回击长文中谈到的一些科研话题。
颜宁从事的是结构生物学领域的研究。科学家们对蛋白质等生命基本元素的结构进行解析,进而了解它们的功能,为药物开发奠定基础。颜宁曾带领团队首次解析人源葡萄糖转运蛋白GLUT1,在离子通道结构解析等领域也做出了重要贡献,成果受到学界广泛认可。
然而,“人红是非多”,有一条她的攻击者贬低其工作的基本理由:结构生物学中解析蛋白质等工作无非是在冷冻电镜等昂贵设备加持下做出的重复性劳动,没有原创性可言。颜宁等头部科学家凭借这些别的研究组可能没有的设备,发论文“灌水”,“德不配位”。
而在AI(人工智能)快速发展的当下,这种批评又有了新的论调:擅长重复性工作的AI终将取代这些结构生物学家的工作,颜宁等人马上就要“混不下去”了,这才回到国内。
颜宁在微博中对这两种观点进行了回击。借由其最新发布的研究成果,颜宁说,冷冻电镜“加速了理解生命、药物研发的进程”,但仍然只是一种发现规律的工具,需要科学家提出生物学问题;而AI赋能则让科学家“摆脱一部分重复劳动”,但其预测的结果目前仍然无法取代真实世界的探索。
结构生物学与冷冻电镜
生命体由无数个蛋白质等生物大分子维持运转。它们有的负责搬运氧气,有的负责消化食物,有的负责抵御病毒。
在微观世界里,结构很大程度决定功能。如果某种蛋白质发生突变导致了疾病(比如癌细胞表面的受体蛋白),人类想要研发靶向药物,就必须知道蛋白质长什么样。这就是结构生物学对人类健康最直接的意义。
但问题是,蛋白质太小了,普通的光学显微镜根本看不见。另外,它们还处于动态变化之中,结构难以捕捉。在冷冻电镜成熟之前,科学家们主要使用“X射线晶体学”来解析结构,让蛋白质在特殊溶液中“结晶”固定下来,再用X射线去照射它们,通过其“影子”——衍射图谱来倒推它们的结构。DNA等物质的结构就是通过这种方法发现的。
冷冻电镜的原理则是通过瞬间超低温冷冻,让蛋白质定型,再使用高能电子束轰击,在底片上留下分子的二维剪影,将不同角度的剪影拼接,推理其结构。冷冻电镜技术不需要让蛋白质结晶,能够捕捉更复杂的生物大分子以及更加“脆弱”的膜蛋白等物质的瞬时动态结构,这是一个很大的突破。该技术的三位发明者于2017年获得了诺贝尔化学奖。
颜宁提到,冷冻电镜的问世让结构生物学研究人员“喜大普奔”,“终于不用把宝贵的时间用在令人绝望的结晶这一步了”。但冷冻电镜究其本质,也“就是个显微镜”,是生物发现的众多方法中的一种。
除了直接观察结构、研究背后的机制以外,科学家还可以通过遗传学方法,通过基因型对应生物表型,也可以通过生化实验的方法,通过不断地拆解、筛选和浓缩来搞清楚某个生物过程中的关键物质。
颜宁解释道,这些技术看似繁琐且重复,但都只是手段,其目的是通过结构这一媒介,“理解生物机制,搞清致病机理,发现生物规律,利用结构做药物设计、工程设计”,这些才是真正考验科学家的地方。
AI取代结构生物学家?
在生命体中,细胞根据遗传信息制造出一个个氨基酸,这些氨基酸链条快速折叠,形成结构,形成承担各种重要生命功能的蛋白质。与冷冻电镜等直接观察物质结构的方法不同,近年来快速发展的AI技术能够通过对大量已知数据的学习,直接从氨基酸序列预测蛋白质的结构。
它的大致原理是这样的:通过基因组计划和结构生物学的研究,人们已经大致知道了什么样的基因序列对应着什么样的氨基酸序列,也知道了很多基因变化对应的氨基酸序列和结构变化。从大量这些对应和共变关系的数据中,AI计算出了其中的复杂模式。
要知道构成一种蛋白质的氨基酸序列并没有那么难,如果AI能够从序列中准确预测结构,那将是结构生物学领域的重大突破。首先发明这一算法(AlphaFold)的三名科学家因为其突破性的潜力,于2024年获得了诺贝尔化学奖。
据此,攻击者们认为“颜宁的专业被取代了”。而颜宁说,如同冷冻电镜的发明,AI的出现让科研人员“又能摆脱一部分重复劳动”,但要完全依靠它对物质结构进行预测,目前还是不现实的。
颜宁以其团队近期发表于《科学》(Science)和《细胞·化学生物学》(Cell Chemical
Biology)上的新研究举例。传统结构生物学是“先知道要研究什么病、什么蛋白,再去解析它的结构”,而这项研究提出了一种名为“CryoSeek(酷寻)”的新研究范式。他们直接从大自然(清华大学荷塘的水样)中提取物质,用冷冻电镜去主动观察其中的物质。
结果,从随处可见的池水中,他们发现了一种未知的“管状纤毛”天然结构,其上覆盖着极其复杂、且以前不为人知的多糖纤维。其中一些纯糖纤维完全不含有蛋白质。
AlphaFold等AI基于已知的基因序列和过去几十年科学家解析出的蛋白质数据库,通过经验来预测折叠方式。然而,该研究发现的多糖是一种不含蛋白的碳水化合物,不是由基因直接编码生成的,AI根本没有可以参考的数据去预测它。
“多糖的序列并不能从基因组推测出来,连序列都没有,怎么预测啊?就算有序列,之前没结构(数据),它也没法被训练啊。”颜宁在微博中说。
颜宁也并没有排斥AI技术的使用。相反,她与合作者一起开发新算法,加速冷冻电镜图像获得与处理的速度,“降低技术门槛,节省大量时间”。她还组织研究组成员开发自动搭建糖类结构的算法,并利用研究数据进行优化验证。
AI没有淘汰科学家,而是淘汰了重复劳动。颜宁说,发现这些多糖纤维只是开始,下一步就是要问“它们是什么?它们做什么?它们从哪里来?”的问题。
颜宁微博
现实的不满
人类探索自然的历程本就是一部工具进化史。伽利略没有因为使用了望远镜就被贬低了发现木星卫星的伟大,现代科学家也不会因掌握了冷冻电镜和AI技术就成为“灌水机器”,这是显而易见的。
然而,科学家的成就既可以被描述成天才与努力的进步神话,也可以讲成资源与关系的反乌托邦故事。贬低成功者与“造神”的叙事一样,通过对他人成就的简单归因来满足特定的心理需求。虽然这类言论往往没有依据且自相矛盾,但批评颜宁“论文灌水”和“混不下去回国”的论调背后,可能也隐藏着对现实的不满。
因为解析能力的大幅提升,冷冻电镜的出现和发展确实带来了一股利用该技术进行研究的“论文潮”。但相关设备极其昂贵,目前被国外品牌所垄断。一台设备动辄上千万人民币,运维费用也相当惊人,这就导致研究资源不可避免地向顶尖机构和学者集中。
再者,与其他学科一样,结构生物学研究所面临的压力不仅来自专业技术和科研思维的限制。以蛋白质结构解析为例,对于那些热门的解析对象,科学家们往往要陷入速度与质量的竞赛,首先做出来的人是唯一的赢家。颜宁在另一条微博中提到,自己交给刊物的研究成果,甚至有被审稿者盗取数据和方法抢发的情况。
作为顶尖科学家的颜宁尚且有如此遭遇,对于那些课题没有那么多的普通高校的学子和学者而言,这种打击的后果则更为严重。科研工业化与激烈竞争带来的马太效应,很容易催生出强烈的资源剥夺感。在社交平台搜索“冷冻电镜”,就能发现很多学生疲于寻找好用的冷冻电镜平台,在价格上反复纠结,在排队等候使用中感叹科研时间的浪费。
对环境的不满往往容易在公众舆论中发酵,异化为对拥有资源的明星科学家的人身攻击。一些不明就里的人从这一叙事中听取一鳞半爪,譬如出国就是“崇洋媚外”,回国就是“混不下去”。
通过几代人的努力,中国科学家终于能够站在世界的前沿。公众与学界对于科研资源分配、考核发表等制度的公平性的意见,对于高端仪器国产化的呼吁,都是合理且必要的探讨。在一个真正渴望科技自立自强的社会里,更需要的是用理性的制度建设去惠及更多科研工作者,而不是用空穴来风的网络暴力,去伤害那些正在为人类拓展知识边界的探索者。
