摘 要
合成生物学作为认识生命的“钥匙”、改变未来的颠覆性技术,打开了从非生命物质向生命物质转化的大门,实现生命体系的理性设计与编辑,为生命科学研究提供了新范式,促进生物技术迭代发展,成为未来生物产业发展的驱动力。经过20余年的发展,合成生物学领域已取得系列突破,创新应用逐步实现,学科体系渐成。合成生物学的发展脉络可概括为三个方向:一是使能技术与理论创新的系列突破;二是基因组合成与组装能力的迭代提升;三是细胞工厂和新生物系统的构建与应用。在此基础上,阐述合成生物学学科体系框架,展望未来发展趋势。
关键词:合成生物学;工程生物学;使能技术;基因组编辑;学科体系
生命科学150多年来经历了环环相扣的三轮革命,研究范式发生着深刻变化,从生物表观性状及遗传的观察描述到生命过程的分子生物学表征与关联,再到以组学为特征的系统生物学运用,为合成生物学的兴起提供了坚实的学科基础。合成生物学发展20余年,取得了系列突破性进展,创新应用逐步实现,学科体系构建渐成。
1 合成生物学内涵与外延
合成生物学(synthetic biology)以生物科学为基础,会聚化学、物理、信息等学科,融合工程学原理,设计改造天然的或合成新的生物体,揭示生命运行规律(造物致知)、变革生物体系工程化应用(造物致用),又称工程生物学(engineering biology)。合成生物学的内涵和外延不断拓展,涵盖基础理论、使能技术及创新应用等研究方向,推动交叉学科研究创新发展。
合成生物学基于生命科学发展而来,与传统生物学既密切关联,又有所区别。传统生物学主要以自然界生物体为研究对象,利用观察、实验、分析和推理等科学方法,运用先进的仪器和设备,采用多种技术和手段,获取和处理大量的生物数据,建立和验证生物模型和理论,探索生命的本质和规律。技术的发展使得人们对生命体进行系统性工程化改造成为可能。有别于传统对生命体多样化、复杂化和自适应等认识,合成生物学尝试借鉴工程学标准化、模块化和可设计等原则,自下而上地对生命体进行优化设计改造。随着生物建模与模拟、大规模基因组合成与组装、新一代基因编辑工具等技术的发展,尤其是近年来人工智能(artificial intelligence,AI)对于生物设计创新应用的不断涌现,合成生物使能技术获得了飞速发展,其创新应用在医药健康、生物工业、生物农业、生物能源、环境修复、生物材料,以及生物电子与生物信息等领域逐渐显示出巨大的赋能作用(表1)。
表1 合成生物学与生物技术的关联与区别
2 合成生物学发展脉络
100年多前法国学者提出人工模拟合成细胞的理念,并首次使用了“合成生物学”一词。20世纪中叶,美国和中国学者相继实现DNA、RNA和蛋白质等生物大分子的人工体外合成。1965年,中国科学家实现牛胰岛素的全合成。1966年,美国学者合成了多聚核苷酸。1981年,中国学者全合成酵母丙氨酸tRNA,这也是首次人工合成的具有生物学功能的核糖核酸,为后来人工合成基因组积累了重要经验。20世纪七八十年代,分子克隆和PCR的进步,使得基因操作在微生物学研究中得到广泛的应用,为人工基因调控与设计提供了基础的技术手段,但这个时期的基因工程往往局限于克隆和重组基因表达,在微生物中发挥作用的广度和深度仍然有限。20世纪90年代中期,自动化DNA测序技术的进步和计算工具的改良,使得研究人员能够测序完整的微生物基因组。同时,高通量技术的发展,使得研究人员获得了大量关于细胞成分及其相互作用的数据。这些技术的进步为理解生命的复杂性提供了新的视角。随着生物实验研究与计算分析相结合,分子生物学的“大规模化”研究促进了系统生物学领域的发展。在此基础上,作为“自上而下”系统生物学方法的补充,研究人员提出了一种“自下而上”的工程学方法。到20世纪90年代末,这种“自下而上”的工程学方法开始在分子生物学领域得到应用,为具有天然工程特性的合成生物学奠定了基础。
纪初,合成生物学进入新的研究发展阶段,真正被广泛关注。在Web of Science以“synthetic-biology”为关键词检索,合成生物学领域已有近2万篇论文,期刊学术出版物逐年增加,系列重要成果频频涌现。合成生物学发展脉络大致可以概括为三个方向:一是使能技术的系列突破,如基因线路设计、基因组合成与组装、基因组编辑、底盘细胞构建、无细胞转化体系、蛋白质从头设计、非天然体系及生物正交、人工智能的应用等;二是生物体基因组合成与组装能力的迭代提升,目前已经实现原核生物基因组和酵母染色体合成,正在挑战多细胞生物染色体合成;三是细胞工厂和新生物系统的构建与应用,一方面涉及“造物致知”,即自下而上构建生物体系以理解生物学基本原理;另一方面可概括为“造物致用”,覆盖生物医药、生物农业、生物化工、生物能源、生物环保、生物材料,以及生物电子与生物信息等(图1)。
图1 合成生物学发展脉络
2.1 使能技术的发展与突破
使能技术(enabling technology)是指可以获得广泛应用,提升现有技术水平并获得高效益的技术。合成生物使能技术的系列突破性进展,为合成生物学迅猛发展提供底层技术保证。
双稳态基因网络开关、基因振荡网络,证明了复杂代谢调控的逻辑性、人工再设计的可实现性。研究人员成功利用生物元件在微生物细胞底盘内构建逻辑线路,引入工程学理念,开启了合成生物学新的进程。2000年,波士顿大学Collins团队受噬菌体λ开关和蓝藻昼夜节律振荡器的启发,设计合成了双稳态基因网络开关,含有这种开关的细胞可以在两种稳定的表达状态之间切换,以响应外部信号;普林斯顿大学Elowitz和Leibler基于负反馈调控原理设计了基因振荡网络,这种被称为阻遏因子的回路的激活导致了阻遏因子蛋白表达的有序、周期性振荡。这些人工生物器件和回路在大肠杆菌细胞中的实现,为基因组编辑及人工基因网络调控提供了设计思想,成为合成生物学的经典之作。随后一系列生物元件的应用,人们实现了更为复杂的人造基因线路设计。中国科学院深圳先进技术研究院娄春波团队与北京大学欧阳颀团队长期致力于探索基因回路的设计原理,其团队秉承绝缘化、正交化的设计思路,创制高质量的基因元件,并在原核生物以及真核细胞底盘上实现了鲁棒且可预测的基因回路设计。随着人类对大规模且可预测的基因回路设计能力不断提升,科学家不仅能够精确控制单一种类细胞的行为,还可以对细胞群体进行编程,实现人工合成的微生物群落。
遗传密码子的拓展、含非天然氨基酸蛋白质的合成、镜像转录的实现,开创了生命体的新形式及应用前景。2014年,斯克利普斯研究所Romesberg团队设计合成一个非天然碱基配对,实现遗传密码子的拓展,这意味着在控制条件下,未来的生命形式有无限种可能。三年后,Romesberg团队又成功地使含非天然碱基dNaM-dTPT3配对的DNA在大肠杆菌中实现转录和翻译,并使非天然氨基酸在绿色荧光蛋白中定位结合。北京大学陈鹏与季雄团队借助遗传密码子拓展策略,发展了一种具有单氨基酸位点分辨率的多组学技术,实现了活细胞中染色质化学修饰的编码表达与串联解析,将在细胞“代谢-修饰-基因转录”调控轴中发挥重要作用。清华大学朱听团队在镜像生命研究方向开展系列工作,实现“镜像”T7转录,拓宽其在诊断治疗等方面的应用。
基因组编辑、基因模块的挖掘与解析、生物体系的模拟与设计,丰富了合成生物学的底层技术。基于CRISPR系统的基因编辑工具在合成生物学中得到了广泛应用。2012年,柏林马克斯·普朗克病原体科学研究所Emmanuelle Charpentier与加州大学伯克利分校Jennifer A. Doudna发现CRISPR-Cas9系统可靶向切割DNA并阐明其机制,为CRISPR-Cas9基因编辑技术建立作出了奠基性的贡献,为此二人被授予2020年诺贝尔化学奖。2019年,哈佛大学David Liu团队融合人工核酸酶与逆转录酶,成功构建了引导编辑器(prime editor),开发了可在哺乳动物细胞中实现12种类型碱基置换、多碱基变换以及小片段的插入或删除的引导编辑系统。David Liu团队还接连开发了胞嘧啶碱基编辑器(cytosine base editor)和腺嘌呤碱基编辑器(adenine base editor),通过不依赖DNA双链断裂的碱基编辑技术实现了部分碱基类型的精准编辑(即碱基编辑)。除上述主要基因或碱基编辑技术策略外,2019年以来,基于CRISPR相关转座元件(CRISPR-associated transposons,CASTs)基因写入技术也有了较快发展。
基于计算机辅助系统的逻辑线路构建,加速了合成生物学标准化、特征化和自动化的实现。2016年,麻省理工学院Christopher Voigt团队发表了基于端到端计算机辅助设计的Cello系统,用于在大肠杆菌中构建逻辑电路,通过标准化、特征化和自动化设计来实现生物化的工程化改造,实现更优地编写、构建、编辑和共享DNA代码。Voigt团队的系列工作为合成生物学领域提供了众多元件的设计算法,同时开发了多样的元件库,并提供详细的表征数据。高性能计算为建模和预测开辟了新的领域。华盛顿大学David Baker团队开展系列工作,在蛋白质理性设计方面取得突飞猛进的进展。2018年,Baker团队首次完全从头开始构建出一种能够结合DFHBI荧光化合物的β桶状蛋白,其可以高精准和高亲和力地结合并作用于特定的小分子靶标上;随后,从头设计了自组装螺旋状蛋白质细丝,不仅能够更好地理解天然蛋白质细丝的结构和力学,同时还能创造出与自然界中完全不同的全新材料。理性设计蛋白纳米机器还能够协助诊断和治疗疾病,实现对细胞更精准的控制。这些工作开创了人类从头开始创建和定制复杂的跨膜蛋白的先河,使得创造自然界中不存在的跨膜蛋白来完成特定任务成为可能。2022年初,伊利诺伊大学香槟分校Zaida Luthey-Schulten团队利用计算机模拟人造细胞,研究细胞的基本代谢过程和遗传信息加工过程,构建了只包含少数调节蛋白和RNA的全细胞模型,并且利用该模型研究了细胞的基本生命活动。
人工智能的发展大大推动了合成生物学“理性设计”的进程。基于人工智能的蛋白质结构预测算法AlphaFold为蛋白质的从头设计提供了颠覆性的技术手段,展示了数据驱动范式在生命科学研究中的巨大潜力。2020年,DeepMind团队在Nature 发表了AlphaFold算法的细节和表现。2021年,DeepMind团队再在Nature 发表基于神经网络的新模型AlphaFold2,其预测的蛋白质结构能够达到原子水平的准确度。2022年,AlphaFold已预测出超2.14亿个蛋白质结构,几乎涵盖地球上所有已知的蛋白。同年,科技巨头Meta(前身为Facebook)训练了迄今为止最大的蛋白质语言模型ESMFold,并以此预测超6.17亿个蛋白质结构,其中还包括宏基因组中数百万个尚未被认知的全新结构。中国科研人员在这方面也开展了系列工作。中国科学院微生物研究所吴边团队将蛋白质计算机设计的前沿方法引入酶工程的研究中,促进了复杂大分子结构设计的发展。中国科学技术大学刘海燕团队采用数据驱动策略,开辟出一条全新的蛋白质从头设计路线。北京大学鲁华与邓明华团队提出一种基于图神经网络模型的方法,利用层次图转换器捕捉结构信息,实现了自动而准确地推断蛋白质功能。
基于数学物理模型解析生物网络拓扑结构与功能的定量关系,为理解与设计人工基因回路提供了理论框架。合成生物学的核心科学问题:一是解答生命功能跨层次涌现的原理,二是基于涌性原理解决生命系统的理性设计与构建问题。为回答这一科学问题,研究人员提出定量合成生物学这一新方向。2019年,中国科学家首次提出“定量合成生物学”的概念,并于2021年组织“定量合成生物学”香山科学会议,形成“‘黑箱’理论与人工智能”与“多尺度‘白箱’定量理论”等重要思路和共识。合成生物学理论体系的完善将为回答其基本科学问题提供重要理论指导。
2.2 基因组合成与组装能力的迭代提升
生物体基因组合成与组装能力迭代提升,逐步实现原核生物基因组和酵母染色体的合成,正在挑战多细胞生物染色体合成,支撑合成生物学研究和推动下游产业转化。
人工合成病毒、细菌及酵母等微生物基因组,实现了大规模人工合成生命遗传物质的突破;简约基因组的开发,为认识基因组功能和构建底盘细胞提供了新的思路。2002年,纽约州立大学石溪市分校Wimmer团队通过化学合成病毒基因组获得了具有感染性的脊髓灰质炎病毒,也是首个人工合成的生命体。继最简基因组(minimal cells)概念提出后,2010年,美国JCVI团队合成首个“人工合成基因组细胞”——JCVI-syn1.0;之后,从syn1.0的基因组中去除DNA片段,在2016年获得了更为精简syn3.0,它可以通过473个基因进行代谢和繁殖,但其分裂产生的子代细胞,形状和大小却不相同。2021,JCVI团队在syn3.0(473个基因)细胞中加回7个基因,使其能够整齐地分裂成均匀的球体。这标志着合成生物学又向前迈出了重要一步。
合成基因组学进入真核生物领域,人工酵母基因组Sc2.0计划已产出系列代表性成果。2014年,纽约大学Jef Boeke教授领衔的研究团队创建出了第一条人工酵母染色体(酵母染色体中最小的3号染色体)。2017年,Sc2.0计划向前迈进一大步,酵母基因组中的三分之一完成了设计合成,Science 以特刊形式进行了报道。2023年,Sc2.0计划再次取得突破,实现酿酒酵母的16条染色体全部合成成功,并分别创造出了16种部分合成的酵母菌株,即每种细胞内包含15条天然染色体和1条合成染色体,Cell 以封面故事形式进行报道。“16合1”染色体酵母和“16合2”染色体酵母等成果的发布,也为研究生命本质开辟新的方向。
继实现原核生物基因组与真核生物染色体合成组装之后,科学家正在挑战多细胞生物染色体合成。2022年,中国科学院动物研究所李伟与周琪团队实现了哺乳动物完整染色体的可编程连接,并创建出具有全新核型(染色体组型)的小鼠。研究人员利用小鼠单倍体胚胎干细胞和CRISPR基因编辑工具,成功将最长的染色体1号和2号进行正反连接,以及将中等长度的5号和4号染色体进行首尾连接(实验小鼠未表现出明显异常)。结果表明,来自小鼠的两条独立存在的染色体在基因编辑后,可以以非同源末端连接修复的方式连接为一条染色体。这项工作拓展了“造物致知”的合成生物学研究策略,并奠定了相应的技术平台。
2.3 细胞工厂和新生物系统的构建与应用
使能技术的系列突破,为解析生命运行规律提供了全新的手段,并加快了合成生物学的工程化应用;生物体基因组合成与组装能力迭代提升,支撑合成生物学研究和推动下游产业转化。
青蒿素前体、阿片、大麻素、茉莉素等重要植物药物、激素的酵母合成,昭示了天然产物人工高效合成的巨大潜力。2006年,加州大学伯克利分校的Jay Keasling团队通过基因网络编辑,成功地在酵母菌中生产出青蒿素前体,成为合成生物学生产植物药物的范例;随后,该团队与中国科学院深圳先进技术研究院罗小舟研究员成功地在酵母菌中产出多种大麻素及其衍生物;并实现了植物激素茉莉素在酿酒酵母的异源从头合成。此外,斯坦福大学Smolke团队通过基因组编辑在酵母菌中完全合成阿片类药物(opioids),或将对罂粟种植业产生重大影响。
二氧化碳转化为淀粉、葡萄糖和油脂等,为二氧化碳的资源化、高值利用开辟了新的途径。2021年,中国科学院天津工业生物技术研究所与中国科学院大连化学物理研究所等研究团队进行联合攻关,创制了一条利用二氧化碳和电能合成淀粉的人工路线——ASAP路线(artificial starch anabolic pathway),在实验室首次实现了从二氧化碳到淀粉的从头全合成。2022年,电子科技大学夏川团队、中国科学院深圳先进技术研究院于涛团队与中国科学技术大学曾杰团队共同完成的研究表明,通过电催化结合生物合成的方式,将二氧化碳高效还原合成高浓度乙酸,进一步利用微生物可以合成葡萄糖和脂肪酸。
维生素B12等新领域精细化工产品的无细胞体系合成,突破了以微生物为底盘的系列困难。2023年,中国科学院天津工业生物技术研究所张大伟团队将微生物B12合成途径中的24步催化反应进行模块划分,通过组装36个酶的体外多酶催化系统,实现了以5-氨基乙酰丙酸(5-ALA)为底物合成维生素B12体系构建,及以HBA为底物合成维生素B12催化体系的产量提升。
生物基材料和原料的大规模合成,展示了绿色生物制造替代传统能源化工的巨大潜力;DNA存储、纳米生物器件及合成生物传感器等电子生命系统,正逐步从“概念”变成“产品”。生物铸造工厂(biofoundry)的布局建设与高效运行,为合成生物学发展提供集成式平台支撑,能够实现数十种甚至数千种不同分子的生物合成,加速细胞工厂的工程化创新应用落地。合成生物学的应用向医学、工业、农业、能源、环境、材料、信息等领域迅速拓展,促进了生物产业高质量、高效率发展,在生物经济的振兴中发挥核心作用,为促进全球可持续发展提供全新的解决方案。
此外,合成生物学的发展离不开青年后备力量的培育。国际基因工程机器大赛(International Genetically Engineered Machine Competition,iGEM)自2003年成立至今,30年间培育了一大批青年科学家与一些有影响力的合成生物企业,形成了广泛的社会影响。中国的合成生物学竞赛(Synbio Challenges)创办于2022年,开局良好,逐步走向国际化。这些都将为合成生物学、生命科学、交叉学科培养后备生力军。
3 合成生物学体系渐成
年来,合成生物学取得长足发展,成就显著(图1),逐渐减少对其他工程学科理论与实践的路径依赖。科学家对生命机制的理性探索(如基因网络调控原理和逻辑门的设计等)、多学科的介入(如系统生物学、工程学、化学生物学、计算机科学等)、相关领域(如遗传学及基因组学、微生物学及代谢工程学、生物化工与工程学等)专家的远见和执着驱动合成生物学快速发展,学科体系渐成。合成生物学基于基础理论指导,采取“自下而上”的工程学方法,发展使能技术,并解决生物体系工程化应用“标准化”与缺乏理性设计的难题,其学科体系主要涵盖基础理论、使能技术、创新应用等方面。与此同时,合成生物学的发展应同步关注与其适配的政策环境,伦理、政策与法律框架,注重科学普及公众参与(图2)。
图2 合成生物学学科体系框架
合成生物学基础理论包括两个方面:一是传统“定量生物学”方法,即通过定量表征组元和数理演绎建模的方法,构建知识驱动的“白箱模型”;二是从生物大数据出发,运用机器学习等“人工智能”方法加以统计归纳,构建数据驱动的“黑箱模型”。第一类方法适合循序渐进地增加系统的复杂度,而第二类方法则直接从成功案例中提取生命过程内在的结构和关联。
合成生物使能技术包括基因测序、基因组合成与组装,新一代基因组编辑技术,蛋白质设计工程(生物大分子工程、进化与设计),基因线路与细胞工程,无细胞体系,多细胞体系,非天然编码与杂合生物体系、正交生物体系等。此外,生物自动化铸造工厂以及器件资源信息平台在合成生物学的发展中发挥越来越重要的作用。
合成生物学的创新应用,包括两个层面,即“造物致知,造物致用”。造物致知是指构建生命体系(如人工细胞全合成),理解生物功能涌现及其底层原理。造物致用是指通过创造生物体系推动生物技术迭代发展及未来生物经济和可持续发展,其创新应用领域主要包括生物工业、生物医学、生物农业与未来食品、环境生物技术、生物与信息交叉技术(如生物传感、DNA存储)及地外生物等。
合成生物学的发展离不开良好的政策与监管环境。合成生物科技发展与产业创新应用的同时,需兼顾考虑生物伦理、生物安全、生物安保、监管、教育、公众参与等方面。简言之,科普教育、政策伦理和法规制定与合成生物科技与产业发展相伴而行,持续探讨和主动解决其潜在问题,为合成生物学健康发展保驾护航。随着理论、技术与应用的多轮驱动发展,合成生物学的学科体系将日臻完善。
4 总结与展望
生命科学的进步推动人类社会发展的进程。合成生物学通过构建生物体系可以更好地理解生命,也可以更好地服务人类,在生命科学和生物技术方面都具有重要意义。合成生物学体系的构建不仅推动生物工程应用的革命性发展,也为生命科学基础研究带来了崭新机遇。但是,当前合成生物学的发展也面临若干挑战,如全细胞模拟设计、人工细胞合成、实时生物传感、DNA设计的深度学习、定制和动态合成基因组、细胞群落和多细胞群落构建、为可持续性目标而设计的生物体等,需从理论与技术层面实现突破。
合成生物学未来的发展将受到多个关键因素的推动,每个因素都将为合成生物学体系的搭建和应用赋能提供前所未有的动力。首先,生命科学领域的发现和突破,为合成生物学的开创性发展奠定基础,揭示生物系统复杂性的新认知。其次,合成生物学定量理论的发展将进一步增强对生命机制与规律的理解,为“造物致知”和“造物致用”提供理论指导。再次,合成生物的底层工具和共性技术的不断迭代将重塑这一领域,使研究人员能够以更精准、高效的方式工程化生物体系。最后,由人工智能驱动的合成生物科技与产业将带来变革性的力量,大幅提升生物工具设计创制的能力、速度、精度,为合成生物研发与应用提供超乎想象的机遇,其影响涵盖从个性化医学到可持续生物制造的多个领域,最终将形塑一个理论突破、技术创新与赋能增效相互交织的未来。
本文发表于《中国生物工程杂志》2024年第1期,李玉娟, 傅雄飞, 张先恩. 合成生物学发展脉络概述. 中国生物工程杂志, 2024, 44(1): 52-60.
doi:10.13523/j.cb.2312105
原文链接:https://mp.weixin.qq.com/s/a9i65NB0D0T3FHtk373MKA