
知乎编 中国科学技术大学出版社2022年7月出版
刑侦片中警察是如何根据犯罪现场的一根头发最终抓到坏人的?(新冠肺炎)疫情常态化后,我们习以为常的核酸检测如何帮助医疗工作者辨别谁感染了病毒?未来就医,什么技术可以让医生在第一时间内获得病人的所有潜在疾病信息?这些都得益于强大的基因测序技术。在过去十几年中,中国科学家弯道超车,在商业基因测序的开发和生产上取得了重要成就,为我国成为世界医疗强国奠定了坚实基础。
什么是基因和基因的序列?
我们的遗传物质叫作脱氧核糖核酸,简称DNA,由四种化学碱基分子组成,分别为腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。DNA碱基相互配对,A与T配对,C与G配对,形成称为“碱基对”的单位。人类的DNA由大约30亿个碱基对组成,而这些碱基对出现的顺序决定了可用于构建和维持生命活动的信息,这就非常像字母表中的字母以特定顺序出现以形成单词和句子。
在一个人的身体中,每个基因都有两个拷贝,从父母双方各继承一个。基因就好比“遗传天书”中的一个有意义的章节或者段落,大小从几百个DNA碱基对到超过200万个碱基对不等。DNA中的一部分基因是用来制造蛋白质分子的指令,还有相当一部分基因和蛋白质合成无关。2000年初,“人类基因组计划”的国际研究测定了人类基因组的序列并识别其中包含的基因,估计人类有20000-25000个基因。大多数基因在所有人中都是相同的,但少数基因(不到总数的1%)在人与人之间略有不同,而正是这些微小的差异促成了每个人独特的身体特征。
通过解析和比较生命个体的基因序列,我们不仅能够判断该生物的种类,而且能够推演出其进化历史和其他物种之间的亲缘关系。基因测序已经在社会生活的各个方面广泛使用,例如农业育种、犯罪现场调查、亲子鉴定、精准医学、产前畸形儿筛查、流行病传播的追踪等。比如最近我们经常要用到的新冠病毒核酸检测,就是在知道了最新新冠病毒变种基因序列的基础上,对比从人体中采样得到的序列,如果两者的序列一致性非常高,那么就说明样品中含有该病毒变种。
如何对基因进行测序?
碱基对的尺寸非常小,肉眼是看不到的,所以科学家要借助一种叫作“波谱”的科学手段来观察。科学家们测量微观世界最常用的方法就是使用光,因为在所有可用于探测的微观粒子中光的能量最低,撞击分子后对分子本身扰动非常小;不同的分子会产生不同的信号,可以被探测器接收,然后在计算机的帮助下转化为科学家们可以理解的图像和语言,这就是波谱。
对于基因测序来说,其中一个方法就是把A、G、C、T4个碱基分子的信号转化为红、黄、蓝、绿四种颜色的光信号,每次一种颜色的光闪烁一下,被相机拍到,就得到一个序列的信息。例如,相机随着时间的顺序拍到了蓝、蓝、红、蓝、绿5个闪烁,系统就会自动处理为CCACT的碱基序列,这就是最终我们要的基因序列信息。
商用基因测序仪的发展近况
在2001年人类基因组计划刚刚完成的时候,每测出100万个碱基的序列花费大约是1万美元,到2022年这个费用已经降到了1美分以下。同时,适用于不同场景的基因测序仪也都应运而生,目前最小的便携式基因测序仪只有火柴盒大小,生物学家可以把测序仪带在身上,直接在深山老林的河流中取一滴水放入其中,插在笔记本电脑的接口之后,就能立刻测出水中微生物的基因序列,从而帮助他们发现新的物种。
在价格降低的同时,基因测序的速度也取得了突飞猛进的发展。例如2000年初的时候测序仪每次差不多能读出400个碱基序列,而现在最先进的商用测序仪已经可以轻松做到每次实验读出130亿个碱基序列。即便如此,科学家们仍然不满足,因为他们的目标是花费十几块钱,就能在十几分钟内读出一个人完整的基因组序列。如果这个目标能够实现,在不久的将来,我们去医院看病挂号的时候,基因测序可能就是一个常规项目,能够赋予医生对疾病“未卜先知”的本领。
我国商用基因测序技术的成就
从商用基因测序仪问世以来,一些外国企业一直垄断着基因测序仪的研发和生产,并且布局众多专利,形成了严密的知识产权“护城河”。因此,中国公司在这个价值千亿元的基因测序市场中没有取得先机。但是,我国一些企业通过产学研合作,后来居上。
例如华大集团在2013年斥巨资收购了美国高科技公司完整基因(Complete Genomics),结合中国本土的市场和国情,经创新整合之后,华大智造已成为全球三家能自主研发并量产基因测序仪的企业之一。在微缩化和便携化的基因测序仪研发上,成立于2016年的齐碳科技采用纳米孔链测序法原理作为研发的技术路线,2020年成功推出产品样机,且在蛋白工程、流体芯片、信号处理电器、软件算法等几个核心技术领域拥有完全自主知识产权。
在不久的未来,我国自主研发的测序仪不仅会比肩美国同级产品,还将在部分关键指标上领先,使得测序仪真正实现了中国“智造”,打破国外垄断。 (张国庆文,作者系中国科学技术大学博士生导师、合肥微尺度物质科学国家研究中心教授)