扩增子,到底扩的是个什么
1 | 由于多次delay,群落微生物专题发生了“便秘”,经过半年的更新才到真正的主题。 |
在前几期中,我们介绍过,无论是土壤还是人体,都有着大量的微生物,起着微妙的“生态”功能。
环境微生物应该怎么研究?
目前主流的群落研究,包括肠道、土壤、水体、口腔、阴道等,在群落微生物中,由于缺乏原位培养的环境信息,我们能够在实验室进行纯培养的只有不到3%,而其余的97%在其所处的环境稳态中又发挥着主要的作用。
~
对环境中所有微生物进行研究,就需要脱离这个培养的思路,直接从基因或者物种的角度来入手探讨其功能。
~
在环境微生物研究中,人们通常会利用指定的引物来扩增微生物的16S rDNA/18S rDNA/ITS的高度可变区域,通过测序PCR产物来分析微生物的群落结构(微生物的种类、相对丰度、进化关系等)。
RNA与核糖体蛋白结合形成核糖体,在微生物的核糖体RNA上,有着几种亚基。原核生物的核糖体包括5S、16S和23S,而真核生物有5S、5.8S、18S和28S。
~
16S rRNA为细菌核糖体RNA的一个亚基,含量高、拷贝数多,长度为1540bp,存在于所有细菌染色体中,分为保守区(9个)和高度可变区(10个),保守区序列能够体现出来细菌物种之间的亲缘关系,而高度可变区序列反映了物种间的差异。
~
因而成为细菌群落测序的分子钟,可以体现出不同菌株的差异信息。16S测序是将提取好的细菌基因组DNA,通过对某一段或几段高变区序列(V4区或V3-V4区)进行PCR扩增,建库后进行测序。
~
而编码16S rRNA的基因就是16S RDNA。严谨来说叫16S rDNA测序或者16S rRNA基因测序。类似的,18S rDNA作为真菌群落测序的标志物,既有保守区,也有可变区(V1-V9,没有V6区)。
~
由于16S较长(1540bp),而当时主流的测序仪受读长的限制,我们对可变区进行测序就可以获知到菌株的分类信息。主要是对测序成本的考虑,通常测定16S或18S的某个区域,而不是对全长进行测序(三代测序可以全长测序,视课题组经费决定)。
对于不同的环境样本,应该采用特定的测序区域以获得最佳的测序结果。上面提到,16S rDNA有9个可变区域。v1-v9,大多数研究采用v3或者v4区域测序。取决于测序仪器的特点,也有v3-v4两个区域一起测的(最为常用)。除此之外,某些特殊环境样本中,采用了v6或者v2区域测序。总之,区域的选择主要是为了更多的获得细菌群落信息。而在真菌18S测序中,v4区域使用最多。
ITS测序,ITS序列为内源转录间隔区域,位于真菌18S、5.8S和28S rRNA基因之间,分别为ITS 1和ITS 2,具有种内相对一致种间差异明显的优点。
~
测序之后,我们对扩增子测序的原始下机数据先进行去接头、去引物、质控和去冗余等预处理,此后进行聚类生成OTU。
OTU(operational taxonomic units)我们叫可操作分类单元,是微生物研究中的一个基础分类单元之一,通过对序列97%的相似性聚类生成。(初学的朋友们会有点蒙,可以把它作为“种”,如果需要将微生物鉴定为菌株水平,需要宏基因组测序,以后介绍)。主流软件为qiime2、USEARCH、VSEARCH,下次会介绍分析流程及方法。
群落微生物专题
- 开篇:微生物主宰世界,细菌奴役人类
- 神奇的人体第二大脑-肠脑
- 人体微生物是个筐,啥都可以装?
- 它们不高兴,宫颈癌就会找上门
- 咚咚咚:搞作物的醒醒啦,根际微生物了解一下
- 茅台之所以为茅台
- 扩增子,到底扩的是个什么
- 宏基因组出马,一个都别想跑
- 谁还测不起个扩增子呢,附分析流程
- 分箱组装那些事
- 这年头,不跟人工智能挂个勾都不好意思跟人打招呼
- α多样性,β多样性,傻傻分不清楚
- 宏基因组分析流程及机器要求
- PCA、PCoA、CCA…
- …