广州市锐博生物科技有限公司
- 联系人 :
- 地址 : 广州科学城科学大道182号· 创新大厦C3栋 13层
- 邮编 : 510663
- 所在区域 : 广东
- 电话 : 020-322*0221 点击查看
- 传真 : 点击查看
- 邮箱 : marketing@ribobio.com
技术简介
外显子组测序(Exome seq)是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法,外显子组测序是属于目标区域测序的一种类别。外显子组是一个物种基因组中全部外显子区域的总和,它是基因行使其功能最直接的体现。通过高通量测序技术进行外显子组测序,能够直接发现与蛋白质功能变异相关的遗传突变。目前,外显子组测序技术还应用到寻找与各种复杂疾病相关的致病基因和易感基因的研究中。
目前发现与人类疾病相关的基因突变位点已超过10 万个,但仍为人类基因组遗传变异的一小部分,尚有很多重要变异有待鉴定。外显子组测序是高效鉴定编码区变异的方法之一,其技术流程主要涉及病例和对照样本准备、靶向富集外显子组、高通量测序、数据分析并获得变异基因列表、与dbSNP数据库比较排除常见变异等。
技术特点
高信息度:针对感兴趣的编码区域进行遗传变异位点的寻找,对编码区域进行深入研究
缩短研究周期:加快文章发表与加速临床应用
更高通量:适合大样本量的研究
节约成本:相比于全基因组重测序,更加经济、高效
应用实例
1、人类基因组中低频变异分析
通常把人类基因组中最小等位基因频率(minorallele frequency, MAF)低于5% 的SNP称为低频变异。外显子组/目标区域测序可以发现基因编码区的
低频变异及对疾病具有不同效应的稀有变异,在人类疾病相关基因研究中具有重要作用。外显子组测序对等位基因频率相关研究具有重要意义,尤其是那些芯片平台中不涵盖的稀有和低频变异。
2、孟德尔单基因遗传病致病基因分析
多数孟德尔单基因遗传病是由基因组中蛋白编码区的碱基突变导致蛋白功能和表型改变所致。对这些疾病致病基因的研究会受到样本数、外显率和位点异质性等因素影响,通过连锁分析通常很难找到致病基因。理论上,外显子组测序可发现同一基因座上外显子区域的所有突变,因而能快速直接地鉴定致病基因。
利用外显子组测序技术在小样本中可以鉴定已知和新的致病基因,尤其对于罕见孟德尔遗传疾病的研究,可以对一个家系中的患病个体做外显子组测序,是一种相对高效低成本的研究策略,并且通过与连锁分析等策略相结合的方式在提高结果可信度的同时也减少了研究所需样本量。
图1 非同义编码单核苷酸多态性(nsSNPs)对编码蛋白的影响
3、癌症等复杂疾病相关基因变异分析
通常,来源于父母的肿瘤遗传易感基因具有以突变形式遗传、经常突变产生终止密码、在肿瘤发生过程中另一个未突变的等位基因在体细胞中发生突变失活等特征。通过对1名有家族史的胰腺癌患者外显子组测序分析,发现15461个种系基因组DNA 突变,含7318个同义突变、7721个错义突变、64个无义突变和250个插入/缺失突变,图2为PALB2的突变示意图。
图2 PALB2的突变示意图
服务流程
生物信息学分析内容
标准信息分析
1. 去除接头序列及低质量reads的处理
2. 测序序列与参考基因组比对
3. 进行数据产量统计分析、测序深度分析、覆盖度均一性分析
4. 全基因组reads分布图谱
5. 外显子区域测序深度及覆盖度分析
6. SNPs变异信息检测
7. SNPs变异的基因注释
8. 已知SNP的鉴定(dbSNP)
9. 基于千人基因组数据和6500个欧洲人外显子组数据的SNPs群体频率注释
10. 单样品SNPs保守性预测(phastConsElements46way)
11. SNPs的致病性分析(MutationTaster、LRT 、SIFT、Polyphen-2、PhyloP、GERP scores)
12. SNPs的基因功能元件分类注释
13. SNPs的编码功能变异注释(同义突变、非同义突变、终止子获得/缺失)
14. Indels变异信息检测
15. Indels变异的基因注释
16. 已知Indel的鉴定(dbSNP)
17. 基于千人基因组数据和6500个欧洲人外显子组数据的Indels群体频率注释
18. SNPs的基因功能元件分类注释
19. 变异图谱绘制
定制化信息分析
1. 孟德尔疾病致病基因筛选(基于遗传模型搜寻疾病基因)
2. 疾病易感基因GWAS注释
3. 特定/全部癌症的体细胞突变(COSMIC)注释
4. 融合基因识别
5. 变异基因GO功能富集分析
6. 变异基因KEGG生物通路分析
7. 变异蛋白相互作用网络分析
8. 变异位点差异分析
9. 拷贝数变异分析
10. Somatic/Germline的SNPs/Indels变异识别、保守性预测、致病性分析
11. 连锁分析
12. Tios de novo 突变分析(de novo突变体识别及频率)
13. 单倍型重构(分析基因型流向及重组位置信息)
14. 同源IBD分析(IBD: Identity-by-descent,家族成员可能的疾病突变位点,用于研究复杂性状和疾病表型。)
15. 全外显子组关联分析(要求大于200个对照组样品)