产前高频致病CNVs基因型-表型关系及复发性流产全基因组测序研究

研究背景:不良孕产史发生率约占临CX-5461研究购买床妊娠的20%,其中出生缺陷和复发性流产是临床上最常见的类型,其病因和机理尚不完全清楚。随着分子生物学与遗传学检测技术的发展,越来越多的出生缺陷和复发性流产患者得到明确诊断。我国新生儿出生缺陷发生率约为6%,染色体异常是其已知的主要病因。降低出生缺陷的主要手段是产前筛查和产前诊断,染色体核型分析仍然是产前诊断的金标准。近年来,随着染色体微阵列分析(chromosomal microarray analysis,CMA)、拷贝数变异测序(copy number variation sequencing,CNV-seq)等分子遗传技术的应用,使得许多核型分析无法检出的染色体微重复/微缺失得以诊断。虽然新技术的应用大大提高了产前染色体异常检出率,但同时也增加了产前遗传咨询的难度。产前检出的拷贝数变异(copy number variations,CNVs),特别是高频致病CNVs的基因型-表型关系有待进一步深入研究。复发性流产(recurrent spontaneous abortion,RSA)发生率占临床妊娠的2%~5%,其病因十分复杂。遗传学因素在RSA中起着关键作用,当前临床上针对RSA常用的遗传学病因筛查主要是流产组织CNVs检测和父母染色体核型分析。然而,即使经过全面病因排查,仍有约50%的RSA患者发病原因不明。近年来,虽然全外显子测序(whole exome sequencing,WES)技术被用于探索RSA的遗传学病因,但研究多单独集中父母或者流产物,缺乏对RSA家系整体评估。此外,由于WES技术的局限性无法检测基因组非编码区。随着测序技术的发展,全基因组测序技术(whole genome sequencing,WGS)在癌症和精准医学领域被用于探索各类复杂疾病的病因,但WGS对于RSA遗传学病因的研究有待进一步深入。研究目的:1.研究CMA与核型分析在产前诊断中检测结果差异性及对妊娠结局影响,评估二者联合应用的临床价值。2.研究产前检出高频致病CNVs的基因型-表型关系。3.基于高通量测序技术对于RSA流产组织遗传学异常检出结果,研究RSA不同高危因素与流产组织CNVs之间的关系。4.基于trios-WGS对RSA家系检测结果,探索RSA的遗传学病因,发掘与RSA相关候选基因,为RSA夫妇再妊娠的遗传咨询及基因功能研究提供基础。研究方法:本研究纳入2018年10月至2022年6月于吉林大学第一医院生殖产前中心行羊膜腔穿刺术单胎孕妇,共计6785例。所有孕妇均抽取30 m L羊水,其中20 m L羊水进行原代培养7-10天后进行细胞收获、染色体制片、G显带及核型分析;另外10 m L羊水提取基因组DNA后于Cyto Scan 750K Array染色体微阵列芯片系统检测全基因组拷贝数变异,最后通过SPSS 21.0软件比较两种技术检测染色体异常一致性。收集1345例羊水核型分析未见异常且CMA检出微重复/微缺失的单胎孕妇,通过基于QT编写的基因芯片软件对所有重复/缺失片段绘制CNVs分布图;结合文献检索归纳高频致病CNVs位点产前表型,基于DECIPHER数据库(https://decipher.sanger.ac.uselleckchem Smoothened Agonistk/browser)绘制高频致病CNVs模式图,分析其基因型-表型关系,筛选相关致病基因。收集2016年10月至2022年9月到我中心就诊的RSA夫妇流产组织共计1939例。提取流产组织基因组DNA后构建文库,在Proton测序平台上进行高通量测序,分析流产组织中检出的非整倍体及CNVs与RSA不同高危因素的关系。收集105个样本亲缘关系质控合格的RSA家系,提取RSA夫妇外周血及流产组织基因组DNA后,使用BGISEQ-500进行PE100全基因组测序。生物信息学分析应用人类表型本体(Human Phenotype Ontology,HPO)数据库、OMIM及小鼠基因组信息(Mouse Genome Information,MGI)数据库,整理与RSA相关的候选基因列表,筛选出RSA候选基因并进行Sanger验证。通过RCSB PDB、Alpha Fold Protein Structure database、Py MOL等数据库/软件绘制野生型和突变型蛋白模型结构图,分析候选基因突变对蛋白构象影响。研究结果:1.6785例羊膜腔穿刺孕妇中核型分析检出染色体异常634例,占9.34%。CMA检出染色体异常1280例,占18.87%。遗传学变异总检出率CMA相比核型分析增加了9.53%。2.随着孕妇年龄的增加,染色体数目异常检出率升高,致病/可能致病CNVs检出率降低(P<0.05),染色体结构异常及意义不明CNVs检出率在各年龄组间差异无统计学意义(P>0.05)。两项指征组及三项指征组的染色体数目异常检出率均高于单项指征组,差异有统计学意义(P<0.05),但染色体结构异常、致病/可能致病及意义不明CNVs在不同产前诊断指征数量分组中检出率无差异(P>0.05)。3.CMA与核型分析对于非整倍体检出率一致,但对于染色体嵌合体均存在不同程度漏诊,联合应用有利于提高嵌合体异常的检出率。CMA在染色体平衡性结构重antibiotic-bacteriophage combination排、染色体多态性、额外小标记染色体中能够额外检出致病/可能致病CNVs。4.胎儿核型正常但携带致病/可能致病及意义不明CNVs时,CNVs遗传自父母时终止妊娠率低,CNVs为新发突变时,终止妊娠率高(P<0.001)。5.1q21.1微重复产前表型与心血管系统畸形、鼻骨发育不良和NT增厚等有关。心血管系统异常可能与GJA5和GJA8基因拷贝数增加有关。1q21.1微缺失产前表型与泌尿系统异常、心脏畸形和NT增厚等有关。6.16p13.11微重复产前表型以NT增厚为主。16p11.2微缺失产前表型与脊柱/肋骨异常、心血管系统畸形和软指标异常等有关。其中,脊柱/肋骨发育不良可能与TBX6基因有关。7.17q12微重复产前表型与十二指肠梗阻,心脏畸形等有关。十二指肠梗阻可能与HNF1B基因有关。8.22q11.2微重复产前表型与NT增厚、侧脑室增宽等有关。22q11.2微缺失产前表型与心脏结构畸形、足内翻、羊水过多、NT增厚等有关。心脏结构畸形可能与TBX1基因有关。9.高通量测序对RSA流产组织遗传学异常检出率为50.03%。RSA胚胎染色体异常以非整倍体为主,以16-三体,X-单体和22-三体为主。流产组织片段性重复/缺失中,8号染色体频次最高。10.4p16.2p16.3、8p22p23、8q23q34、15q26和17p13位点CNVs可能与RSA相关。11.RSA流产组织中CNVs检测结果显示,高龄组、早期组染色体异常检出率均高于非高龄组、晚期组,差异有统计学意义(P<0.05)。不同受孕方式(自然受孕与辅助生殖)、复发流产次数、胚胎性别与RSA流产组织染色体异常相关性还有待进一步研究。12.Trios-WGS对RSA家系中遗传学异常总检出率为38.1%,致病性CNVs检出率为29.52%,致病性SNV检出率为8.57%。Trios-WGS对于染色体非整倍体检出率与高通量测序一致,对于亚显微CNVs检出率高于高通量测序,还可以检测单亲二体。13.Trios-WGS结合RSA相关候选基因列表筛选出与RSA相关9个候选基因,其中胚胎源性2个(TLE3、SLC35A2);母源性5个(PPP2R3C、TRIM37、SYCP3、CBX2、ATP7B);父源性2个(NME8、CFAP65)。蛋白三维结构预测模型显示,SYCP3、ATP7B和NME8基因突变改变了蛋白的结构。结论:1.CMA与核型分析联合更有助于提高产前遗传学异常检出率;CMA可以在染色体平衡性结构重排、多态性及额外小标记染色体胎儿中的检出致病性的微重复/微缺失。2.产前1q21.1微重复心血管系统畸形可能与GJA5和GJA8基因拷贝数增加有关;16p11.2微缺失中脊柱/肋骨发育不良可能与TBX6基因有关;17q12微重复中十二指肠梗阻主要与HNF1B基因有关;22q11.2微缺失中心脏结构畸形主要与TBX1基因有关。3.高通量测序技术对RSA流产组织染色体异常检出率为50.03%,以16-三体,X-单体和22-三体为主。RSA流产组织染色体异常与母亲年龄、流产孕周等因素有相关性。4.WGS对RSA家系中致病性SNV检出率为8.57%。检出9个与RSA相关候选基因,其中胚胎源性2个(TLE3、SLC35A2);母源性5个(PPP2R3C、TRIM37、SYCP3、CBX2、ATP7B);父源性2个(NME8、CFAP65)。