目的:探讨乳腺癌患者肠道病毒群落组成,分析乳腺癌患者肠道病毒群落的特点,研究肠道病毒种类及数量与乳腺癌病种之间是否存在关联,本研究对前来南昌大学第一附属医院就诊的26名乳腺癌患者及25名健康体检者的粪便样本进行了病毒宏基因组学研究,以期了解乳腺癌患者与健康体检者的肠道病毒谱之间的差异。方法:1.样本采集后,处理样本并提取样本中的病毒样颗粒(VLP)并制备宏病毒基因组文库,不同病毒基因组类型选择不同的建库方法构建DNA文库,已通过质检的文库将使用Illumina平台进行测序,并运用生物信息学方法对数据进行分析。2.通过生物信息学方法对获取的病毒序列分析后,根据NCBI taxonomy数据库注释信息,统计病毒分类信息,使用BWA软件,将测序获取的病毒reads与病毒数据库比对并进行注释,然后进行物种的差异分析和多样性分析。通过组间差异分析,比较两个组之间病毒物种组成的差异。结果:1.基于Illumina MiSeq测序平台对构建的51个粪便样本核酸文库进行高通量测序,我们总共获得582.7Gb、1942474022条原始数据(Raw reads),使用Trimmomatic软件对原始数据进行一系列处理,得到423.80Gb高质量的clean reads共1452560548条。1452560548条clean reads中能比对上病毒reads的有98669201条,占比为6.79%。2.我们从51个样本中共检测出11个病毒科,分别是:微小噬菌体科(Microviridae)占37.92%、短尾病毒科(Podoviridae)占16.34%、长尾噬菌体科(Siphoviridae)占15.46%、未分科病毒占12.48%、丝状噬菌体科(Inoviridae)占9.39%、埃凯曼病毒科(Ackermannviridae)占2.63%、肌尾病毒科(Myoviridae)占2.59%、类双生病毒科(Genomoviridae)占1.92%、疱疹病毒科(Herpesviridae)占0.88%、指环病毒科(Anelloviridae)占0.28%、逆转录病毒科(Retroviridae)占0.04%。微小噬菌体科无论在Con组还是BC组都占较高比例,为优势病毒科,分别multiscale models for biological tissues为39.60%和36.30%。3.Alpha多样性基于单个样品病selleckchem LBH589毒序列的RPKM值计算Shannon指数统计样品物种的均匀度,结果显示两组研究对象的Shannon指数无显著差异(P=0.69),说明两组研究对象病毒的多样性没有显著差异。Beta多样性分析结果提示两组样本的组内及组间相似性都较高,两组样本未见明显的区分。4.我们对组装好的31874条病毒contigs进行物种注释,总共注释得到313个属、2655个种;将预测并注释的功能基因与KEGG的基因数据库进行基因的同源性比对,在Level2水平上病毒基因丰度最高的功能集中在蛋白质家族(protein families)的相关功能上;在Level3水平上,共注释出226个代谢通路。5.采用线性回归分析(LDA)来估算每个病毒contig的丰度对差异效果影响的大小。结果提示,在属水平上,健康对照组中的Brussowvirus、Gemykib-ivirus、Bendigovirus、Phicbkvirus、Phikzvirus、Pbunavirus丰度显著高于乳腺癌病例组;而乳腺癌病例组中,Bongovirus、Casadabanvirus、Gemykrogvirus、Poushouviru s、Wbetavirus、Gemycircularvious以及Anelloviridae(指环病毒科)中的未分类病毒丰度显著高于健康对照组。在种水平上,健康对照组中丰度具有显著差异的病毒有12种,分别是:Roseburia_phage_Jekyll,Streptococcus_phage_Javan320,Podoviridae_sp_ctcf755,Clostridium_phage_HM2,SCP-456773treptococcus_phage_P7951,Stenotrophomonas_phage_Smp131,Streptococcus_phage_Javan374,Streptococcu s_phage_Str_PAP_1,Lactococcus_phage_98104,Staphylococcus_phage_Terranova,Pseudomonas_phage_vB_PaeM_SMS29,Streptococcus_phage_Javan336;乳腺癌病例组中丰度具有显著差异的病毒有3种,分别是:gemycircularvirus,Steno trophomonas_phage_S1,Torque_teno_virus。6.选用曼-惠特尼秩和检验(Mann-Whitney U test),计算得出各病毒相关序列在两组相对丰度的P值结果,我们总共计算了31874条病毒contigs的P值,其中差异具有统计学意义的病毒contigs有1547条;病毒注释出的313个属中,其中差异具有统计学意义的属有16个;病毒注释出的2655个种中,其中差异具有统计学意义的种有136个。结论:1.运用病毒宏基因组学方法,我们初步了解了乳腺癌患者肠道病毒群落的组成;2.多样性分析显示,乳腺癌病例组与健康对照组的肠道病毒群落组成类似,均具有丰富的多样性;3.本研究利用病毒宏基因组学技术研究乳腺癌患者及健康人群的肠道病毒差异,不仅丰富了现有的肠道病毒相关性研究,也为乳腺癌相关病毒的鉴定奠定了理论基础。