陕西特色山羊种质分析及陕西省遗传资源数据库构建

陕西省独特的地理气候特点、历史渊源和勤劳的人民共同造就了体型外ocular pathology貌和生产性状各异的山羊品种。本研究以陕北白绒山羊、关中奶山羊和陕南selleck激酶抑制剂白山羊这三个陕西省宝贵的山羊品种为研究核心,并联合12个其它家山羊品种及山羊属内的野山羊共计288个重测序数据,利用群体遗传学等多种分析方法对山羊品种资源进行遗传多样性评价和进化潜力评估,并训练出品种识别模型以及构建了陕西省遗传资源数据库,从而为之后采取更有效的保护措施以及健康可持续的利用这些资源奠定了基础。主要研究内容和结果如下:(1)本研究样本平均测序深度为14.64×,共检测出29422980个SNP。通过群体遗传结构分析,发现陕北白绒山羊与辽宁绒山羊聚为一支,情况符合辽宁绒山羊为陕北白绒山羊父本的选育历史;关中奶山羊与萨能山羊、吐根堡山羊和唐山奶山羊形成一个大的聚类;陕南白山羊品种分化度相对于其它山羊品种较高。通过期望杂合度(He)、连锁不平衡(LD)、观察杂合度(Ho)、核苷酸多样性(Pi)、纯合性片段(ROH)和基于ROH的近交系数分析,结果显示陕北白绒山羊相比其它山羊品种观察杂合度更高;关中奶山羊群体的一致性较好,并且有较高的杂合度;陕南白山羊长ROH片段数量多,近交系数高,这提示对陕南白山羊的保护工作还需不断加强。(2)利用目标品种与非目标品种频率初步筛选品种高频位点,通过随机森林(RF)对位点进行重要程度可视化,最后使用支持向量机(SVM)开发品种识别模型,验证方法使用五折交叉验证,模型评价指标使用准确率(AccuraCL13900cy)、精确率(Precision)、召回率(Recall)。结果显示,开发的模型可有效实现目标品种和非目标品种的区分。(3)基于LAMP(Linux操作系统、Apache网络服务器、My SQL数据库、PHP编程语言)架构搭建陕西省遗传资源数据库。数据库中除了包含以上三个山羊品种之外,还纳入了秦川牛、关中驴、略阳鸡和榆林地区中华蜜蜂这四个遗传资源。数据库提供变异和选择信号信息检索以及品种信息、基因组组装情况展示等,其中交互式表格通过Data Tables插件实现,地图以及数据映射通过Echarts插件实现。变异数据检索结果包括次等位基因频率、位点注释信息和各个品种和群体的频率分布情况,选择信号模块用户可以在检索页面选择不同的检测方法例如Tajima’D、Hp、Pi ratio等,结果主要以曼哈顿图和表格的形式展示。本研究构建的陕西省遗传资源数据库为用户了解陕西省重要的遗传资源提供了窗口,同时也为研究人员挖掘与经济性状相关的功能位点和候选基因提供了便捷工具。链接为http://animal.omics.pro/code/index.php/Shaanxi/。综上,本研究从全基因组水平上系统的分析了陕北白绒山羊、关中奶山羊、陕南白山羊的群体遗传结构和遗传多样性情况,并利用机器学习等多种方法开发出品种识别模型,具有较好的应用价值,同时构建了陕西省遗传资源数据库,为进一步加强遗传资源的保护工作和科学合理育种提供了参考。