A brief version of this protocol appeared in:
Advertisement

Navigate this Article


 

Protocol for Cross-species Target-gene Enrichment   

How to cite Favorites Q&A Share your feedback Cited by

摘要:本实验方案介绍了一种跨物种靶基因富集的方法,可以获得与探针相似度低至60-70%的目标基因序列。该方法能用于获得成千上万个单拷贝核基因编码序列,用于系统发育基因组学 (phylogenomics) 分析;也可以用于其它非模式生物功能基因的富集。实验方案包括三个实验方法和相关数据分析方法。1."MagNA磁珠清洗法纯化DNA产物"描述了通过自配MagNA清洗磁珠和缓冲液,可以几乎无成本地纯化DNA,用于靶基因文库构建和富集的各个步骤,也可用于一般的DNA纯化需求;2."文库构建"介绍了如何构建用于靶基因富集的Illumina文库;3."靶基因富集"是关于跨物种靶基因富集实验过程的详细步骤。另外,本方案还介绍了以单拷贝外显子为目标基因富集数据的组装和分析方法。本方案尽量选用实验室自配溶液和降低成本的设计,并尽可能地详尽描述实验步骤,旨在为相关科研工作者开展系统发育基因组学研究或其它方向的研究提供一种可操作、高效、低成本的解决方案。

关键词: 目标基因捕获, 外显子, 文库构建, 高通量测序, 数据组装, 系统发育基因组学

研究背景

        传统分子系统学研究往往采用一个或几个基因标记,通过设计PCR引物,扩增目标基因,然后克隆、测序。这种方法耗时费力,一次只能获得一个样本一个或几个基因的序列。随着测序技术的提高和测序成本的不断下降,越来越多的动物系统学和进化研究开始使用基因组水平的数据。但是目前采用全基因组测序的方法成本太高,特别是当研究涉及物种较多或者每个物种有多个样品的情况下。因此,越来越多的研究者通过使用简化基因组或靶基因富集等方法,获得基因组的部分同源序列用于系统学研究。
        简化基因组依靠限制性内切酶位点来选择同源序列,此方法用于遗传距离较远的物种往往不能保证序列的同源性,还可能会导致大量数据的缺失。而通过锚定超保守序列的基因富集方法,如ultraconserved elements (UCEs) 或anchored hybrid enrichment (AHE) 等方法获得的大部分序列是超保守的序列和非编码的侧翼序列。超保守序列提供的系统发育信息不足,而侧翼非编码序列与编码序列相比无论是在序列比对和适用分子进化模型等方面都还不成熟,不太适合用于系统学分析。另外,无论是UCEs还是AHE可用的标记数量有限。本方案介绍一种跨物种靶基因富集技术,通过改变杂交条件,降低杂交和清洗温度等步骤获得相似度低至60-70%的目标基因序列。因此,该方法比UCEs或AHE更具优势,可以用于富集不同物种的编码基因,能更好地用于系统发育基因组学的研究;也可以用于获得非模式物种的目标基因序列,用于基因功能进化的研究。
        本实验方案结合自主开发用于系统发育基因组学研究的分子标记,已成功应用于桑科植物 (Yao et al., 2013)、蚂蚁 (Stroeher et al., 2013)、绦虫 (Huan et al., 2016)、线虫、纤毛虫,鱼类 (Song et al., 2017,Yin et al., 2019)、爬行类和哺乳类等生物类群中。本实验方案尽量采用自配溶液和降低成本的设计,可以一次性获得一百多个样品的几千个基因序列。每个样品建库、富集和测序的总成本可以控制在300-400元。

材料与试剂

一、"MagNA磁珠清洗法纯化DNA"试剂清单

  1. 5% Sera-Mag Magnetic Speed-beads (Fishersci,catalog number: 09-981-123,4 °C储存)
  2. PEG-8000 (生工,catalog number: A600433-0500,常温储存)
  3. 5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度)
  4. 1 M Tris-Cl (pH = 8.0) (生工,catalog number: B548127-0500,常温储存)
  5. 0.5 M EDTA (pH = 8.0) (Invitrogen,catalog number: 15575-020,常温存储)

二、"靶基因富集文库构建"试剂清单

  1. Buffer Tango (10x) (Thermo, catalog number: BY5,-20 °C储存)
  2. dNTPs (10 mM each) (Invitrogen,catalog number: 18427088,-20 °C储存)
  3. ATP (100 mM) (Thermo,catalog number: R0441,-20 °C储存)
  4. T4 polynucleotide kinase (10 U/μl) (Thermo,catalog number: EK0031,-20 °C储存)
  5. T4 DNA polymerase (5 U/μl) (Thermo,catalog number: EP0061,-20 °C储存)
  6. T4 DNA ligase (5 U/μl) (Invitrogen,catalog number: 15224041,-20 °C储存)
  7. T4 DNA ligase buffer (10x) (T4 DNA ligase试剂盒配套)
  8. PEG-4000 (50%) (T4 DNA ligase试剂盒配套)
  9. Bsm polymerase, large fragment (8 U/μl) (Thermo,catalog number: EP0691,-20 °C储存)
  10. Bsm buffer (10x) (Bsm polymerase, large fragment (8U/μl) 试剂盒配套)
  11. KAPA HiFi Hotstart Ready Mix (2x) (KAPABIOSYSTEMS,catalog number: KK2602,-20 °C储存)

三、"靶基因富集"试剂清单

  1. UltraPure™ SSPE, 20x (Invitrogen,catalog number: 15591043,常温储存)
  2. UltraPure™ 0.5M EDTA, pH 8.0 (Invitrogen,catalog number: 15575020,常温储存)
  3. Denhardt's Solution (50x) (Invitrogen,catalog number: 750018,-5 °C ~-30 °C储存)
  4. 10% SDS溶液 (生工,catalog number: B548118-0100,常温储存)
  5. SUPERase•In™ RNase Inhibitor (20 U/μl) (Invitrogen,catalog number: AM2696,-20 °C储存)
  6. DEPC 处理水 (生工,catalog number: B501005-0500,常温储存)
  7. RNA baits (Arbor Bioscience,-20 °C储存)
    注:RNA baits是一段带有生物素标记、与目标基因互补配对的RNA序列。通过杂交反应与目标基因结合,其特有的生物素能与链霉亲和素磁珠特异结合,根据此特性清洗去除非目标序列以达到富集效果。RNA baits可以根据目标基因进行设计,例如通过比较模式生物基因组寻找单拷贝核基因编码序列,设计RNA baits (Li et al., 2012)。
  8. Human Cot-1 DNA (Invitrogen,catalog number: 15279011,-20 °C储存)
  9. BO1 (封阻片段1,序列见"溶液配制")
  10. BO3 (封阻片段3,序列见"溶液配制")
  11. Dynabeads™ MyOne™ Streptavidin C1 (Invitrogen,catalog number: 65002,2-8 °C储存)
  12. Binding Buffer (成分见"溶液配制")
  13. Tween-20 (Amresco,catalog number: 0777-1L,常温储存)
  14. Wash Buffer2 (成分见"溶液配制")
  15. Wash Buffer1 (成分见"溶液配制")
  16. 1x TE buffer (生工,catalog number: B548106,常温储存)
  17. KAPA HiFi Hotstart Ready Mix (2x) (KAPABIOSYSTEMS,catalog number: KK2602,-20 °C储存)
  18. 20x SSC 缓冲液 (生工,catalog number: B548109-0200,常温储存)
  19. 1 M Tris-HCl 溶液,pH 7.5,无菌 (生工,catalog number: B548124-0500,常温储存)
  20. HPLC超纯水 (TEDIA,catalog number: WS2211-001,常温储存)

四、其他耗材

  1. 0.2 ml 薄壁PCR管 (Axygen,catalog number: PCR-02-L-C)
  2. 各种型号的带滤芯枪头 (10 μl,100 μl,200 μl,1000 μl,Axygen)
  3. 0.2 ml 96孔PCR板盒 (淘宝)
  4. 自制磁板 (超强磁条 (淘宝) 嵌套于0.2 ml 96孔PCR板盒)

仪器设备

  1. PCR仪 (Eppendorf AG,22331 Hamburg)
  2. 杂交仪 (UVP HB-1000 Hybridizer)
  3. 0.1-2.5 μl, 0.5-10 μl, 2-20 μl, 10-100 μl, 20-200 μl, 100-1000 μl移液枪 (Eppendorf系列)
  4. 漩涡混匀仪 (上海沪析实业有限公司,Vortex-2)
  5. 微型掌上离心机 (上海沪析实业有限公司,HL-6KS)
  6. Nanodrop 3300超微量荧光分光光度计 (Thermo)
  7. 破碎仪 (Covaris M220)
  8. 高压蒸汽灭菌锅 (上海博讯实业有限公司)
  9. 服务器 (Linux系统,32 G以上的内存,500 G的存储)
  10. 电泳仪 (BIO-RAD,PowerPac-Basic)

分析软件

  1. Perl v5.18 or higher (https://www.perl.org/get.html)
  2. trim_galore v0.4.1 or higher (https://github.com/FelixKrueger/TrimGalore)
  3. cutadapt v1.2.1 or higher (https://github.com/marcelm/cutadapt)
  4. USEARCH 10.0.240 or higher (http://www.drive5.com/usearch/download.html)
  5. SGA v0.10.15 or higher (https://github.com/jts/sga)
  6. Exonerate v2.2.0 or higher (https://www.ebi.ac.uk/about/vertebrate-genomics/software/exonerate)
  7. Assexon (https://github.com/yhadevol/Assexon)
  8. Mafft v7.294b or higher (https://mafft.cbrc.jp/alignment/software/)
  9. RAxML (https://github.com/stamatak/standard-RAxML)
  10. ASTRAL (https://github.com/smirarab/ASTRAL)
  11. Figtree (http://tree.bio.ed.ac.uk/software/figtree/)

实验步骤

本实验方案包括三个部分:1.MagNA磁珠清洗法纯化DNA产物;2.文库构建;3.靶基因富集。

一、MagNA磁珠清洗法纯化DNA产物

  1. 将30 μl的MagNA磁珠加入到0.2 ml PCR空管,将PCR管放在磁板上静置片刻,待磁珠吸附到管壁后,去除上清液 (可丢弃吸附上的磁性不强磁珠)。
  2. 以1:0.9的比例添加DNA样品与MagNA缓冲液 (见溶液配制),随后涡旋振荡PCR管片刻,使其充分混匀。
    注:1:0.9的比例是根据经验值而定,可最大化减少试剂的使用量、减少短片段的丢失,建议读者在配制MagNA缓冲液后,做浓度梯度预实验来确定最优的比例
  3. 常温下将PCR管置于96孔板上5 min (使磁珠吸附DNA),用微型离心机离心5 s。
  4. 将PCR管转移至磁板上5 min,直到磁珠吸附到管壁上。随后去除上清液,注意不要吸到磁珠。
  5. 继续将PCR管置于磁板上,添加186 μl的70%乙醇,用于清洗残留的MagNA缓冲液。静置1 min,随后去除上清液。
    注:不要吹打溶液,无需混匀磁珠
  6. 重复步骤5一次。
  7. 将PCR管盖敞开,室温静置5 min,使残留的乙醇彻底挥发。
  8. 添加20 μl DEPC处理水或1x TE缓冲液,将PCR管从磁板转移到96孔板上,用移液枪缓慢吹打溶液3-5次,使其充分混匀,室温静置1 min (释放DNA),随后离心5 s。
  9. 将PCR管放回磁板上,静置1 min,随后将上清液转移至新管中。
    注:在下面建库和富集过程中,往往不需洗脱DNA,而是保留有DNA的磁珠,此时省略第8-9步。

二、文库构建

  1. DNA片段化
    1.1
    取0.3-1 μg DNA样品 (DNA片段大于100 bp),用Covaris M220破碎仪将DNA破碎成100-500 bp片段 (破碎仪可参考如下设置:Average Incident Power: 15 Watt, Peak Incident Power: 75 Watt, Duty Factor: 20%, Cycles/Burst: 200, Duration: 360 s;片段化DNA样品所需体积270 μl)。
    1.2
    分别取1 μl片段化产物和1 μl初始DNA,使用1%琼脂糖凝胶电泳进行检测。
    1.3
    取130 μl片段化DNA,正对照 (用于做正对照的样品可以是一般PCR产物,如300 bp左右的PCR产物) 和负对照 (30 μl超纯水) 作对比实验,用MagNA磁珠清洗法将片段化DNA吸附到磁珠上,随后去除上清液。


    图1. 破碎后的DNA示意图 图上分别为DNA样品和片段化DNA。

  2. 平末端修复
    2.1
    在冰盒上配制"平末端修复"反应溶液。将20 μl的反应溶液加入每个样品 (上一步保留的磁珠),并轻轻吹打3-5次混匀。

    成分体积 (μl)终浓度(20 μl体系)
    Buffer Tango (10x)21x
    dNTPs (10 mM each)0.2100 μM each
    ATP (100 mM)
    T4 polynucleotide kinase (10 U/μl)
    T4 DNA polymerase (5 U/μl)
    DEPC处理水
    0.2
    1
    0.4
    16.2
    1 mM
    0.5 U/μl
    0.1 U/μl
    总体积20
    注:建议在冰盒上进行操作

    2.2
    设置"平末端修复"程序如下:

    步骤循环阶段温度时间循环数
    1平末端25 °C15 min1
    2DNA 5‘端磷酸化修饰12 °C5 min1
    注:反应完成后,将PCR管离心5 s以免管盖内壁附着液滴,可以减少污染。

    2.3
    利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠),最后去除上清,保留磁珠。(仅做到磁珠清洗法的第7步)
    注:反应完成后需立即纯化,纯化产物可以4 °C过夜保存。
  3. 连接测序接头
    3.1
    在冰盒上配制"连接测序接头"反应溶液:

    成分体积 (μl)终浓度(40 μl体系)
    T4 DNA ligase buffer (10x)41x
    PEG-4000 (50%)45%
    Adapter mix P5 (50 μM each)
    Adapter mix P7 (50 μM each)
    T4 DNA ligase (5 U/μl)
    DEPC处理水
    1
    1
    1
    29
    1.25 μM each
    1.25 μM each
    0.125 U/μl
    总体积40

    3.2
    将40 μl反应溶液加入上一步样品 (上一步保留的磁珠)中,轻轻吹打3-5次混匀。
    3.3
    设置"连接测序接头"程序如下:

    步骤循环阶段温度时间循环数
    1连接测序接头22 °C30 min1
    注:反应完成后,将PCR管离心5 s。

    3.4
    利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠),最后去除上清,保留干燥的磁珠。(仅做到磁珠清洗法的第7步)
    注:纯化产物可以4 °C过夜保存
  4. 缺刻补齐
    4.1
    在冰盒上配制"缺刻补齐"反应溶液:

    成分体积(μl)终浓度(40 μl体系)
    Bsm buffer (10x)41x
    dNTPs (10 mM each)
    Bsm polymerase, large fragment (8 U/μl)
    DEPC处理水
    1
    1.5
    33.5
    250 μM each
    0.3 U/μl
    总体积40

    4.2
    将40 μl反应溶液加入到上一步的样品 (上一步保留的磁珠) 中,轻轻吹打3-5次混匀。
    4.3
    设置"缺刻补齐"程序如下:

    步骤循环阶段温度时间循环数
    1补齐缺刻37 °C20 min1
    注:反应完成后,将PCR管离心5 s。

    4.4
    利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠),去除上清,将35 μl的1x TE缓冲液加入到每个样品中,保留磁珠在PCR管中,在管盖上标注"样品名+lib"。此时靶基因待富集文库已构建完成,可放于-20 °C环境下短期储存一个月。

  5. 预杂交PCR扩增在冰盒上配制"预杂交PCR扩增"反应溶液:

    成分体积 (μl)终浓度(25 μl体系)
    KAPA HiFi taq Ready Mix (2x)12.51x
    Primer IS7 (10 μM)
    Primer IS8 (10 μM)
    0.75
    0.75
    0.3 μM
    0.3 μM
    总体积14

    5.2
    将14 μl上述反应液加入到0.2ml PCR空管中,再分别加入11 μl第四步获得的样品 "lib"文库 (切记磁珠与溶液混匀后再吸取)。将样品与试剂吹打3-5次,充分混匀。设置"预杂交PCR"程序如下:

    步骤循环阶段温度时间循环数
    1预变性98 °C45 s1
    2变性98 °C15 s12-18 (具体循环数根据所添加样品的量而定)
    退火60 °C30 s
    延伸72 °C45 s
    3延伸72 °C1 min1
    4降温4 °C5 min1
    5保存12 °C1

    5.3
    利用MagNA磁珠清洗法进行纯化 (需要添加新的MagNA磁珠!),然后将25 μl的1x TE缓冲液加入到每个样品管里,将上清液转移至新的0.2 ml PCR空管中,在管盖上标注"样品名+PreH",可放于-20 °C环境下短期储存一个月。
    5.4
    分别取1 μl "PreH"产物、1 μl 正对照原液 (300 bp),使用1%的琼脂糖凝胶电泳进行检测。若文库构建成功,则正对照的"PreH"产物长度比正对照原液稍长,且负对照的"PreH"产物中无条带。


    图2. 靶基因待富集文库构建结果电泳图 "J1"-"C15"共14个实验样品,"300 bp-lib"为正对照,"-"为负对照,"300 bp"为建库前的正对照DNA原液。Marker-D的片段大小从下至上分别为100 bp, 250 bp, 500 bp, 750 bp, 1 k, 2 k。

三、靶基因富集

  1. 杂交
    1.1
    设置"靶基因富集"程序:

    步骤循环阶段温度时间循环数
    1变性解链95 °C5 min1
    2预退火杂交65 °C5 min1
    3退火杂交65 °C240 min1
    4退火杂交60 °C240 min1
    5退火杂交55 °C240 min1
    6退火杂交50 °C240 min1

    保存50 °C
    注:共计16 h左右。 (通过降低退火温度、设定退火梯度温度,可杂交结合相似度低至60-70%的序列)

    1.2
    在室温下配制Hyb Baits Mix溶液 (杂交反应体系与RNA酶抑制剂),反应体系如下:

    成分体积 (μl)
    HYB 20x SSPE7
    HYB 0.5 M EDTA (pH = 8.0)0.3
    HYB 50x Denhardt’s3
    HYB 10% SDS0.3
    SUPERase•In (20U/μl)1
    RNA Baits (MYselect)0.2
    DEPC处理水4.8
    总体积16.6
    注:各试剂添加完后,用移液枪轻轻地吹打混匀,随后用微型离心机离心5 s,将溶液集中到底部。

    1.3
    在室温下配制Lib Mix溶液 (封阻简单重复序列与接头测序序列),Lib Mix反应体系如下:

    成分体积(μl)
    Block Human Cot1 (1 μg/μl)2.5
    BO1.P5.F (200 μM)0.5
    BO3.P7.part1.R (200 μM)0.5
    总体积3.5

    各试剂添加完后,用移液枪轻轻地吹打混匀,随后离心5 s,将溶液集中到底部。
            取0.2 ml薄壁PCR空管,在管盖上标注样品名。将3 μl的Lib Mix溶液加入到每个PCR管中,然后再分别加入11 μl样品"PreH"产物 (含有至少100 ng DNA),用移液枪轻轻地吹打混匀,随后用微型离心机离心5 s,将溶液集中到底部。
    1.4
    将混有Lib Mix和样品文库的PCR管放至PCR仪上,并启动反应程序。此时进入程序第一步,对DNA文库进行95 °C高温变性解链处理。
    1.5
    当程序到达第二步 (65 °C),将含有Hyb Baits Mixs的管子载入PCR仪,预热Hyb Baits Mix 5 min,期间混有Lib Mix和样品文库的PCR管始终置于PCR仪上。
    1.6
    5 min后,PCR仪上的管子不取出,继续维持65 °C,将16 μl的Hyb Baits Mix转移到混有Lib Mix和样品的PCR管中,用移液枪轻轻吹打混匀3-5次。盖紧PCR管。
    1.7
    维持反应体系在恒温体系下,直至程序结束。
    注:程序结束后,样品仍可在PCR仪上50 °C条件下放置数小时。
  2. Dynabeads链霉亲和素磁珠吸附与清洗
    2.1
    加nx 10 μl Dynabeads链霉亲和素磁珠到0.2 ml PCR新管中,每个PCR管中添加的磁珠不得超过100 μl,方便后续步骤清洗。
    2.2
    将PCR管静置于磁板上片刻,待磁珠吸附到管壁之后,去除上清液。
    2.3
    加100 μl的Binding缓冲液于PCR管中清洗磁珠。用移液枪轻轻吹打混匀。继续将PCR管静置于磁板上2 min,待磁珠吸附到管壁之后,去除上清液 (包含尚未被吸附到管壁上的少许磁珠)。
    2.4
    重复步骤2.3两次。
    2.5
    将nx 20 μl Binding缓冲液、1 μl 10%的Tween加入到步骤2.4的PCR管 (此时仅有磁珠),轻轻吹打混匀,将磁珠再次悬浮。
    2.6
    先将180 μl的Binding缓冲液加入到新的0.2 ml PCR空管中,再加入20 μl步骤2.5的磁珠悬浮液。
    2.7
    将步骤2.6配制好的200 μl磁珠溶液放置在PCR仪50 °C加热5 min。
    2.8
    将"靶基因富集"步骤1.7中的杂交产物加入到磁珠悬浮液中,用移液枪轻轻吹打混匀。随后将PCR管放入杂交仪中,50 °C反应30 min。同时在PCR仪上预热3x nx 190 μl Wash Buffer 2溶液 (提前配制Wash buffer 1,以Wash buffer 1为原料配制Wash buffer 2),保持50 °C 10 min。
    2.9
    待步骤2.8杂交结束后,用微型离心机离心5 s,将PCR管转移至磁板上 (磁板提前在杂交仪中预热),并在杂交仪中静置片刻 (不超过2 min),待磁珠吸附到管壁后,去除上清液。
    2.10
    将带有磁珠的PCR管放回PCR仪上 (程序维持在50 °C)。添加186 μl 50 °C的Wash Buffer 2到PCR管中,轻轻地将磁珠吹打混匀。继续在50 °C PCR仪上反应10 min。待10 min反应结束后,将PCR管静置于磁板上片刻 (不超过2 min),待磁珠吸附到管壁后,去除上清液。
    2.11
    重复步骤2.10两次。
    2.12
    在室温下将100 μl的1x TE缓冲液加入到PCR管中 (用以清洗残留的Wash Buffer 2)。将PCR管静置于磁板上1 min,待磁珠吸附到管壁后,去除上清液。
    2.13
    将35 μl的1x TE缓冲液加入PCR管中,在管盖上标注"样品名+1stcap",将其放置在-20 °C短期保存 (溶液中依然保留有磁珠)。
    注:清洗步骤时,减少PCR管暴露在室温的时间,尽量保持反应溶液在50 °C。步骤2.9应尽量移除干净上清液。
  3. 第一次杂交PCR (为第二次杂交作准备)
    3.1
    在冰盒上配制PCR扩增反应溶液:

    成分体积 (μl)终浓度(25 μl体系)
    KAPA HiFi HotStart Ready Mix (2x)12.51x
    P5引物IS7 (10 μM)0.750.3 μM
    P7引物IS8 (10 μM)0.750.3 μM
    总体积14

    将14 μl上述所配制的PCR扩增反应溶液加入到新的0.2 ml PCR空管中,随后添加11 μl第一次杂交1stcap产物 (确保磁珠与溶液混匀后再吸取),在管盖上标注样品名。用移液枪轻轻吹打3-5下。用以下PCR反应程序进行扩增:

    步骤循环阶段温度时间循环数
    1预变性98 °C45 s1
    2变性98 °C15 s12-14 (具体循环数根据所添加样品的量而定)
    退火60 °C30 s
    延伸72 °C45 s
    3延伸72 °C1 min1
    4降温4 °C5 min1
    5保存12 °C1

    3.2
    用MagNA磁珠法清洗PCR扩增产物 (需要添加新的MagNA磁珠!)。清洗结束后,用25 μl的1x TE缓冲液进行洗脱,将上清液转移至新的200 μl PCR空管中,在管盖上标注"样品名+preH2"
    3.3
    取1 μl的PCR产物稀释10倍后,用Nanodrop3300分光光度计进行浓度的测定,产物稀释后浓度约在1 ng/μl左右。
  4. 用步骤3的PCR产物再做一遍杂交富集,即二次杂交 (重复步骤1和2)。第二次杂交并清洗后的产物命名为"样品名+2ndcap"。
  5. Indexing PCR
    5.1
    在冰盒上配制PCR扩增反应溶液如下:

    成分体积 (μl)终浓度(25 μl体系)
    KAPA HiFi HotStart Ready Mix (2x)12.51x
    P5引物IS4 (10 μM)0.50.2 μM
    总体积13

    将13 μl上述所配制的PCR扩增反应溶液加入新的0.2 ml PCR空管,添加0.5 μl P7 index扩增引物 (见溶液配制),随后添加11.5 μl的第二次杂交2ndcap产物 (确保磁珠与溶液混匀后再吸取)。吹打混匀并离心5 s。用以下PCR程序进行扩增:

    步骤循环阶段温度时间循环数
    1预变性98 °C45 s1
    2变性98 °C15 s12-16 (具体循环数根据所添加样品的量而定)
    退火60 °C30 s
    延伸72 °C45 s
    3延伸72 °C1 min1
    4降温4 °C5 min1
    5s保存12 °C1

    5.2
    用MagNA磁珠法清洗PCR扩增产物 (需要添加新的MagNA磁珠!)。清洗结束后,用25 μl的1x TE缓冲液进行洗脱,将上清液转移至新的200 μl PCR空管中,在管盖上标注"样品名+Ind"
    5.3
    分别取1 μl PCR产物,使用1%的琼脂糖凝胶电泳进行检测。
  6. 混样及送测
    6.1
    取1 μl PCR产物稀释10倍,用Nanodrop3300超微量荧光分光光度计进行浓度测定。确保样品稀释后浓度均在0.1-0.9 ng/μl范围之内。
    6.2
    将所有样品等摩尔量混合。
    6.3
    再次用Nanodrop 3300超微量荧光分光光度计对混合后产物进行浓度测定。终产物应有20 μl体积,且浓度应在2-50 nM (0.5-13 ng/μl) 之间。当满足上述条件后,即可送测。以Illumina Hiseq PE150测序平台为例。

数据分析

        利用 (Yuan et al., 2019) 发表的外显子富集数据组装流程进行富集数据的组装(Assexon,https://github.com/yhadevol/Assexon)。
        此富集数据组装流程共分为3步:数据预处理,数据组装,数据后期处理。
一、数据预处理

  1. 批量解压二代测序得到的原始数据
    $ perl gunzip_Files.pl \
    --gzip raw_reads \
    --gunzipped gunzipped_raw_reads
  2. 去除接头及低质量的序列
    $ perl trim_adaptor.pl \
    --raw_reads gunzipped_raw_reads \
    --trimmed trimmed
  3. 矫正编码基因的阅读框,并翻译成氨基酸序列
    $ perl predict_frames.pl \
    --baits reference.fas \
    --cds reference.onehitCDSmarkers.column1.txt \
    --ref_prot reference.pep.fas
    或者手动矫正编码基因阅读框

二、数据组装

  1. 检查软件是否已装齐
    $ perl assemble.pl –check_depends
  2. 序列组装
    $ perl assemble.pl \
    --trimmed trimmed \
    --queryp reference.aa.fas \
    --queryn reference.dna.fas \
    --db reference.genome.fas \
    --dbtype nucleo \
    --ref_name reference_name \
    --outdir assemble_result

三、数据后期处理

  1. 添加已知基因组物种的直系同源序列,并与组装的数据合并
    $ perl get_orthologues.pl \
    --query reference.dna.fas \
    --querydb reference.genome.fas \
    --subdb "species1.genome.fas|species2.genome.fas" \
    --subname "species1 species2" \
    --outdir orthologs
    $ perl merge_loci.pl \
    --indir "assemble_result/nf orthologs/nf" \
    --outdir merged_nf \
    --min_seq 3
  2. 删除不需要的样品序列信息
    $ perl pick_taxa.pl \
    --indir merged_nf \
    --outdir merged_nf_deselected \
    --deselected_taxa "species2"
  3. 序列比对
    $ perl mafft_aln.pl \
    --dna_unaligned merged_nf \
    --dna_aligned merged_nf_aligned
  4. 过滤比对质量差的序列
    $ perl filter.pl \
    --indir merged_nf_aligned \
    --filtered merged_nf_filtered \
    --ref_taxa "reference_name
  5. 统计序列信息
    $ perl statistics.pl \
    --coding_aligned merged_nf_filtered

四、基因串联构建系统树

  1. 串联基因
    $ perl concat_loci.pl \
    --indir merged_nf_filtered \
    --outfile concat
  2. 基于最大似然法构建基因树
    $ raxmlHPC \
    -m GTRGAMMA \
    -p 12345 \
    -q dna12_3.partition.txt \
    -s concat.phy \
    -n genetree

五、基于多物种溯祖模型的物种树构建

  1. 为每个基因构建一个基因树
    $ perl construct_tree.pl \
    --indir merged_nf_filtered
  2. 利用Linux的"cat"命令将步骤1生成的基因树合并到一个文件里
    $ cat ./merged_nf_filtered/* > catree.fas
  3. 利用ASTRAL构建物种树
    $ java -jar astral.jar -I catree.fas -o species.tre

六、寻找SNP位点

  1. 生成一致序列 (若参考序列已有基因组,则可省略此步,直接用基因组数据)
    $ perl consensus.pl \
    --indir merged_nf_filtered \
    --outfile consensus.fas
  2. 利用GATK软件寻找SNP位点
    $ gatk.sh consensus_reference num_of_thread sample1 sample2 sample3 …
  3. 将vcf文件转格式,用于BEAST, STRUCTURE等分析
    $ perl vcftosnps.pl \
    --vcf species.vcf


    图3. 数据分析流程图

溶液配方

一、MagNA磁珠法清洗DNA溶液配方

  1. 100 ml的MagNA beads

    成分体积终浓度
    5% Sera-Mag Magnetic Speed-beads (FisherSci, catalog number: 09-981-123,4 °C储存)2 ml0.1%
    PEG8000 (生工,catalog number: A600433-0500,常温储存)18 g18%
    5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度)50 ml2.5 M
    1 M Tris-Cl, pH 8.0 (生工, catalog number: B548127-0500)1 ml10 mM
    0.5 M EDTA, pH 8.0 (Invitrogen, catalog number: 15575-038)200 μl1 mM
    加超纯水补齐至100 ml


  2. 100 ml的MagNA缓冲液

    成分体积终浓度
    PEG8000 (生工,catalog number: A600433-0500,常温储存)18 g18%
    5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度)50 ml2.5 M
    1 M Tris-Cl, pH 8.0 (生工, catalog number: B548127-0500)1 ml10 mM
    0.5 M EDTA, pH 8.0 (Invitrogen, catalog number: 15575-038)200 μl1 mM
    加超纯水补齐至100 ml


二、文库构建溶液配方

  1. Adapter Mix
    配制下述试剂需在不同PCR管中进行
    1.1
    寡核苷酸杂交缓冲液 (10x):

    成分体积(μl)终浓度(10 ml体系)
    NaCl (5 M)1 ml500 mM
    Tris-Cl, pH 8.0 (1 M)100 μl10 mM
    EDTA, pH 8.0 (0.5 M)20 μl1 mM
    H2O8.88 ml

    1.2
    Adapter mix P5 (100 μM):

    成分体积(μl)终浓度(100 μl体系)
    IS1_adapter_P5.F (500 μM)20100 μM
    IS3_adapter_P5+P7.R (500 μM)20100 μM
    寡核苷酸杂交缓冲液 (10x)101x
    H2O50

    1.3
    Adapter mix P7 (100 μM):

    成分体积(μl)终浓度(100 μl体系)
    IS2_adapter_P7.F (500 μM)20100 μM
    IS3_adapter_P5+P7.R (500 μM)20100 μM
    寡核苷酸杂交缓冲液 (10x)101x
    H2O50

    1.4
    将步骤1.2,1.3的溶液分别振荡混匀,利用下述程序进行退火反应,形成局部互补的双链接头序列

    步骤循环阶段温度时间循环数
    1变性解链95 °C10 s1
    2退火从95 °C梯度降温至12 °C,降温速率为0.1 °C/s1


三、靶基因富集溶液配方

  1. Binding Buffer

    成分体积(总体积200 ml)
    5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度)40 ml
    1 M Tris-HCL (pH = 7.5) (生工, catalog number: B548124-0500)2 ml
    0.5 M EDTA (pH = 8) (Invitrogen, catalog number: 15575-038)0.4 ml
    H2O (TEDIA, catalog number: WS2211-001)157.6 ml

  2. Wash Buffer1

    成分体积(总体积50 ml)
    20x SSC (生工, catalog number: B548109-0200)2.5 ml
    10% SDS (生工, catalog number: B548118-0100)500 μl
    0.5 M EDTA (Invitrogen, catalog number: 15575-038)100 μl
    H2O (TEDIA, catalog number: WS2211-001)46.9 ml

  3. Wash Buffer2

    成分体积(总体积50 ml)
    Wash Buffer 15 ml
    10% SDS (生工, catalog number: B548118-0100)0.5 ml
    H2O (TEDIA, catalog number: WS2211-001)44.5 ml

序列信息

  1. 接头与引物

    NameSequences
    IS1_adapter.P5a*c*a*c*TCTTTCCCTACACGACGCTCTTCCg*a*t*c*t
    IS2_adapter.P7g*t*g*a*CTGGAGTTCAGACGTGTGCTCTTCCg*a*t*c*t
    IS3_adapter.P5+P7a*g*a*t*CGGAa*g*a*g*c
    IS4_indPCR.P5AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTT
    IS7_short_amp.P5ACACTCTTTCCCTACACGAC
    IS8_short_amp.P7GTGACTGGAGTTCAGACGTGT
    Index_primer_8nt_XXXCAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGT
    注:*代表的是PTO键 (硫代修饰键)

  2. BLOCK

    类型序列
    BO1.P5.FAATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-Pho
    BO3.P7.part1.FAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-Pho

  3. P7 Index Primer 8nt信息

    IDP7 Index nameP7 primer seq
    1index_8nt_1CAAGCAGAAGACGGCATACGAGATcgttggttGTGACTGGAGTTCAGACGTGT
    2index_8nt_2CAAGCAGAAGACGGCATACGAGATttctggttGTGACTGGAGTTCAGACGTGT
    3index_8nt_3CAAGCAGAAGACGGCATACGAGATgcatggttGTGACTGGAGTTCAGACGTGT
    4index_8nt_4CAAGCAGAAGACGGCATACGAGATgttcggttGTGACTGGAGTTCAGACGTGT
    5index_8nt_5CAAGCAGAAGACGGCATACGAGATtggcggttGTGACTGGAGTTCAGACGTGT
    6index_8nt_6CAAGCAGAAGACGGCATACGAGATaaccggttGTGACTGGAGTTCAGACGTGT
    7index_8nt_7CAAGCAGAAGACGGCATACGAGATtctaggttGTGACTGGAGTTCAGACGTGT
    8index_8nt_8CAAGCAGAAGACGGCATACGAGATctgaggttGTGACTGGAGTTCAGACGTGT
    9index_8nt_9CAAGCAGAAGACGGCATACGAGATggcaggttGTGACTGGAGTTCAGACGTGT
    10index_8nt_10CAAGCAGAAGACGGCATACGAGATacttcgttGTGACTGGAGTTCAGACGTGT
    11index_8nt_11CAAGCAGAAGACGGCATACGAGATtagtcgttGTGACTGGAGTTCAGACGTGT
    12index_8nt_12CAAGCAGAAGACGGCATACGAGATctatcgttGTGACTGGAGTTCAGACGTGT
    13index_8nt_13CAAGCAGAAGACGGCATACGAGATgatgcgttGTGACTGGAGTTCAGACGTGT
    14index_8nt_16CAAGCAGAAGACGGCATACGAGATgcgccgttGTGACTGGAGTTCAGACGTGT
    15index_8nt_68CAAGCAGAAGACGGCATACGAGATcggttggtGTGACTGGAGTTCAGACGTGT
    16index_8nt_89CAAGCAGAAGACGGCATACGAGATaagttcgtGTGACTGGAGTTCAGACGTGT
    17index_8nt_128CAAGCAGAAGACGGCATACGAGATccggttctGTGACTGGAGTTCAGACGTGT
    18index_8nt_129CAAGCAGAAGACGGCATACGAGATgtcgttctGTGACTGGAGTTCAGACGTGT
    19index_8nt_179CAAGCAGAAGACGGCATACGAGATtcagtactGTGACTGGAGTTCAGACGTGT
    20index_8nt_184CAAGCAGAAGACGGCATACGAGATgttcaactGTGACTGGAGTTCAGACGTGT
    21index_8nt_200CAAGCAGAAGACGGCATACGAGATatacctatGTGACTGGAGTTCAGACGTGT
    22index_8nt_208CAAGCAGAAGACGGCATACGAGATtgcttgatGTGACTGGAGTTCAGACGTGT
    23index_8nt_220CAAGCAGAAGACGGCATACGAGATgcagtcatGTGACTGGAGTTCAGACGTGT
    24index_8nt_229CAAGCAGAAGACGGCATACGAGATtcgataatGTGACTGGAGTTCAGACGTGT
    25index_8nt_233CAAGCAGAAGACGGCATACGAGATtaatcaatGTGACTGGAGTTCAGACGTGT
    26index_8nt_236CAAGCAGAAGACGGCATACGAGATagaggttgGTGACTGGAGTTCAGACGTGT
    27index_8nt_237CAAGCAGAAGACGGCATACGAGATcctcgttgGTGACTGGAGTTCAGACGTGT
    28index_8nt_254CAAGCAGAAGACGGCATACGAGATctcaattgGTGACTGGAGTTCAGACGTGT
    29index_8nt_256CAAGCAGAAGACGGCATACGAGATaaggtctgGTGACTGGAGTTCAGACGTGT
    30index_8nt_288CAAGCAGAAGACGGCATACGAGATctggttggGTGACTGGAGTTCAGACGTGT
    31index_8nt_298CAAGCAGAAGACGGCATACGAGATccagctggGTGACTGGAGTTCAGACGTGT
    32index_8nt_301CAAGCAGAAGACGGCATACGAGATgactatggGTGACTGGAGTTCAGACGTGT
    33index_8nt_302CAAGCAGAAGACGGCATACGAGATctatatggGTGACTGGAGTTCAGACGTGT
    34index_8nt_303CAAGCAGAAGACGGCATACGAGATtaagatggGTGACTGGAGTTCAGACGTGT
    35index_8nt_309CAAGCAGAAGACGGCATACGAGATaggatcggGTGACTGGAGTTCAGACGTGT
    36index_8nt_316CAAGCAGAAGACGGCATACGAGATgtcgccggGTGACTGGAGTTCAGACGTGT
    37index_8nt_327CAAGCAGAAGACGGCATACGAGATcgtcgaggGTGACTGGAGTTCAGACGTGT
    38index_8nt_332CAAGCAGAAGACGGCATACGAGATttggcaggGTGACTGGAGTTCAGACGTGT
    39index_8nt_335CAAGCAGAAGACGGCATACGAGATattcaaggGTGACTGGAGTTCAGACGTGT
    40index_8nt_337CAAGCAGAAGACGGCATACGAGATaatattcgGTGACTGGAGTTCAGACGTGT
    41index_8nt_340CAAGCAGAAGACGGCATACGAGATaggcgtcgGTGACTGGAGTTCAGACGTGT
    42index_8nt_347CAAGCAGAAGACGGCATACGAGATtccgatcgGTGACTGGAGTTCAGACGTGT
    43index_8nt_362CAAGCAGAAGACGGCATACGAGATgagtcgcgGTGACTGGAGTTCAGACGTGT
    44index_8nt_389CAAGCAGAAGACGGCATACGAGATccgcaacgGTGACTGGAGTTCAGACGTGT
    45index_8nt_398CAAGCAGAAGACGGCATACGAGATatgaatagGTGACTGGAGTTCAGACGTGT
    46index_8nt_407CAAGCAGAAGACGGCATACGAGATacctcgagGTGACTGGAGTTCAGACGTGT
    47index_8nt_420CAAGCAGAAGACGGCATACGAGATatgctcagGTGACTGGAGTTCAGACGTGT
    48index_8nt_427CAAGCAGAAGACGGCATACGAGATttatccagGTGACTGGAGTTCAGACGTGT
    49index_8nt_432CAAGCAGAAGACGGCATACGAGATtaacgaagGTGACTGGAGTTCAGACGTGT
    50index_8nt_434CAAGCAGAAGACGGCATACGAGATgactcaagGTGACTGGAGTTCAGACGTGT
    51index_8nt_438CAAGCAGAAGACGGCATACGAGATaacggttcGTGACTGGAGTTCAGACGTGT
    52index_8nt_439CAAGCAGAAGACGGCATACGAGATcagcgttcGTGACTGGAGTTCAGACGTGT
    53index_8nt_440CAAGCAGAAGACGGCATACGAGATatacgttcGTGACTGGAGTTCAGACGTGT
    54index_8nt_455CAAGCAGAAGACGGCATACGAGATcgtacgtcGTGACTGGAGTTCAGACGTGT
    55index_8nt_475CAAGCAGAAGACGGCATACGAGATttatcatcGTGACTGGAGTTCAGACGTGT
    56index_8nt_476CAAGCAGAAGACGGCATACGAGATgaggcatcGTGACTGGAGTTCAGACGTGT
    57index_8nt_497CAAGCAGAAGACGGCATACGAGATaacctggcGTGACTGGAGTTCAGACGTGT
    58index_8nt_502CAAGCAGAAGACGGCATACGAGATagttaggcGTGACTGGAGTTCAGACGTGT
    59index_8nt_509CAAGCAGAAGACGGCATACGAGATcgtatcgcGTGACTGGAGTTCAGACGTGT
    60index_8nt_517CAAGCAGAAGACGGCATACGAGATgctaacgcGTGACTGGAGTTCAGACGTGT
    61index_8nt_522CAAGCAGAAGACGGCATACGAGATagcagagcGTGACTGGAGTTCAGACGTGT
    62index_8nt_524CAAGCAGAAGACGGCATACGAGATtgaccagcGTGACTGGAGTTCAGACGTGT
    63index_8nt_526CAAGCAGAAGACGGCATACGAGATggagaagcGTGACTGGAGTTCAGACGTGT
    64index_8nt_530CAAGCAGAAGACGGCATACGAGATccaattccGTGACTGGAGTTCAGACGTGT
    65index_8nt_549CAAGCAGAAGACGGCATACGAGATttcaagccGTGACTGGAGTTCAGACGTGT
    66index_8nt_551CAAGCAGAAGACGGCATACGAGATttggtaccGTGACTGGAGTTCAGACGTGT
    67index_8nt_553CAAGCAGAAGACGGCATACGAGATattctaccGTGACTGGAGTTCAGACGTGT
    68index_8nt_554CAAGCAGAAGACGGCATACGAGATcaactaccGTGACTGGAGTTCAGACGTGT
    69index_8nt_559CAAGCAGAAGACGGCATACGAGATcgccgaccGTGACTGGAGTTCAGACGTGT
    70index_8nt_560CAAGCAGAAGACGGCATACGAGATgactaaccGTGACTGGAGTTCAGACGTGT
    71index_8nt_561CAAGCAGAAGACGGCATACGAGATgctgaaccGTGACTGGAGTTCAGACGTGT
    72index_8nt_582CAAGCAGAAGACGGCATACGAGATgccaagacGTGACTGGAGTTCAGACGTGT
    73index_8nt_583CAAGCAGAAGACGGCATACGAGATaacttaacGTGACTGGAGTTCAGACGTGT
    74index_8nt_585CAAGCAGAAGACGGCATACGAGATtattgaacGTGACTGGAGTTCAGACGTGT
    75index_8nt_589CAAGCAGAAGACGGCATACGAGATgttgcaacGTGACTGGAGTTCAGACGTGT
    76index_8nt_604CAAGCAGAAGACGGCATACGAGATggctgctaGTGACTGGAGTTCAGACGTGT
    77index_8nt_610CAAGCAGAAGACGGCATACGAGATcctaactaGTGACTGGAGTTCAGACGTGT
    78index_8nt_620CAAGCAGAAGACGGCATACGAGATagcattgaGTGACTGGAGTTCAGACGTGT
    79index_8nt_625CAAGCAGAAGACGGCATACGAGATactactgaGTGACTGGAGTTCAGACGTGT
    80index_8nt_627CAAGCAGAAGACGGCATACGAGATcttcatgaGTGACTGGAGTTCAGACGTGT
    81index_8nt_647CAAGCAGAAGACGGCATACGAGATtcgaacgaGTGACTGGAGTTCAGACGTGT
    82index_8nt_650CAAGCAGAAGACGGCATACGAGATcgaatagaGTGACTGGAGTTCAGACGTGT
    83index_8nt_678CAAGCAGAAGACGGCATACGAGATtgcgtccaGTGACTGGAGTTCAGACGTGT
    84index_8nt_679CAAGCAGAAGACGGCATACGAGATgtactccaGTGACTGGAGTTCAGACGTGT
    85index_8nt_682CAAGCAGAAGACGGCATACGAGATcgtcgccaGTGACTGGAGTTCAGACGTGT
    86index_8nt_683CAAGCAGAAGACGGCATACGAGATtaacgccaGTGACTGGAGTTCAGACGTGT
    87index_8nt_684CAAGCAGAAGACGGCATACGAGATaattaccaGTGACTGGAGTTCAGACGTGT
    88index_8nt_685CAAGCAGAAGACGGCATACGAGATtcataccaGTGACTGGAGTTCAGACGTGT
    89index_8nt_686CAAGCAGAAGACGGCATACGAGATcaggaccaGTGACTGGAGTTCAGACGTGT
    90index_8nt_687CAAGCAGAAGACGGCATACGAGATgtcaaccaGTGACTGGAGTTCAGACGTGT
    91index_8nt_691CAAGCAGAAGACGGCATACGAGATagaagtaaGTGACTGGAGTTCAGACGTGT
    92index_8nt_693CAAGCAGAAGACGGCATACGAGATcatcctaaGTGACTGGAGTTCAGACGTGT
    93index_8nt_695CAAGCAGAAGACGGCATACGAGATgacgataaGTGACTGGAGTTCAGACGTGT
    94index_8nt_700CAAGCAGAAGACGGCATACGAGATtcatcgaaGTGACTGGAGTTCAGACGTGT
    95index_8nt_702CAAGCAGAAGACGGCATACGAGATccgacgaaGTGACTGGAGTTCAGACGTGT
    96index_8nt_706CAAGCAGAAGACGGCATACGAGATtggatcaaGTGACTGGAGTTCAGACGTGT
    97index_8nt_708CAAGCAGAAGACGGCATACGAGATgcgcgcaaGTGACTGGAGTTCAGACGTGT
    98index_8nt_709CAAGCAGAAGACGGCATACGAGATagctccaaGTGACTGGAGTTCAGACGTGT
    99index_8nt_710CAAGCAGAAGACGGCATACGAGATtctgccaaGTGACTGGAGTTCAGACGTGT
    100index_8nt_711CAAGCAGAAGACGGCATACGAGATggagccaaGTGACTGGAGTTCAGACGTGT
    注:为了确保测序样品的Index碱基组成平衡,减少因index碱基不平衡而造成的测序错误。当样品数量小于30 h,推荐使用下列任一index编号组合:

    3.1
    10个样品
    Set I: 27, 100, 208, 236, 336, 526, 527, 533, 685, 702
    Set II: 1, 2, 68, 432, 436, 442, 554, 647, 687, 693
    Set III: 10, 138, 254, 423, 435, 440, 527, 551, 639, 679
    3.2
    15个样品
    Set I: 1, 10, 89, 138, 254, 423, 435, 440, 527, 549, 551, 625, 639, 679, 711
    Set II: 1, 10, 93, 233, 236, 285, 325, 517, 530, 533, 571, 654, 679, 687, 696
    Set III: 2, 7, 9, 11, 288, 420, 435, 524, 526, 530, 559, 676, 684, 693, 695
    3.3
    20个样品
    Set I: 1, 2, 4, 124, 130, 255, 347, 420, 434, 435, 441, 522, 526, 527, 547, 647, 668, 686, 691, 693
    Set II: 2, 3, 12, 93, 138, 237, 255, 309, 388, 419, 527, 533, 549, 558, 589, 625, 639, 695, 706, 711
    Set III: 1, 2, 7, 9, 11, 288, 335, 420, 431, 435, 524, 526, 530, 547, 559, 647, 676, 684, 693, 695
    3.4
    25个样品
    Set I: 3, 7, 10, 13, 26, 200, 229, 235, 288, 325, 339, 381, 432, 487, 517, 522, 527, 530, 546, 609, 686,687, 688, 703, 709
    Set II: 1, 9, 20, 100, 129, 229, 332, 336, 383, 407, 421, 435, 440, 443, 513, 526, 527, 533, 546, 603,628, 676, 684, 700, 706
    Set III: 1, 8, 10, 11, 16, 129, 219, 254, 332, 334, 337, 362, 400, 517, 522, 526, 527, 565, 567, 654, 679,683, 685, 691, 710
    3.5
    30个样品
    Set I: 1, 7, 10, 16, 50, 100, 129, 130, 255, 336, 339, 383, 388, 419, 431, 513, 517, 526, 527, 533, 547,588, 617, 633, 639, 650, 688, 693, 695, 707
    Set II: 2, 3, 4, 7, 27, 89, 134, 229, 255, 303, 313, 332, 388, 435, 436, 527, 530, 533, 546, 571, 582,587, 604, 609, 620, 638, 672, 686, 693, 707
    Set III: 1, 2, 4, 13, 27, 208, 219, 229, 237, 332, 340, 389, 407, 431, 435, 438, 482, 515, 526, 527, 530,554, 567, 603, 633, 647, 678, 686, 687, 693
    注:当样品数量超过30 h,可选取任一Index。

致谢

实验方案中文库构建和跨物种靶基因富集步骤根据作者2013年发表的方法修改 (Li et al., 2013),数据分析参考作者2019年发表的方法 (Yuan et al., 2019)。

竞争性利益声明

作者声明没有利益冲突

参考文献

  1. Meyer, M. and Kircher, M. (2010). Illumina sequencing library preparation for highly multiplexed target capture and sequencing. Cold Spring Harb Protoc prot5448.
  2. Li, C., Riethoven, J. J. M. and Naylor G. J. P. (2012). EvolMarkers: a database for mining exon and intron markers for evolution, ecology and conservation studies. Mol Ecol Resour 12(5): 967-971.
  3. Li, C., Hofreiter, M., Straube, N., Corrigan, S. and Naylor, G. J. P. (2013). Capturing protein-coding genes across highly divergent species. BioTechniques 54: 321-326.
  4. Yao, X., Li, C. and Dick, C. W. (2013). Exon-primed intron-crossing (EPIC) markers for evolutionary studies of Ficus and other taxa in the fig family (Moraceae). Appl Plant Sci 1(10): 1-4.
  5. Stroeher, P. R., Li, C. and Pie, M. R. (2013). Exon-primed intron-crossing (EPIC) markers as a tool for ant phylogeography. Rev Bras Entomol 57(4): 427-430.
  6. Yuan, H., Jiang, J., Jimenez, F. A., Hoberg, E. P., Cook, J. A., Galbreath , K. E. and Li, C. H. (2016). Target gene enrichment in the cyclophyllidean cestodes, the most diverse group of tapeworms. Mol Ecol Resour 16(5): 1095-1106.
  7. Song, S., Zhao, J. and Li, C. (2017). Species delimitation and phylogenetic reconstruction of the sinipercids (Perciformes: Sinipercidae) based on target enrichment of thousands of nuclear coding sequences. Mol Phylogenet Evol 111: 44-55.
  8. Yin, G., Pan, Y., Sarker, A., Baki, M. A., Kim, J. K., Wu, H. and Li, C. (2019). Molecular systematics of Pampus (Perciformes: Stromateidae) based on thousands of nuclear loci using target-gene enrichment. Mol Phylogenet Evol 140: 106595.
  9. Yuan, H., Atta, C., Tornabene, L. and Li, C. (2019). Assexon: assembling exon using gene capture data. Evol Bioinform 15: 1-13.
Please login or register for free to view full text
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:黄俊满, 袁昊, 李晨虹. (2021). 跨物种靶基因富集技术实验方案. Bio-101: e1010606. DOI: 10.21769/BioProtoc.1010606.
How to cite: Huang, J. M., Yuan, H. and Li, C. H. (2021). Protocol for Cross-species Target-gene Enrichment. Bio-101: e1010606. DOI: 10.21769/BioProtoc.1010606.
Q&A

If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.

If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.

We use cookies on this site to enhance your user experience. By using our website, you are agreeing to allow the storage of cookies on your computer.