關(guān)于目標(biāo)區(qū)域測(cè)序 目標(biāo)區(qū)域測(cè)序(Targeted Sequencing):是目標(biāo)區(qū)域測(cè)序是指針對(duì)感興趣的目標(biāo)區(qū)域富集后進(jìn)行大規(guī)模測(cè)序。研究者可以針對(duì)自己感興趣的染色體區(qū)域或者大量的候選基因區(qū)域進(jìn)行數(shù)百個(gè)甚至上千個(gè)樣品的序列測(cè)定。 目標(biāo)區(qū)域測(cè)序優(yōu)勢(shì) 針對(duì)性強(qiáng):比起全基因組水平的研究,目標(biāo)區(qū)域測(cè)序更具有針對(duì)性,可以依賴大量的前期研究成果,獲得候選染色體區(qū)域或者基于生物通路的大量候選基因。 費(fèi)用低:目標(biāo)區(qū)域測(cè)序區(qū)域較小,可對(duì)數(shù)百個(gè)樣品進(jìn)行快速測(cè)序,大大降低了研究成本。 信息量大:比起目標(biāo)區(qū)域或者候選基因單倍型標(biāo)簽SNP分型的研究策略,目標(biāo)區(qū)域測(cè)序可以完整覆蓋整個(gè)基因區(qū)域,不僅可以獲得高頻SNP的分型數(shù)據(jù),而且還可以發(fā)現(xiàn)低頻的和個(gè)體特有的變異。 效率高:比起使用Sanger法的候選基因測(cè)序方法,基于二代測(cè)序技術(shù)的目標(biāo)區(qū)域測(cè)序更加快速、高效! 高精度:目標(biāo)區(qū)域的高測(cè)序深度保證了更準(zhǔn)確的測(cè)序結(jié)果,例如目標(biāo)區(qū)域測(cè)序的測(cè)序深度可以達(dá)到200×。 目標(biāo)區(qū)域測(cè)序在動(dòng)植物研究中的應(yīng)用 1.有些物種是異源四倍體物種 ,對(duì)于這種異源四倍體物種其一個(gè)基因特定位點(diǎn)最多有四種不同的等位基因,因此要準(zhǔn)確區(qū)別不同的等位基因和準(zhǔn)確確定等位基因的拷貝數(shù)在測(cè)序時(shí)相對(duì)于二倍體就需要更高的測(cè)序深度,其測(cè)序深度至少要達(dá)到48×,此時(shí)目的目的區(qū)域測(cè)序就顯示出其無(wú)可比擬的優(yōu)勢(shì)。通過(guò)對(duì)這些異源多倍體物種的目標(biāo)區(qū)域進(jìn)行富集捕獲測(cè)序,數(shù)據(jù)可用于群體結(jié)構(gòu)以及GWAS-QTL分析。 相應(yīng)研究案例: 對(duì)83株四倍體栽培土豆和1株參照二倍體土豆,平均分布在基因組上807個(gè)基因,共2.1M的區(qū)間進(jìn)行富集,測(cè)序后獲得平均覆蓋深度為63×,共12.4G的高質(zhì)量數(shù)據(jù),發(fā)現(xiàn)129,156個(gè)可靠的序列變異(在外顯子1 SNP/24 bp ,在內(nèi)含子1 SNP/15 bp),這些變異含有大量罕見(jiàn)變異(61%的變異MAF小于 0.05),經(jīng)KASP技術(shù)驗(yàn)證有99%的一致性。利用發(fā)現(xiàn)的變異對(duì)土豆植株成熟期和塊莖肉色相關(guān)的QTL進(jìn)行GWAS分析,定位到了之前的已知QTL位點(diǎn)。主成分分析發(fā)現(xiàn)栽培土豆可以明顯聚類為五組。
圖1. DNA序列變異與土豆的兩種性狀:(A)植株成熟期和(B)塊莖顏色相關(guān)性p值的Manhattan圖
參考文獻(xiàn):A Next-Generation Sequencing Method for Genotyping-by-Sequencing of Highly Heterozygous Autotetraploid Potato. Jan G. A. M. L. Uitdewilligen et al. 2013, PloS ONE.2.針對(duì)某些物種間的保守區(qū)域進(jìn)行目標(biāo)區(qū)域測(cè)序,利用測(cè)序數(shù)據(jù)進(jìn)行物種分類和系統(tǒng)進(jìn)化分析,這種策略類似于利用16S rDNA/18S rDNA/ITS擴(kuò)增子測(cè)序進(jìn)行微生物群落多樣性分析或利用DNA條形碼技術(shù)進(jìn)行品種資源鑒定和系統(tǒng)進(jìn)化分析。 相應(yīng)研究案例: 不同鳥類的演化仍然有爭(zhēng)議,利用雜交富集的定向測(cè)序技術(shù),對(duì)198種現(xiàn)存鳥類(代表所有鳥類譜系和兩個(gè)鱷魚外群)的394個(gè)有足夠變異度的保守位點(diǎn)進(jìn)行目標(biāo)區(qū)域測(cè)序(Agilent定制液相芯片富集),然后基于測(cè)序數(shù)據(jù)使用貝葉斯法和最大似然分析法建立所有鳥類譜系的系統(tǒng)進(jìn)化樹。產(chǎn)生259個(gè)高質(zhì)量測(cè)序核位點(diǎn)(平均組裝長(zhǎng)度為1523bp)共7.8 × 107 個(gè)堿基的數(shù)據(jù)量,基于這些數(shù)據(jù)使用貝葉斯法和最大似然分析法建立所有鳥類譜系的進(jìn)化樹,5個(gè)主要分支形成新鳥綱的連續(xù)姐妹類群:(1)包括夜鷹,雨燕和蜂鳥;(2)包括杜鵑,大鴇,鴿子,蕉鵑和沙雞;(3) 鶴及其親屬;(4)水鳥類群,包括潛水類、涉水類、岸灘類;(5)麝雉類(圖1)。
圖1. 鳥類的系統(tǒng)發(fā)育樹
參考文獻(xiàn):A comprehensive phylogeny of birds (Aves) using targeted next-generation DNA sequencing. Richard O. Prum et al. 2015, Nature.3.為了保護(hù)種質(zhì)資源,開發(fā)可靠的并且高度可變的遺傳標(biāo)記是必不可少的,對(duì)于一些基因組復(fù)雜但是遺傳標(biāo)記比較缺少的物種,過(guò)去常使用細(xì)胞器基因組進(jìn)行相關(guān)系統(tǒng)進(jìn)化研究,但是這種方法具有效率低和單親遺傳等缺點(diǎn),因此目前高通量測(cè)序非常適合這種非模式物種的遺傳標(biāo)記開發(fā)研究,但是使用全基因組重測(cè)序?qū)@類基因組復(fù)雜物種進(jìn)行群體進(jìn)化研究實(shí)際上是代價(jià)高昂的,而目標(biāo)區(qū)域測(cè)序這種只針對(duì)某些可靠位點(diǎn)進(jìn)行深度測(cè)序的技術(shù)實(shí)際上更符合成本效益。 相應(yīng)研究案例: 根據(jù)白皮松轉(zhuǎn)錄組序列設(shè)計(jì)捕獲探針,從而對(duì)48棵白皮松(每棵白皮松代表不同地理位置)上的7,849個(gè)不同基因進(jìn)行目標(biāo)區(qū)域捕獲測(cè)序,從這48棵白皮松樣本中共得到 390,910,265條 reads,所得到的數(shù)據(jù)提供了4452個(gè)基因的基因信息,共鑒定到12390個(gè)多態(tài)性位點(diǎn)(其中2163個(gè)變異位點(diǎn)的MAF > 0.1),然后通過(guò)這些位點(diǎn)揭示了雜合度和等位基因豐度的地理分布趨勢(shì), PCA分析結(jié)果與這48棵白皮松的實(shí)際地理分布是一致的,并且指出南部樹木相對(duì)于其它區(qū)域的樹木顯示出最大的差異分化。
圖1. 與雜合性,緯度和經(jīng)度相關(guān)的主成分(PC)。樣品的顏色按地理分布,(a)PC1與雜合度。(b)PC2與緯度。(C)PC3與緯度。(d)PC4與經(jīng)度
參考文獻(xiàn):Targeted Capture Sequencing in Whitebark Pine Reveals Range-Wide Demographic and Adaptive Patterns Despite Challenges of a Large, Repetitive Genome.Syring JV et al. 2016,Front Plant Sci. 其它應(yīng)用展望 4. 傳統(tǒng)方法QTL性狀粗定位鎖定大致區(qū)域后,如果區(qū)域內(nèi)沒(méi)有足夠多的分子標(biāo)記或者沒(méi)有合適的分子標(biāo)記,可使用目標(biāo)區(qū)域測(cè)序來(lái)開發(fā)分子標(biāo)記從而進(jìn)行下一步的精細(xì)定位,如果精細(xì)定位鎖定區(qū)域大小在目標(biāo)區(qū)域測(cè)序大小范圍內(nèi)可以使用目標(biāo)區(qū)域測(cè)序直接鎖定QTL關(guān)聯(lián)位點(diǎn)或基因。 5. 混池分組分析法(BSA)已經(jīng)廣泛應(yīng)用于動(dòng)植物QTL定位的研究中,并且發(fā)現(xiàn)了QTL候選區(qū)域,因此后續(xù)可以對(duì)候選區(qū)間進(jìn)行目標(biāo)區(qū)域測(cè)序,獲得區(qū)域內(nèi)SNP/InDel的多態(tài)信息,聯(lián)合性狀進(jìn)行關(guān)聯(lián)或者連鎖分析,從而鎖定QTL關(guān)聯(lián)位點(diǎn)/基因。 6. 全基因組關(guān)聯(lián)分析(GWAS)己經(jīng)廣泛地應(yīng)用于QTL性狀的研究當(dāng)中,并且定位出了大量顯著的SNP位點(diǎn),然而這些標(biāo)記位點(diǎn)大部分為常見(jiàn)變異位點(diǎn),因此可以通過(guò)對(duì) GWAS 鑒定的區(qū)域進(jìn)行目標(biāo)區(qū)域測(cè)序,從而找到與QTL性狀緊密相關(guān)的其它新的、稀有的和可能的功能變異。 目標(biāo)區(qū)域測(cè)序在動(dòng)植物研究中的應(yīng)用總結(jié) 天昊生物目標(biāo)區(qū)域測(cè)序整體解決方案 天昊生物目標(biāo)區(qū)域測(cè)序特色
天昊目標(biāo)區(qū)域測(cè)序技術(shù)發(fā)表高分文章
FastTargetTM項(xiàng)目實(shí)例: 項(xiàng)目簡(jiǎn)介:利用FastTargetTM富集技術(shù)對(duì)32個(gè)基因(約140K區(qū)域)350個(gè)樣本進(jìn)行測(cè)序。 數(shù)據(jù)量統(tǒng)計(jì):共測(cè)序得到37M的reads,有效34M的reads,富集效率92%,平均每個(gè)片段覆蓋173X。 數(shù)據(jù)結(jié)果驗(yàn)證:采用SNaPshot對(duì)目標(biāo)區(qū)域內(nèi)12個(gè)高頻SNP位點(diǎn)對(duì)所有樣本進(jìn)行了分析,觀察基因型的一致性,除了少部分樣本因?yàn)闇y(cè)序深度不夠,其它基本上達(dá)到了100%的一致性。 EasyTarget®項(xiàng)目實(shí)例 項(xiàng)目簡(jiǎn)介:采用EasyTarget®富集方法對(duì) 9個(gè)基因(約37K區(qū)域)133個(gè)樣本進(jìn)行測(cè)序。 數(shù)據(jù)量統(tǒng)計(jì):總數(shù)據(jù)量為11M reads,有效reads為9.6M,富集效率87%,平均每個(gè)樣本72K reads,平均每個(gè)片段覆蓋486X,樣本測(cè)序深度分布如下。 數(shù)據(jù)結(jié)果驗(yàn)證:全部通過(guò)一代Sanger測(cè)序驗(yàn)證,100%的準(zhǔn)確性。 |