當(dāng)年,Solexa品牌還在的時(shí)候,MassGenomics的Dan Koboldt就提出了新一代測序(NGS)面臨的一些挑戰(zhàn),包括生物信息學(xué)算法的問題,以及讀長太短,工具太貴,經(jīng)驗(yàn)太少。如今,這些問題中的大部分都已解決。不過,別高興得太早。Koboldt認(rèn)為,我們面臨更新、更難的挑戰(zhàn)。
首先,隨著測序成本打破了摩爾定律的曲線,更多的機(jī)器、更快的機(jī)器,意味著更多的數(shù)據(jù)。Illumina的HiSeq 2000上的一次運(yùn)行能夠產(chǎn)生48個(gè)人類外顯子組。即使不保存圖像,每個(gè)外顯子組也需要大約10 GB的磁盤空間。測序數(shù)據(jù)的分析也需要空間。因此,大多數(shù)研究人員必須選擇刪除數(shù)據(jù),或花錢存儲,或暫停數(shù)據(jù)生產(chǎn)和分析。
第二個(gè)問題是擴(kuò)展NGS研究,以達(dá)到統(tǒng)計(jì)學(xué)意義。如果一個(gè)常見病研究需要10000個(gè)樣本,那么即使每個(gè)基因組的費(fèi)用低至1000美元,這也是大部分研究小組無力實(shí)現(xiàn)的。研究人員被迫使用較少的樣本,將測序與后續(xù)的基因分型相結(jié)合,或者與其他的實(shí)驗(yàn)室和機(jī)構(gòu)合作。
找到樣本也是個(gè)問題。據(jù)Koboldt介紹,外顯子組和基因組測序的普及讓樣本也稱為一種新商品。如果你使用NIH或其他公共資助,還有另一層的困難,因?yàn)樗袛?shù)據(jù)都必須存放在公共資源庫中。這需要志愿者簽署數(shù)據(jù)共享的知情同意書。
隱私也是另一個(gè)問題。即使你有了知情同意書,也很難讓志愿者在上面簽名。關(guān)于遺傳信息的隱私,目前正受到越來越多的關(guān)注。通過SNP芯片、外顯子組或基因組測序所獲得的遺傳圖譜可能會被利用,以鑒定個(gè)別人。此外,它們還包含一些很私密的細(xì)節(jié),如血統(tǒng)和疾病風(fēng)險(xiǎn)基因,這些可能會被公開,或成為歧視的理由。
第五個(gè)問題是關(guān)于基因組發(fā)現(xiàn)的功能驗(yàn)證。許多研究小組已經(jīng)證明了NGS的發(fā)現(xiàn)能力非常強(qiáng)大,而NCBI的dbSNP已經(jīng)收錄了5000萬個(gè)不同變異。然而,Koboldt認(rèn)為,在功能上驗(yàn)證它們卻并非易事。許多功能驗(yàn)證實(shí)驗(yàn)進(jìn)展緩慢,費(fèi)時(shí)費(fèi)力。
最后的挑戰(zhàn)是NGS向臨床轉(zhuǎn)化。在許多癌癥中心,靶向測序panel已被常規(guī)使用,未來有可能轉(zhuǎn)化到外顯子組或基因組測序。不過,一項(xiàng)新技術(shù)要應(yīng)用于患者還需要跨過許多障礙。CLIA/CAP認(rèn)證是個(gè)復(fù)雜、昂貴且耗時(shí)的過程。報(bào)告也更加困難。“與科研背景不同,臨床背景需要非常高的信心,才能將結(jié)果反饋給患者或主治醫(yī)生,”Koboldt談道!斑@意味著我們還有很多工作要做!