2018年3月27日

臺灣人體生物資料庫—基因定序對臺灣精準醫療進展的重要性

沈志陽/中央研究院臺灣人體生物資料庫執行長、中央研究院生物醫學研究所研究員。

到底什麼是基因定序?
一般而言,人體內每個細胞都含有 23 對染色體,每條染色體均由無數個稱為鹼基的化學分子依序串連而成,鹼基對則形成核酸DNA、RNA單體以及編碼遺傳信息的化學結構,它們雖然數以億計(3×109),但單位結構上卻只有4種:腺嘌呤(adenine, A)、胸腺嘧啶(thymine, T)、胞嘧啶(cytosine, C)以及鳥嘌呤(guanine, G)。鹼基之間藉由氫鍵的鍵結形成特殊鹼基配對關係(如:A-T,C-G),透過與五碳醣和磷酸的連結組成核酸(nucleotide),兩條反向平行的長鏈互相纏繞進而組成DNA分子,而長鏈的DNA中帶有遺傳效應,可決定表現型的片段,即「基因」,換句話說就是可以轉錄成RNA,再轉譯成蛋白質的DNA片段(圖一)。

圖一:DNA與基因的關係。
所謂的「基因定序」,則是將DNA長鏈上所有ATCG的組成順序解構出來。人類所有的DNA共有30億個鹼基對,會轉譯表達蛋白質的區域大約只佔全基因體長度的1.5%左右,內含約2~3萬個基因,可以想見DNA序列中絕大部分的資訊都不一定是過去我們認為重要的基因片段,但是近年來科學家也發現這些不屬基因的片段也可能具有調節基因片段表現的功能,所以可以說DNA的每個部分都很重要。由於人類基因體過於龐大複雜,因此過去當科學家們想研究某個遺傳相關的特定疾病時,可以針對目標區域進行定序,或是針對會產生某個疾病相關的蛋白質之DNA區域進行解構,甚至是進行單一位點的分析。

當代基因定序的基礎:人類基因組計劃
隨著研究的進展,科學家們逐漸發現,人體內這23對染色體當中所蘊含的奧秘,必須透過對基因體完全解碼才得以窺視,且由於人類欲探索全基因體序列、因而有了人類基因組計劃(Human Genome Project, HGP)的工程。人類基因組計劃這個龐大的跨國計劃,目的為完整解構人類23對染色體中DNA所有密碼的序列、以及在這序列中的基因與類別,可說是為人類基因體學研究提供了一個初始的基礎,自此開啟了基因體研究一個嶄新的頁面。人類基因組計劃中所利用的定序方法,主要依據1970年代英國科學家桑傑(Frederick Sanger)所發展的定序方法,這也是21世紀初大部份定序方法的基礎。

採用這項技術的過程中,DNA需要經過聚合酶連鎖反應(polymerase chain reaction, PCR)多次複製、製造出足量的DNA片段,並在最後一次的複製過程中,於DNA片段的尾端加上帶有螢光標記的終止核酸,以產生長度不一的片段,利用這些片段在電泳過程中因長度不同而分離開來,片段尾端的標記顯現4種鹼基各自特有的螢光信號,從而讀取出DNA的鹼基序列,雖然這種定序方法準確度高、不易出錯,然缺點是定序速度緩慢且耗時。人類基因組計劃完成之後,許多次世代(next-generation sequencing)的基因定序方法逐漸被發展出來,藉由大量而快速的特性來進行短序列片段(short reads)的定序,並經過大規模的重組過程來獲取序列資訊,也成了現今定序的主流技術;除了定序速度大幅提高之外,隨著定序費用愈來愈低廉,也讓大規模的基因定序族群分析研究成為可能。

實踐個人化醫療:從單一核苷酸多型性說起
我們知道,每一個人都有獨特的基因序列,人類基因組計劃發布的數據無法精確反映單獨個體的基因資訊,尚須考慮不同個體間包含的單一核苷酸多型性(single nucleotide polymorphism, SNP)。單一核苷酸多型性指的是DNA序列上發生的單個核苷酸鹼基之間的變異,即在基因體中一特定位點出現不同鹼基配對的可能性,是一種普遍發生的遺傳變異,這也是造成群體中基因序列的細微不同、產生個體差異的主因。在人類的DNA中,平均約300個核苷酸就會出現1個單一核苷酸多型性的位點。在絕大多數的情況下,這些變異點出現在基因與基因之間的DNA序列之中,在不造成蛋白質變異的情況下、形成所謂的生物標誌物(biological markers),若這個單一核苷酸多型性的位置出現於基因之上,或是基因的調控區域,則會較直接的影響基因的功能,或者會導致疾病發生。......【更多內容請閱讀科學月刊第580期】

沒有留言: