關於「編碼計畫」的爭議,以及大型科學研究計畫和小型科學研究計畫為何不同 關於「編碼計畫」的爭議,以及大型科學研究計畫和小型科學研究計畫為何不同

關於「編碼計畫」的爭議,以及大型科學研究計畫和小型科學研究計畫為何不同

關於「編碼計畫」的爭議,以及大型科學研究計畫和小型科學研究計畫為何不同

如果每篇新論文摘要都像丹·格勞爾的最新文章那樣精彩,人們就不需要看真人秀了——他們完全可以從研究論文中獲得他們想要的所有戲劇性內容。格勞爾的新論文對一項備受矚目的基因組學計畫進行了猛烈抨擊,其中包含了一些在通常嚴肅而莊重的科學文獻領域中極為罕見的激烈言辭。

格勞爾在電話裡也同樣直言不諱:「他們的數據分析簡直荒謬至極,」他說。 “太可怕了。這根本不是科學。”

事情是這樣的:DNA元件百科全書(ENCODE)計畫歷時五年,數百人參與其中,旨在揭示人類基因組中所謂非編碼或「垃圾」區域的功能。去年九月,該計畫成果發表時,領導該計畫的科學家聲稱,它將顛覆數十年來人們對基因組運作方式的認知,並導致教科書需要重寫。他們表示,基因組的大部分都具有生物活性——即具有功能。但許多演化生物學家對這種描述以及「功能」一詞的廣泛定義感到不滿。

「我們同意,許多有關行銷、大眾媒體炒作和公共關係的教科書可能都需要重寫,」格勞爾和他的同事在《基因組生物學與演化》雜誌上寫道。

格勞爾是休士頓大學分子演化生物資訊學教授,他作為主要作者,對一個全球遺傳學和生物資訊學研究人員聯盟發表了一篇措辭激烈的回應文章,引起了演化生物學家的極大不滿。

「大型科學研究項目,例如人類基因組計劃,應該發表數據。小型科學研究計畫應該負責分析。」其中一個主要抱怨是:Encode 的作者是計算科學家,而不是生物科學家。 「他們是電腦專家,」格勞爾說。 “大型科研項目,例如人類基因組計劃,應該發表數據。小型科研項目應該負責分析。”

在演化生物學中,「功能」一詞意義豐富──一個器官、一段DNA或一個細胞可以執行一種被自然選擇的功能,也可以執行一種因果功能。簡單來說,被選擇的功能賦予了演化優勢,而因果功能則沒有。在論文中,格勞爾以人類心臟為例:心臟的演化功能是將血液泵送到全身。而它的因果功能是發出聲音。順便一提,這對你的醫生或私人教練很有用,但這並非心臟的主要功能

如果把人類基因組比喻為教科書,那麼Encode計畫就像是它的腳註,旨在闡明所有核苷酸的功能。它註釋了構成基因及其調控區域的32億個A、C、G和T核苷酸。 Encode論文對「功能」的定義較為廣泛,涵蓋了DNA的所有活動。研究表明,我們絕大多數的DNA至少參與一種細胞類型中的一種“生化事件”,並將其視為一種功能。但這種定義充其量只是較為寬泛,而且這甚至並非該專案的目標。聖路易斯華盛頓大學的系統生物學家邁克懷特(Mike White)指出,他曾批評Encode計畫的過度宣傳,但(與格勞爾不同)讚揚了其對科學的價值。該計畫的真正目的是全面測量基因組的生化特徵,並讓科學家嘗試利用這些測量結果進行研究。

他說:“這些特徵將有助於其他科學家真正發現功能區域。”

維基共享資源

生物化學功能涵蓋範圍廣泛,例如DNA序列轉錄成RNA;與調控蛋白結合的區域,這些蛋白可以開啟或關閉基因;未緊​​密包裹在染色質中的區域,染色質負責在細胞內包裝DNA;等等。 (有關這些生物學功能的詳細描述,請參閱相關文獻。)函數(關於這些活動,請閱讀化學家兼部落客 Ashutosh Jogalekar 在《科學美國人》上發表的這篇詳盡分析。)關鍵在於,雖然這些確實是“功能”,因為它們在做一些事情,但它們所做的事情不一定有意義。

格勞爾在電話裡是這樣解釋的:“你踩過口香糖嗎?它會粘在你的鞋底。但這並不是口香糖的作用,它的作用不是在炎熱的天氣裡粘在鞋子上。”

懷特表示,這些活動之所以值得衡量,是因為它們可以與某些功能相關聯——但不一定與這些功能直接相關。他說,確定功能很困難,需要更多的工作。

在懷特自己的實驗室裡,他正在研究一種特定的調控蛋白,這種蛋白能與基因組上大約1萬個DNA位點結合,有助於基因開啟或關閉。他試圖確定這種結合事件是否與基因活化有關,以及這些蛋白在細胞內遊走時是如何沿著基因組定位的。這1萬個結合位點中的每一個都可能具有功能性,也可能存在非特異性的「噪音」DNA結合,因為這種蛋白採取的是「廣撒網」式的結合方式,或者可能還有其他因素在起作用。

「對於這個問題,Encode數據很有用。我掌握著一份基因組區域列表,這些區域與調控蛋白結合,我可以對它們進行測試,從而深入了解某些DNA特徵為何能夠激活基因,而其他特徵卻不能激活基因,」他說。 “這些正是Encode數據將帶來的發現。”

其他生物學家也樂於使用這些數據,但他們仍然對數據的呈現感到不滿。愛丁堡大學羅斯林研究所ARK-Genomics主任米克‧沃森在部落格文章中寫道,他不同意Encode的定義。

「然而,我確實理解科學,就像許多其他學科一樣,需要並受益於持有不同觀點的人。你對功能性的看法當然與我相悖;然而,至少你所取得的成就是激發了關於這個話題的辯論,這對每個人都有益,」他寫道,並補充說格勞爾的論文給年輕科學家樹立了一個壞榜樣。

格勞爾對這項研究還有其他一些不滿,其中最主要的問題是數據分析。他感嘆,Encode 計畫中的許多分析師和研究人員都是電腦科學家,而不是生物學家。他說,他覺得自己必須站出來發聲。他還說,學生、博士後研究員和其他年輕研究人員後來都感謝他發表了這篇論文。

「很多人反對我的語氣,但實際上,語氣正是關鍵所在。我是一名教授,擁有終身教職……有時候,你需要像我這樣的老前輩才能做到這一點,」他說。 “科學的本質在於提出假設並證偽它們。許多處理和分析數據的人已經忘記了這一點。”

懷特同意,有些撰稿人缺乏演化生物學背景,這或許是炒作的原因之一——科學家誇大了他們的發現。他也表示,這或許也是引發強烈反對和持續不滿的原因之一。

他說:“當一些來自其他領域的人對你所在的領域妄加評論時,人們會對此感到不滿,因為他們對這個領域一無所知,而且他們的評論也是錯誤的。”

「我有點驚訝,這樣一篇措辭激烈的論文竟然未經修改就通過了——它充斥著一些赤裸裸的煽動性言論——但另一方面,我理解這種憤怒。我們很多人都非常憤怒,」他說。 “現在我們必須看看,這些數據是否有用?他們會開始發表基於這些數據的真正研究嗎?我們拭目以待。”