美國國立衛生研究院“冷對”基因數據隱私新挑戰
日期:2012-04-16 09:03:08
本周發表的一篇極具“挑釁性”的論文提到,研究人員找到一個方法可以連接一個人的基因到某一公共研究數據庫里其匿名的基因數據上。但是,美國國立衛生研究院(NIH)作為最大的此類數據庫的擁有者之一,表示不打算采用任何新步驟預防某些人利用這種辦法破壞基因隱私。這與NIH四年前的反應形成鮮明對比,當時,一個相類似的研究促使它將基因數據從其公共網站中取了出來。
那時,NIH將來自于數百人的單核苷酸多態性(SNP)數據張貼在了網上,以為不會破壞隱私。但是,隨后有科學家在《公共科學圖書館—遺傳學》(PloS Genetics)上發表文章指出,如果他們有某個人的DNA樣本,他們可以在一個公共DNA數據庫中連接到該人的SNP結果。如此一來,NIH和維康基金會不得不將這些數據從公共網站上撤了下來。現在,NIH只允許通過認證的研究者下載這些SNP數據。
對于特殊類型的基因數據而言,這種準入壁壘并不常見,例如通過研究組織樣本中的RNA水平分析測量基因活性。因為這類基因表達數據被認為不是起源于某個人,研究人員已經定期存放RNA結果到公共數據庫中,例如,NIH的基因表達綜合(GEO)數據庫。
但是,紐約市西奈山醫學院的Eric Schadt和同事在《自然—遺傳學》(Nature Genetics)發表的論文提到,他們發現了生成基于個體的基因表達結果的個人SNP“主頁”,或一個DNA“條碼”的方法。這就意味著,原則上講,如果有人有一個儲存在GEO參與者的DNA樣本,他將能夠設計出一個SNP條碼,用它來與GEO樣品進行匹配,尋找參與者的生物數據。
盡管與2008年PloS Genetics發表的論文相似,但是NIH此時并未憂慮。NIH的一份聲明提到,NIH認為不需要改變自己的數據共享模式。美國國家人類基因組研究所發言人Larry Thompson解釋道,Schadt團隊需要極為復雜的統計工具,并且這不是一個簡單的事情。Schadt則并不期望NIH采取新的數據訪問限制,而是希望強調,事實上可能沒有方法能夠完全保證個人基因數據安全。