{蜜色影院}-韩国伦理电影网站,国产无遮挡a片又黄又爽,亚洲av色无码乱码在线观看国产,欧美精品综合视频一区二区,无遮挡又色又刺激的视频直播,亚洲黄色国产片子

當前位置:首頁 > 專題 > 科普生活

“生物計算”是什么?為什么中國不能落后?

【信息來源:【作者:【信息時間:2021-12-20 08:58  閱讀次數: 】【字號 】【我要打印】【關閉

什么是生物計算?

如果有一位科學家跟你說,他是做蛋白質結構研究的,我想絕大多數人腦海中會浮現出這樣的景象:他穿著白大褂,聚精會神地坐在顯微鏡前觀察。這似乎已經成了生物化學家的標準形象。然而有一天你去他辦公室,卻發現根本看不到顯微鏡和試管,只看到他穿著寬大舒服的便裝,在電腦上噼里啪啦地敲代碼,這個景象必然會讓很多人大吃一驚。實際上,準確地說,這位科學家是一位生物計算學家(或計算生物學家)。他的研究對象的確是像蛋白質或者 DNA 這樣微小的生物活性物質,但他和傳統的生物化學家不同的是,他的研究工具不是試管和顯微鏡,而是——計算機。

很多人在初次看到類似“某某公司進軍生物計算”這樣的新聞標題時,往往會產生強烈的不明覺厲的感覺。甚至有人以為是該公司要用生物活性物質來制造計算機,就像科幻電影中出現的那種插滿電極的一攤軟乎乎的腦組織。

這真是一個天大的誤會。這些新聞其實說的是:某公司要設計一種 AI 算法,它能夠根據有限的蛋白質信息,準確地繪制出蛋白質的三維結構。打個形象的比喻,這家公司相當于要幫助警察設計一個程序,它能根據受害人的描述,準確地繪制出兇手的外貌。繪制出某個蛋白質的三維結構對于新藥研發,例如新冠病毒的疫苗研發有著極其重大的意義。但是,這個問題也極為困難,它是當今人類科學面臨的幾個至關重要的挑戰之一。想要知道它難在哪里,又為什么意義重大,往下看。

蛋白質折疊問題

蛋白質從微觀上來說,就是一團有機大分子。它是構成生命的基本零件,每一種蛋白質都有一個特定的三維結構,但這種三維結構有一個特殊之處:它一定是由一根長長的鏈條折疊而成的。要理解蛋白質的三維結構到底是怎樣的,你只需要去玩一種叫“百變魔尺”的兒童玩具,就能馬上理解。百變魔尺是一節一節的,每一節都可以做各個角度的翻轉。因此,你可以把一根長長的魔尺折疊成各種各樣的形狀,魔尺的節數越多,能夠折疊出的形狀數量就會呈指數級的增長。

組成蛋白質的基本單元是氨基酸,它就像魔尺的一個“節”。蛋白質剛剛生成時,就像一根長長的幾十到幾百節的魔尺。然后,它會在幾微秒到幾毫秒的時間內,迅速地折疊成一個特定的形狀。因此,在電子顯微鏡中,每一個蛋白質就像是一團亂麻。

因此,決定一個蛋白質性狀和功能的,就是構成蛋白質的氨基酸序列和蛋白質最終折疊成的形狀。比如,我們的免疫系統在面對病毒和細菌入侵時,就會產生一種“Y”字形的抗體蛋白。它們的形狀就像是一個抓娃娃機的夾子,能夠精確瞄準并夾住這些入侵者。

我們的韌帶、骨骼和皮膚之間有大量的膠原蛋白。它們的形狀就像是由三根粗繩擰成的麻花,為我們的皮膚提供張力,使其顯得有彈性。

再比如,2020 年獲得諾獎的基因定點編輯技術 CRISPR,也正是利用了一個長得像螃蟹鉗子的 CAS9 蛋白。它會“緊緊地夾住”基因組中某段特定的 DNA,從而進行剪切。

因此,科學家們對蛋白質最感興趣的是 2 個信息:一個是蛋白質的氨基酸序列,你可以想象成魔尺的那些“節”;另一個則是蛋白質的結構,也就是魔尺折疊后的形狀。序列信息相對容易獲得,但結構信息卻極難獲得。偏偏結構信息又更重要,因為知道了一個未知蛋白質的結構,就可以更準確地理解它在細胞中的作用。如果這個蛋白質與某種疾病相聯系,那么科學家們就能根據它的結構形狀,開發出相應的藥物。1972 年,諾貝爾化學獎獲得者克里斯蒂安·安芬森提出了一個假說:其實我們只需要知道一個信息就足夠了。因為他在實驗中發現,一個蛋白質只要序列不發生改變,并且一直處于同一個化學環境中,那么它每次都能折疊成一樣的三維結構。所以,蛋白質在三維空間中該如何折疊,這些信息其實已經包含在了它的氨基酸序列中。換句話說,如果我們知道了一個蛋白質的氨基酸序列,理論上我們就應該能推測出它的三維結構。

安芬森的這個假說得到了全世界同行的認可。然而科學家們很快就發現,好像知道了這個理論也沒什么用。雖然我們能在實驗室中相對容易地測出一個蛋白質的氨基酸序列,但拿到這個序列,我們依然無法根據某條物理法則準確推測出它的三維結構。對此,科學家們已經研究了將近 50 年,直到今天也沒有徹底弄清楚蛋白質折疊的規律。這個問題在生物化學界被稱為“蛋白質折疊問題”,它是 21 世紀人類科學面臨的幾大挑戰之一。

燒錢的產業

現在的科學家想要弄清楚一個蛋白質的三維結構,唯一的辦法只能是耗費巨大的人力、物力,用極其笨拙的方法,通過大量的重復性實驗來找到蛋白質的三維結構。需要的實驗設備如冷凍電鏡、X 射線晶體衍射儀、核磁共振儀等都價格昂貴。例如一臺冷凍電鏡的價格就高達數百萬至幾千萬人民幣。解析結構的過程是否順利有很大的運氣成分。運氣不好的時候,重復個上千次實驗都有可能出不來結果。因此,每解析一個蛋白質結構,通常的成本在幾萬到幾十萬美元之間。

從上世紀末開始,以 IBM 為首的一些計算機技術公司就提出了一個大膽的設想:可以通過蛋白質的氨基酸序列,利用超級計算機來預測蛋白質的三維結構。這相當于把原先在試管中進行的實驗,轉移到電腦的數字空間中進行。這個想法在當時非常大膽和前衛,因為它的運算量對于當時的計算機來說是天文數字。你可能好奇:預測一個蛋白質的折疊,怎么會需要海量的計算?粗略地說,計算過程就好像在彩票箱中摸獎。一個擁有 100 個氨基酸的蛋白質,你想象成是一個擁有 100 節的魔尺,它共可以產生約 10^94 次方種不同的形狀。這個數量已經遠遠超過了整個宇宙中基本粒子的數量。計算機要做的事情其實就是排除法。根據一定的規則,先是一批批排除某類絕對不可能的結構,然后再根據蛋白質表現出來的性狀一個一個地排除。到了最后階段就像是不停地在一個巨大的彩票箱中抽獎,每抽一次都要耗費巨大的運算量。

IBM 用了 5 年的時間搞研發,終于在 2004 年宣布:世界上最大的超級電腦“藍色基因”(Blue Gene)問世。它的主要目標就是解決蛋白質折疊問題。然而,事情進展得并不像計算機專家們估計的那樣樂觀。10 年之后,藍色基因升級了三代,超級計算機也沒能取代試管、X 射線晶體衍射和核磁共振。IBM 也遺憾地終止了藍色基因系列的開發。

不過,IBM 的失敗并不代表計算機模擬蛋白質結構的失敗。恰恰相反,在 IBM 的帶動下,參與這項挑戰的團隊越來越多,成果也越來越豐富。各種各樣奇妙的解題思路層出不窮,最好玩的例子是華盛頓大學的大衛·貝克(Davided Baker)教授的發明。

2008 年,他的團隊開發出了一款名叫“Foldit”的解謎游戲。而這款解謎游戲的內容就是讓用戶憑借自己的直覺來折疊蛋白質,然后根據一定的規則獲得分數。結果非常喜人,一個困擾了生物學家 15 年之久的猴類艾滋病毒相關蛋白,作為謎題被上傳到游戲后,玩家們只用了 10 天就成功地破解了它最可能的折疊方式。

從 1994 年開始,就誕生了一個名叫 CASP 的國際蛋白質結構預測競賽。每兩年舉辦一次,參賽隊伍越來越多,全球的科技大佬云集。這個競賽中,裁判會給每個小組預測的結構進行打分,滿分 100 分。在 2020 年 12 月結束的第 14 屆競賽中,傳來一個令人震驚的消息:曾經開發出著名的圍棋程序 AlphaGo 的谷歌公司人工智能團隊,他們開發的 AlphaFold 程序獲得冠軍,得到了 92.4 分。而上一屆同樣是冠軍的它,得分還不到 60 分,這種進步的速度太令人震驚了。AlphaFold 預測的蛋白質結構已經非常接近于真實實驗做出來的結果,人類離計算機攻克蛋白質折疊問題只有一步之遙。

中國理應入場

到此你對“生物計算”應該已經有了一個初步的概念。不知道你發現沒,前文講了這么多,居然沒有一次提到中國。具有如此重要意義的一項科學事業,過去的幾十年基本上都是老外在玩兒,沒我們中國人什么事,這真的讓我感到揪心。對于未來的新藥研發、疫苗研發、精準醫療等等生物醫學技術,我幾乎可以肯定地說:得生物計算者得天下。傳統的試管加電鏡式的研發模式,終將被 AI 所取代。這項科學研究事業,理應上升到國家戰略的高度。

手機掃一掃
官方微博 官方微博
微信公眾號 微信公眾號