10月9日,2024諾貝爾化學(xué)獎(jiǎng)揭曉。 今年的獎(jiǎng)項(xiàng),一半授予美國華盛頓大學(xué)的David Baker,以表彰其在計(jì)算蛋白質(zhì)設(shè)計(jì)方面的貢獻(xiàn)。 另一半則授予DeppMind的Demis Hassabis和John M. Jumper,以表彰其在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的貢獻(xiàn)。 他們?nèi)欢贾铝τ贏I蛋白質(zhì)的研究。 沒錯(cuò),萬物皆可AI,今年的諾獎(jiǎng)是妥妥的AI年 根據(jù)委員會(huì)的官方公告,今年的諾貝爾化學(xué)獎(jiǎng)聚焦蛋白質(zhì)。 David Baker成功完成了幾乎不可能的驚人成就:構(gòu)建全新種類的蛋白質(zhì)。 而Demis Hassabis和John Jumper則在2020年開發(fā)了AlphaFold 2,解決了人類50年來的夢(mèng)想:預(yù)測(cè)蛋白質(zhì)的復(fù)雜結(jié)構(gòu)。
沒想到,我們?cè)?jīng)的預(yù)言成真了。 拉斯克大獎(jiǎng)再次證明了自己「獲獎(jiǎng)風(fēng)向標(biāo)」的地位。 Hassabis也度過了傳奇的一天:白天祝福好朋友得諾獎(jiǎng),晚上自己親自得諾獎(jiǎng)。 紐約大學(xué)助理教授謝賽寧回憶稱,在DeepMind實(shí)習(xí)期間,Hassabis被問及公司目標(biāo)時(shí),便提到了獲得多個(gè)諾貝爾獎(jiǎng)。 而如今,這個(gè)使命已經(jīng)實(shí)現(xiàn)了一部分。 Demis Hassabis Demis Hassabis 1976年出生于英國。 4歲起,他就是國際象棋神通,在13歲時(shí)達(dá)到了大師標(biāo)準(zhǔn)。 1997年,他以雙第一的成績畢業(yè)于劍橋大學(xué),在倫敦大學(xué)學(xué)院完成了認(rèn)知神經(jīng)科學(xué)博士學(xué)位,又在MIT和哈佛攻讀博士后。 2010年,他和Shane Legg共同創(chuàng)辦DeepMind,擔(dān)任CEO。 2023年,DeepMind和谷歌大腦合并后,Hassabis擔(dān)任谷歌DeepMind團(tuán)隊(duì)CEO。 關(guān)于DeepMind的誕生還有一段傳奇故事:作為14歲以下世界上排名第二的象棋選手,Hassabis在一次聚會(huì)上成功征服了Peter Thiel,獲得了225萬美元風(fēng)投,成立了DeepMind。 John M. Jumper John Jumper是DeepMind的美國高級(jí)研究科學(xué)家。 2017年,他在芝加哥大學(xué)獲得博士學(xué)位。 作為一作,他和同事共同創(chuàng)建了AlphaFold。 2021年,他被Nature列為年度榜單十大「重要人物」之一。 David Baker David Baker 1962年出生于華盛頓州西雅圖。 1984年獲得哈佛學(xué)士學(xué)位,1989年獲得UC伯克利生物化學(xué)博士學(xué)位。 他是蛋白質(zhì)設(shè)計(jì)領(lǐng)域的「鼻祖級(jí)」人物,設(shè)計(jì)出了比AlphaFold更早的蛋白質(zhì)結(jié)構(gòu)設(shè)計(jì)算法RoseTTAFold,時(shí)間上比DeepMind更早。 作為美國國家科學(xué)院院士、華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所所長,他聯(lián)合創(chuàng)辦了十幾家生物技術(shù)公司,并入選《時(shí)代》 2024年首屆100名最具影響力的健康人物名單。 他們通過計(jì)算和AI揭示了蛋白質(zhì)的秘密 支撐生命體各種活動(dòng)的,是體內(nèi)旺盛且多樣的化學(xué)反應(yīng),而蛋白質(zhì)發(fā)揮了關(guān)鍵作用。 蛋白質(zhì)通常由20種氨基酸構(gòu)成,理論上,這些氨基酸可以以無限多種方式組合。以存儲(chǔ)在DNA中的信息作為藍(lán)圖,這些氨基酸在我們的細(xì)胞中被連接在一起形成長鏈。 接下來,蛋白質(zhì)的奇妙之處就體現(xiàn)出來了:氨基酸鏈會(huì)扭曲并折疊成一個(gè)獨(dú)特的,有時(shí)甚至是獨(dú)一無二的三維結(jié)構(gòu),正是這種結(jié)構(gòu)賦予了蛋白質(zhì)的生物功能。 蛋白質(zhì)可由十幾個(gè)到幾千個(gè)氨基酸組成,氨基酸鏈會(huì)折疊成特定的三維結(jié)構(gòu),而這種結(jié)構(gòu)決定了蛋白質(zhì)的功能 有些蛋白質(zhì)成為生命體的基本單元,可以構(gòu)建肌肉、角或羽毛,而其他的則可能成為激素或抗體。 其中許多蛋白質(zhì)會(huì)形成酶,以驚人的精確度驅(qū)動(dòng)生命的各種化學(xué)反應(yīng)。位于細(xì)胞表面的蛋白質(zhì)同樣重要,它們充當(dāng)細(xì)胞與其周圍環(huán)境之間的信號(hào)傳遞通道。 蛋白質(zhì)的首批圖像 自19世紀(jì)以來,化學(xué)家們就知道蛋白質(zhì)對(duì)生命過程至關(guān)重要,但直到20世紀(jì)50年代,化學(xué)工具才足夠精確,研究人員才能開始更詳細(xì)地探索蛋白質(zhì)。 劍橋研究人員John Kendrew和Max Perutz在50年代末取得了突破性發(fā)現(xiàn),他們成功使用一種叫做X射線晶體學(xué)(X-ray crystallography)的方法首次呈現(xiàn)出蛋白質(zhì)的三維模型。 因?yàn)檫@一發(fā)現(xiàn),他們于1962年獲得了諾貝爾化學(xué)獎(jiǎng)。 此后,研究人員主要使用X射線晶體成像技術(shù),加上付出了大量努力,成功繪制出約20萬種不同蛋白質(zhì)的圖像,才為今年的諾貝爾化學(xué)獎(jiǎng)奠定了基礎(chǔ)。 蛋白質(zhì)折疊之謎:一個(gè)50年的挑戰(zhàn) 美國科學(xué)家Christian Anfinsen做出了另一項(xiàng)早期重要發(fā)現(xiàn)。 通過各種化學(xué)技巧,他成功地使一個(gè)現(xiàn)有蛋白質(zhì)展開,然后再次折疊起來。有趣的是,蛋白質(zhì)每次都呈現(xiàn)出完全相同的形狀。 1961年,他得出結(jié)論,蛋白質(zhì)的三維結(jié)構(gòu)完全由氨基酸序列決定,這項(xiàng)發(fā)現(xiàn)使他在1972年獲得了諾貝爾化學(xué)獎(jiǎng)。 然而,Anfinsen的邏輯中包含一個(gè)悖論,另一位美國科學(xué)家Cyrus Levinthal在1969年指出了這一點(diǎn)。 Levinthal計(jì)算出,即使一個(gè)蛋白質(zhì)只由100個(gè)氨基酸組成,理論上該蛋白質(zhì)也可以呈現(xiàn)出至少10^47種不同的三維結(jié)構(gòu)。 如果氨基酸鏈?zhǔn)请S機(jī)折疊的,那么找到正確的蛋白質(zhì)結(jié)構(gòu)所需的時(shí)間將比宇宙的年齡還要長。然而在細(xì)胞中,這個(gè)過程只需要幾毫秒。那么,氨基酸鏈究竟是如何折疊的? Anfinsen的發(fā)現(xiàn)和Levinthal的質(zhì)疑共同指向了一個(gè)事實(shí):氨基酸折疊是一個(gè)預(yù)定的過程。更重要的是,關(guān)于蛋白質(zhì)如何折疊的所有信息都必須存在于氨基酸序列中。 生物化學(xué)領(lǐng)域新圣杯 上述見解導(dǎo)致了另一個(gè)決定性的認(rèn)識(shí)——如果化學(xué)家得知了蛋白質(zhì)的氨基酸序列,他們就應(yīng)該能夠預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)。 這是一個(gè)令人興奮的想法。如果成功,他們將不再需要使用復(fù)雜的X射線晶體學(xué)技術(shù),并且可以大大節(jié)省時(shí)間;此外,還能夠?yàn)樗蠿射線晶體學(xué)不適用的蛋白質(zhì)生成結(jié)構(gòu)。 這些邏輯和結(jié)論引出了生物化學(xué)領(lǐng)域的新圣杯:預(yù)測(cè)問題。 為了促進(jìn)該領(lǐng)域的快速發(fā)展,1994年研究人員啟動(dòng)了一個(gè)名為「蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估」(CASP)的項(xiàng)目,之后發(fā)展成為一項(xiàng)競(jìng)賽,每兩年舉辦一次。 在CASP競(jìng)賽中,來自世界各地的研究人員都可以拿到剛剛一批蛋白質(zhì)的氨基酸序列。這些蛋白質(zhì)的結(jié)構(gòu)剛剛被測(cè)定出來,但對(duì)參賽者嚴(yán)格保密。他們需要根據(jù)已知的氨基酸序列來預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。 CASP吸引了許多研究人員,但事實(shí)證明,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)是相當(dāng)困難的,多年來進(jìn)展十分緩慢,預(yù)測(cè)結(jié)構(gòu)和真實(shí)結(jié)構(gòu)之間的異質(zhì)性幾乎沒有任何改善。 直到2018年,突破才終于出現(xiàn),一位集國際象棋大師、神經(jīng)科學(xué)專家和人工智能先驅(qū)于一身的人物進(jìn)入了這個(gè)領(lǐng)域,為這個(gè)長期存在的難題帶來了全新的視角。 這個(gè)人,就是DeepMind聯(lián)合創(chuàng)始人Demis Hassabis。 AlphaGo大師挑戰(zhàn)蛋白質(zhì)奧林匹克 Demis Hassabis無愧于當(dāng)今AI深度學(xué)習(xí)的一大元老了。 他從4歲開始下國際象棋,13歲就達(dá)到了大師水平。在青少年時(shí)期,他便開始了程序員和游戲開發(fā)者的職業(yè)生涯。 隨后,Hassabis開始探索AI,并涉足神經(jīng)科學(xué),做出了幾項(xiàng)革命性的發(fā)現(xiàn)。 他堅(jiān)定地認(rèn)為,人工智能神經(jīng)網(wǎng)絡(luò)與人腦密不可分。因此,他決定利用自己所學(xué)的大腦知識(shí),來開發(fā)AI神經(jīng)網(wǎng)絡(luò)。 2010年,Hassabis與兒時(shí)的好友Mustafa Suleyman、以及研究同僚Shane Legg共同在英國創(chuàng)立了DeepMind。 當(dāng)時(shí),他們創(chuàng)造了一個(gè)以類人方式學(xué)習(xí)玩棋盤游戲AI神經(jīng)網(wǎng)絡(luò),一舉成名。 這個(gè)神經(jīng)網(wǎng)絡(luò)可以接入一個(gè)外部的存儲(chǔ)器,就像一個(gè)傳統(tǒng)的圖靈機(jī)一樣,使得一臺(tái)電腦可以模擬人類的短期記憶。 2014年,DeepMind被谷歌正式收購。 就在同年,Hassabis帶領(lǐng)團(tuán)隊(duì)拿下了被許多人視為AI領(lǐng)域的圣杯。 他們開發(fā)出的AlphaGo算法擊敗了世界圍棋冠軍。最為人熟知的是,2016年AlphaGo在與著名棋手李世石交手中,拔得頭籌。 隨之,進(jìn)化版的AlphaGo再次戰(zhàn)勝了人類選手。 然而,對(duì)Hassabis來說,圍棋并不是終極目標(biāo),而是開發(fā)出更好的AI的手段。 在這場(chǎng)勝利之后,他們準(zhǔn)備去迎接對(duì)人類更為重要的挑戰(zhàn)—— 因此,在2018年,Hassabis和團(tuán)隊(duì)報(bào)名參加了第十三屆蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估(CASP)競(jìng)賽。 Hassabis的AI模型意外獲勝 過去幾年里,CASP參賽的研究者在蛋白結(jié)構(gòu)預(yù)測(cè)上,最多能實(shí)現(xiàn)40%的準(zhǔn)確率。 Hassabis團(tuán)隊(duì)拿著AlphaFold去參賽后,竟達(dá)到了60%準(zhǔn)確率。 因此,在CASP競(jìng)賽首次亮相的AlphaFold,拿下了2018年的冠軍。 初代AlphaFold為43個(gè)建模領(lǐng)域中的24個(gè)創(chuàng)建了高精度結(jié)構(gòu)。這一結(jié)果,足以讓許多人為之震驚。 但對(duì)于他們來說,AlphaFold的潛力還遠(yuǎn)遠(yuǎn)沒有被開發(fā)。 若要真正取得成功,蛋白質(zhì)預(yù)測(cè)結(jié)構(gòu)必須達(dá)到90%準(zhǔn)確率。 由此,Hassabis和團(tuán)隊(duì)一起繼續(xù)埋頭深耕。 但是,無論他們?nèi)绾闻,都無法突破技術(shù)瓶頸。 彼時(shí)的團(tuán)隊(duì)成員,早已疲憊不堪。 驚喜的是,一位剛剛?cè)肼毜膯T工John Jumper提出了對(duì)AlphaFold改進(jìn)的突破性想法。 John Jumper:迎接生物化學(xué)的「重大挑戰(zhàn)」 作為AlphaFold的第一作者,DeepMind的高級(jí)研究科學(xué)家John Jumper曾在2021年被評(píng)為Nature年度十大人物。 曾經(jīng),對(duì)宇宙的著迷促使他開始學(xué)習(xí)物理學(xué)和數(shù)學(xué)。 但2008年,當(dāng)他開始在一家利用超算模擬蛋白質(zhì)及其動(dòng)力學(xué)的公司工作時(shí),開始意識(shí)到物理學(xué)知識(shí)可以幫助解決醫(yī)學(xué)問題。 2011年,攻讀理論物理學(xué)博士學(xué)位時(shí),為了節(jié)省算力,他開始開發(fā)更簡單、巧妙的方法,來模擬蛋白質(zhì)動(dòng)力學(xué)。 2017年,他完成了博士學(xué)位,聽說谷歌DeepMind在秘密開發(fā)預(yù)測(cè)蛋白質(zhì)的技術(shù)后,他發(fā)送了求職申請(qǐng)。 因?yàn)樵诘鞍踪|(zhì)模擬方面的經(jīng)驗(yàn),他對(duì)如何改進(jìn)AlphaFold有著創(chuàng)新性的想法,所以在團(tuán)隊(duì)遇到瓶頸后,他獲得了晉升。 隨后,他和Hassabis共同領(lǐng)導(dǎo)了開發(fā)AlphaFold 2的工作。 革新后的AI模型取得驚人結(jié)果 新版本的AlphaFold2,融入了Jumper對(duì)蛋白質(zhì)的深入認(rèn)知。 團(tuán)隊(duì)還開始使用Transformer,因而比以前更靈活地在海量數(shù)據(jù)中找到模式,有效地確定為了特定目標(biāo)應(yīng)該關(guān)注什么。 訓(xùn)練AlphaFold 2時(shí),他們用了所有已知蛋白質(zhì)結(jié)構(gòu)和氨基酸序列數(shù)據(jù)庫中的大量信息,而AlphaFold 2在第十四屆CASP競(jìng)賽中表現(xiàn)優(yōu)異。 當(dāng)CASP的組織者在2020年評(píng)估結(jié)果時(shí),他們意識(shí)到:生物化學(xué)50年來的挑戰(zhàn)已經(jīng)結(jié)束。 在大多數(shù)情況下,AlphaFold2的表現(xiàn)幾乎與X射線晶體學(xué)一樣好,這實(shí)在令人驚嘆。 AlphaFold2的工作原理 一本關(guān)于細(xì)胞的教科書改變了David Baker的人生軌跡 David Baker最初進(jìn)入哈佛大學(xué)時(shí),選擇了哲學(xué)和社會(huì)科學(xué)。 然而,在一門進(jìn)化生物學(xué)課程中,他偶然接觸到了經(jīng)典教科書《Molecular Biology of the Cell》的第一版。正是 這本書,徹底改變了他的人生方向。 自此,他開始探索細(xì)胞生物學(xué),最終對(duì)蛋白質(zhì)結(jié)構(gòu)產(chǎn)生了濃厚興趣。 1993年,Baker進(jìn)入華盛頓大學(xué)擔(dān)任研究組長,開始直面生物化學(xué)領(lǐng)域的這個(gè)「重大挑戰(zhàn)」。 通過一系列巧妙的實(shí)驗(yàn),他開始探索蛋白質(zhì)如何折疊。90年代末,他試著開發(fā)一款能預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的軟件,由此Rosetta誕生。 在1998年,Bake使用Rosetta首次參加CASP競(jìng)賽,表現(xiàn)異常出色。 這也啟發(fā)了他的創(chuàng)新性想法:反向使用這個(gè)軟件。 如果能輸入所需的蛋白質(zhì)結(jié)構(gòu),獲得氨基酸序列的建議,就能創(chuàng)造全新的蛋白質(zhì),而非僅僅將氨基酸序列輸入Rosetta,得到蛋白質(zhì)結(jié)構(gòu)。 Baker:從頭設(shè)計(jì)蛋白質(zhì)的先驅(qū) 20世紀(jì)90年代末,蛋白質(zhì)設(shè)計(jì)領(lǐng)域開始蓬勃發(fā)展。 在許多情況下,研究人員對(duì)現(xiàn)有蛋白質(zhì)進(jìn)行定向改造,使它們能夠執(zhí)行新的功能,比如降解環(huán)境污染物或在化學(xué)制造業(yè)中充當(dāng)催化劑。 然而,天然蛋白質(zhì)的功能范圍畢竟是有限的。為了突破這一局限性,增加蛋白質(zhì)的潛力,Baker的研究小組提出了一個(gè)大膽的想法:從頭設(shè)計(jì)全新的蛋白質(zhì)。 這種想法從何而來?Baker曾經(jīng)有一個(gè)形象的比喻: 「如果你想造一架飛機(jī),你不會(huì)從改造一只鳥開始;相反,你會(huì)深入理解空氣動(dòng)力學(xué)的基本原理,然后基于這些原理構(gòu)建全新的飛行器! Baker的這種從零開始的蛋白質(zhì)設(shè)計(jì)方法,開創(chuàng)了蛋白質(zhì)工程領(lǐng)域的新紀(jì)元,為未來的生物技術(shù)和醫(yī)學(xué)應(yīng)用提供了無限可能。 獨(dú)特蛋白質(zhì)的誕生:從頭設(shè)計(jì)的突破 構(gòu)建全新蛋白質(zhì),被稱為「從頭設(shè)計(jì)」(de novo design)。 Baker團(tuán)隊(duì)首先繪制了一種全新結(jié)構(gòu)的蛋白質(zhì),然后利用名為Rosetta的軟件計(jì)算出能夠產(chǎn)生所需蛋白質(zhì)的氨基酸序列。 Rosetta先搜索數(shù)據(jù)庫中所有已知的蛋白質(zhì)結(jié)構(gòu),尋找與目標(biāo)結(jié)構(gòu)相似的短蛋白質(zhì)片段;隨后,軟件利用蛋白質(zhì)能量圖的基本知識(shí),優(yōu)化這些片段,并提出了最終的氨基酸序列。 為了驗(yàn)證軟件的效果,Baker的研究小組將設(shè)計(jì)的氨基酸序列對(duì)應(yīng)的基因引入到細(xì)菌中,使其產(chǎn)生目標(biāo)蛋白質(zhì)。隨后,他們使用X射線晶體學(xué)技術(shù)確定了蛋白質(zhì)的實(shí)際結(jié)構(gòu)。 結(jié)果令人振奮:Rosetta確實(shí)成功構(gòu)建了預(yù)期的蛋白質(zhì)。這個(gè)觀察到的名為Top7的蛋白質(zhì)結(jié)構(gòu)幾乎完全符合他們的設(shè)計(jì),標(biāo)志著蛋白質(zhì)工程領(lǐng)域的重大突破。 Top7——第一個(gè)與所有已知現(xiàn)有蛋白質(zhì)完全不同的蛋白質(zhì) Baker實(shí)驗(yàn)室的驚人創(chuàng)造 對(duì)于蛋白質(zhì)設(shè)計(jì)領(lǐng)域的研究人員來說,Top7的出現(xiàn)無疑是一個(gè)里程碑。 此前,從頭設(shè)計(jì)蛋白質(zhì)的嘗試僅限于模仿自然界已存在的結(jié)構(gòu)。而Top7的獨(dú)特結(jié)構(gòu)在自然界中前所未見。 更令人驚嘆的是,它由93個(gè)氨基酸組成,比之前使用從頭設(shè)計(jì)方法生產(chǎn)的任何蛋白質(zhì)都要大得多,這相當(dāng)于在分子尺度上構(gòu)建了一個(gè)微型的「蛋白質(zhì)大廈」。 Baker于2003年發(fā)表了這一開創(chuàng)性發(fā)現(xiàn),并慷慨地公開了Rosetta的源代碼,這一舉動(dòng)極大地推動(dòng)了全球研究社區(qū)對(duì)該軟件的持續(xù)開發(fā)和創(chuàng)新應(yīng)用,為蛋白質(zhì)設(shè)計(jì)領(lǐng)域注入了新的活力。 隨著這些突破性成果的涌現(xiàn),2024年諾貝爾化學(xué)獎(jiǎng)的輪廓已經(jīng)初現(xiàn)。 曾經(jīng)需要數(shù)年的工作現(xiàn)在只需幾分鐘 當(dāng)Demis Hassabis和John Jumper確認(rèn)AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具AlphaFold2真的有效時(shí),便開始了所有人類蛋白質(zhì)結(jié)構(gòu)的計(jì)算。 隨后,他們預(yù)測(cè)了研究人員在探索地球生物多樣性過程中,發(fā)現(xiàn)的幾乎所有2億種蛋白質(zhì)的結(jié)構(gòu)。 不僅如此,谷歌DeepMind還公開了AlphaFold2的代碼,任何人都可以訪問。 如今,這個(gè)AI模型已成為研究人員的寶貴資源。截至2024年10月,已有來自190個(gè)國家的超過200萬名用戶使用了AlphaFold2。 以前,獲得一個(gè)蛋白質(zhì)結(jié)構(gòu)通常需要數(shù)年時(shí)間,而且并不總是能成功,F(xiàn)在只需幾分鐘就能完成。 雖然這個(gè)AI模型并非完美,但它能估計(jì)所產(chǎn)生結(jié)構(gòu)的正確性,因此研究人員能夠了解預(yù)測(cè)結(jié)果的可靠程度。 利用AlphaFold2預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu) 在2020年CASP競(jìng)賽之后,David Baker意識(shí)到了基于Transformer的AI模型的潛力。 隨后,他便將其添加到Rosetta軟件中,從而促進(jìn)了蛋白質(zhì)設(shè)計(jì)的發(fā)展。 近年來,一個(gè)又一個(gè)令人驚嘆的人工設(shè)計(jì)蛋白質(zhì)從Baker的實(shí)驗(yàn)室涌現(xiàn)。 利用Rosetta軟件設(shè)計(jì)的人工蛋白質(zhì) AI的影響力,已經(jīng)滲透進(jìn)了諾貝爾獎(jiǎng)的各個(gè)領(lǐng)域,不知接下來是否還會(huì)有驚喜。 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選