如果說去年的GTC爐邊談話,黃仁勛與OpenAI首席科學家Illya進行的是一場對技術未來的漫談,那今年這場爐邊談話就是李飛飛對人類未來的呼吁。 在這次對談中,李飛飛講了個故事。當她完成自己書的初版時,她的好朋友,哲學家、斯坦福以人為本AI研究院聯(lián)合主任約翰·埃奇門迪看了初稿后建議她去重寫。他說很多人都在寫關于AI的書,但李飛飛有一段獨特的歷程。能代表了很多覺得自己在AI領域沒有發(fā)言權或找不到認同感的人。這些人包括移民、年輕女性、各行各業(yè)的人,他們不一定是典型的硅谷AI人士。如果李飛飛能給他們一個聲音,這將更有力量。 李飛飛,她的一面是斯坦福大學教授,美國工程學院院士,AI視覺領域的頂尖專家,被業(yè)內(nèi)稱為AI教母。她的另一面是出生在北京,長于四川,直到12歲才隨雙親前往美國,還因生活拮據(jù)不得不去餐館打工。這就是艾奇門迪提到的李飛飛的“獨特的經(jīng)歷”。 在整場對談,李飛飛都用一種很不同的思考AI的視角,來給這個AI時代失語的普通人一個聲音。 那是一種更有人文情懷的,更具社會責任,也更女性細膩的視角。 在這次訪談中,李飛飛直接回答關于AI的技術發(fā)展路徑和未來應用這些具體的行業(yè)問題只占了全部討論的不到1/4。這并不是對談者,英偉達的首席科學家Bill Dally沒問這些問題。他問了Sora的發(fā)展會如何影響影視行業(yè),李飛飛的回答卻是宮崎駿動畫的無可替代,以此證明“只有人能利用AI創(chuàng)作那些能觸動他人、啟發(fā)他人或服務他人的內(nèi)容,而AI做不到”。他問了AI科學未來的影響,李飛飛的答案是人工智能在醫(yī)療領域的應用可能是最深遠的。答案很中規(guī)中矩,但她的理由是那些在這個領域工作的女性和有色人種可以借由AI擺脫艱苦的,被忽視的照護工作;老年人可以通過技術獲得更有尊嚴的暮年。 哪怕是在那些關于技術路徑的問題中,她的回答也朝向著人的細膩和獨特。像辛頓,楊立昆一樣,李飛飛不相信單純依靠縮放定律就能高效的解決一切問題,她認為我們需要一個結構化的模型去引導AI。但與其他人都不同,她最終理想的模型是感知的,超越語言互動的模型,只有能掌握人類在5.4億年的時間里形成的那些細微的,比文字更人性的感知,AI才算有了基礎模型。 在其他的時間里,她都在聊公共部門在AI發(fā)展中面對的困境,聊AI的監(jiān)管模式。這些看似離人們非常遠的話題。但她還是站在每個人的角度思考著。公共部門意味著公共利益,意味著與每個人相關。只有公共部門得到足夠的支持,才能推動科學發(fā)現(xiàn)創(chuàng)新、為公眾提供客觀解釋、培養(yǎng)負責任的人才,讓AI的繁榮落在每一個人頭上。 在她那里,所有AI的發(fā)展都是關于人,具體的人的。 在整場對談的最后一分鐘半,Bill Dally的問題已經(jīng)問完。他請李飛飛講講她想傳遞給所有人的話。 李飛飛先講了自己的故事,一個住在美國鄉(xiāng)鎮(zhèn)里愛跳舞的女孩的故事——她不是計算機科學家,不是理科畢業(yè)的,甚至家里連電腦都沒有,但她還是和AI產(chǎn)生了如此多的聯(lián)系,在AI的發(fā)展中扮演了一個角色。 所以我們不要被那些時髦的術語嚇到,不要迷茫于AI時代自己的角色。只要把AI當成一個工具,人類不僅是工具的創(chuàng)造者,我們也是如何使用工具的決策者。去擁抱它,去做那個決策者,做那個讓它被正確使用,變得更好的人。我們在AI時代的未來一定會像馬丁路德想的那樣,讓人類文明的弧線朝著正義、希望、仁愛的方向發(fā)展。 這就是我們每個人,每個普通人,而非硅谷精英應該在這個AI時代里的角色。 這也是這位“AI教母”對每個人的懇求:在AI發(fā)展中有一個角色。 以下為GTC爐邊訪談的全文: 我不是盲目樂觀,但我相信AI會帶來好的未來 Bill Dally:歡迎大家,感謝來到GTC。我相信大家和我一樣,都對李飛飛教授要說的話充滿期待。讓我們開始吧。你是斯坦福以人為本AI研究院(HAI Stanford)的聯(lián)合創(chuàng)始人。到目前為止,你認為AI對人類影響最大的領域是什么?你認為未來AI將在哪些領域產(chǎn)生最大影響? 李飛飛:這是一個非常宏大的問題。首先,非常榮幸受邀來到GTC。AI目前對人類的影響是什么?我認為AI可能是21世紀最深刻的技術,它正在改變我們的生活、工作和未來。AI是一種智能技術。老實說,在這之前,人類的技術發(fā)明大多停留在不涉及智能的層面,無論是發(fā)明工具讓我們走得更快、飛得更高,還是發(fā)明工具讓我們能看到人眼看不到的東西,這些都還是機械性的。但AI的發(fā)明,如理解語言、翻譯語言、做決策、發(fā)現(xiàn)模式等,這些都是人類的基本能力,而現(xiàn)在都受到了這項深刻技術的挑戰(zhàn)。所以在我看來,AI的影響是對人類的本質(zhì)、能力和定義的深刻影響。 Bill Dally:但你認為在人類的某些特定領域,如醫(yī)療、教育或交通等,AI會產(chǎn)生比其他領域更大的影響嗎? 李飛飛:我認為AI的應用非常廣泛。在我擔任谷歌云首席科學家時,我就看到商業(yè)分析是AI的一大應用領域。我完全同意你的看法。醫(yī)療、交通、教育、軟件工程等領域,AI的影響將是無邊無際的。 Bill Dally:一些業(yè)界名人如埃隆·馬斯克和山姆·奧特曼認為AI可能對人類構成生存威脅。你怎么看?AI可能帶來的最大風險是什么?是換臉技術還是失業(yè)?AI的不利影響有哪些? 李飛飛:我認為這是一個合理的問題。作為大學里的人,尤其是在大學校園工作,我們應該被允許提出各種問題,包括AI是否對人類構成生存威脅。從智力角度來說,這是一個重要的關于未來的問題。作為一個物種,人類應該認識到,我們發(fā)明的一切,不僅是AI,還包括我們正在改變地球的方式,改變我們與環(huán)境的關系的方式,都需要我們審慎對待。但就AI而言,我更關注更直接和緊迫的災難性風險。你提到的一些風險是深層次的社會問題。例如,AI可能因為錯誤信息而影響民主,可能取代工作或改變勞動力市場格局,可能影響我們與數(shù)據(jù)的關系、隱私和公平性。如果我們不能很好地管理這項技術的應用,所有這些都可能帶來災難性的社會風險。 Bill Dally:你最近寫了一本關于AI的科學回憶錄,我這里有一本。大家現(xiàn)在應該都從亞馬遜上訂購這本書。你能告訴我們一些關于這本書的情況嗎?你為什么要寫這本書? 李飛飛:這本書是一本科學回憶錄。就像你說的,我把“科學”這個詞放在第一位。這本書有一個雙螺旋結構,通過我作為一名計算機視覺科學家的視角講述了AI的發(fā)展歷程。我看到,智能在自然界的進化始于對世界的感知。在過去十幾年里,AI的進化,特別是深度學習的歷史,與計算機視覺這個領域的進化緊密交織在一起。所以這是AI在過去十年左右的發(fā)展歷程,也與一個年輕科學家的個人成長歷程交織在一起。 我之所以覺得有必要寫這本書,是因為當我被要求寫一本關于AI的科普書時,我確實花了一年時間在COVID大流行期間寫了一本只關于AI的書。但我們的好朋友,哲學家、斯坦福以人為本AI研究院聯(lián)合主任約翰·埃奇門迪看了我的初稿,基本上說我應該重寫。我當時非常沮喪。他說,看,很多人都在寫關于AI的書,但你有一段獨特的歷程。你代表了很多覺得自己在AI領域沒有發(fā)言權或找不到認同感的人。這些人包括移民、年輕女性、各行各業(yè)的人,他們不一定是典型的硅谷AI人士。如果你能給他們一個聲音,這將更有力量。因此,我把這本書的結構改成了雙螺旋結構。 Bill Dally:非常有趣。AI的發(fā)展歷程與你作為一名科學家的成長歷程交織在一起。假設AI在十年后變得成熟的話,如果你要為這本書寫一個續(xù)集,你認為它會是什么樣的? 李飛飛:首先,我不認為我想寫續(xù)集。(但如果這么做的話)這肯定是一項充滿愛的工作。如果我要為這本書寫續(xù)集,我想寫一個人類勝利的故事。我要講述我們?nèi)绾卫眠@項技術讓生活和工作變得更好。我這么說并不是出于盲目的樂觀,因為我知道世界非常復雜。對年輕人來說,這個世界有時甚至感覺有點反烏托邦。但如果你看人類文明的發(fā)展歷程,它是很長的。正如馬丁·路德·金所說,如果我們能以正確的方式使用技術,人類文明的弧線是朝著正義、希望、仁愛的方向發(fā)展的。 就像在這次GTC大會上,我們只是看到了(技術改變生活的)冰山一角。我們看到了如何利用這項技術改變醫(yī)療,從藥物發(fā)現(xiàn)到個性化治療再到醫(yī)療服務。我們才剛剛開始思考教育如何從根本上被改變,因為突然之間我們有了一個教學助手,可以進行深度個性化學習和教學。我們看到,科學發(fā)現(xiàn)可以在強大的機器和認知助手的幫助下加速,這些助手可以真正加速人類已經(jīng)進行了數(shù)百年的科學發(fā)現(xiàn)過程。所有這些都給了我們希望之光,希望我們在五到十年內(nèi)能利用AI尋找氣候解決方案,普及醫(yī)療服務,照顧好地球和我們自己。 如果我要寫續(xù)集,我想寫的就是這些。 Bill Dally:我希望這就是我們要寫的未來。這是一個非常樂觀和積極的世界觀。 李飛飛:我之所以樂觀,是因為我們正在一起努力。我不是坐在這里空談,而是真的相信,如果我們相信,我們就去做。 Bill Dally:沒錯。所以我們一起努力創(chuàng)造我們想要的未來。 李飛飛:是的。 公共部門沒有GPU,基礎創(chuàng)新就不會再發(fā)生 Bill Dally:你一直呼吁為學術界提供資源,以推進AI研究。但迄今為止,真正掌握訓練模型所需GPU和數(shù)據(jù)的,還是那些資金雄厚的大公司。你認為未來這種情況會如何發(fā)展?國家AI研究資源(NAIRR)能否實現(xiàn)并民主化AI,讓學術界和小公司也能接觸到?還是人才將繼續(xù)從學術界流向大公司? 李飛飛:首先,我認為我們倆現(xiàn)在都在白宮的各種顧問職位。你是總統(tǒng)科技顧問委員會(PCAST)的成員,我是拜登總統(tǒng)NAIRR特別工作組的成員。對于那些不知道NAIRR是什么的人,NAIRR是國家人工智能研究資源試點項目。 幾年前,斯坦福HAI倡導聯(lián)邦政府考慮增加對公共部門AI的資源投入,尤其是計算資源和數(shù)據(jù)資源。這轉化為一項目前仍在國會討論的法案,名為“創(chuàng)建AI法案”(CREATE AI BILL)。如果這項法案獲得通過和撥款,它將創(chuàng)建聯(lián)邦基金,用以建立一個國家AI云以及供公共部門使用的數(shù)據(jù)存儲庫。 斯坦福HAI一直在引領這場運動。我之所以在華盛頓特區(qū)花這么多時間,是因為我相信公共部門AI和私營部門AI同樣重要。但就像Bill說的,現(xiàn)在的平衡是如此失衡。這個國家現(xiàn)在沒有一所大學能訓練出一個GPT聊天模型。我們沒有成千上萬的GPU,更不用說A100、H100或B200了。 有些人可能會問,這有什么問題?反正我們有偉大的公司,偉大的大型科技公司在創(chuàng)造偉大的技術。我認為這是事實。私營部門在蓬勃發(fā)展。但我想讓大家認識到,公共部門創(chuàng)造公共利益。什么是公共利益?公共利益有幾個維度,對我們當下和未來都很重要。 首先,公共利益包括好奇心驅動和知識驅動的發(fā)現(xiàn)與創(chuàng)新。這太重要了。你們現(xiàn)在所知道的關于AI的一切,最初都始于學術界那些無人知曉的好奇心驅動的研究課題。從感知機到反向傳播算法再到ImageNet,這些都來自公共部門。這種天馬行空式的、好奇心驅動的研究至關重要。它是一種公共利益,對我們社會的持續(xù)創(chuàng)新很重要。 公共利益的第二部分是作為公眾值得信賴的合作伙伴去解釋、教育和評估技術。私營部門有自己的目標。那誰來作為值得信賴的合作伙伴,讓我們了解這項技術有多安全?透明度指數(shù)是多少?數(shù)據(jù)是否有偏差?我們?nèi)绾我怨、值得信賴的方式使用這個推論?這些都是公共部門正在做而且可以幫助公眾的重要話題。 最后但同樣重要的是,公共利益的一種形式是最重要的,那就是人才。這是為了明天的人才。我們肩負很大的責任,去教育出不僅能發(fā)展未來科技的勞動力,而且是能對世界負責任的勞動力。這些勞動力不僅要學習如何編寫AI代碼,還要學習AI的道德框架,AI的社會影響。所以這些都是公共利益,支持公共部門AI很重要。 Bill Dally:在人才這個話題下繼續(xù),如果我們要發(fā)展公共部門AI,就意味著我們需要把AI專家吸引到公共部門。鑒于目前AI人才市場的情況,那里正在上演激烈的競價戰(zhàn),開出的薪酬是聯(lián)邦政府工資等級所能支付的好幾倍。所以你設想如何吸引真正優(yōu)秀的AI人才進入公共部門? 李飛飛:這是一個很好的問題,Bill。我記得十年前你還是系主任,想把人才吸引到學術界。 首先,在這個國家,進入私營部門的學生總是會更多,所以我們不是要實現(xiàn)50/50的平衡。但對于那些一心想留在公共部門或去學術界的人來說,我真的希望給他們提供資源非常重要。他們不是在尋求英偉達級別的薪酬,他們想要獲得的是計算資源。就我個人而言,我和我的學生們希望有這樣的計算資源,這樣我們就可以與斯坦福醫(yī)院合作,從事可能需要幾百個GPU的項目。他們想要一個不會不斷流失人才的社區(qū)。他們的同學、同事以及公共部門與私營部門的合作伙伴關系,在為他們提供資源方面可以發(fā)揮很大作用。 但我也想呼吁公共部門本身的創(chuàng)新。我們的公共部門,我們的機構,這個國家已經(jīng)有幾百年的歷史了,那里的結構需要創(chuàng)新。這是為了應對當今快速變化的行業(yè)格局和人才格局。所以我們自己應該做一些工作,但我希望雙方都能努力,讓情況變得更好。 Bill Dally:在公私合作的標題下,你對NAIRR試點項目有何看法?正如你所知,我們非常勤奮的國會公共代表正在推動法案,以授權和撥款NAIRR。與此同時,一個試點項目已經(jīng)啟動,主要是捐贈資源,英偉達提供了3000萬美元,微軟提供了相當數(shù)量的GPU。這會產(chǎn)生影響嗎?你認為這將如何運作? 李飛飛:很好的問題。對于那些不知道的人,NAIRR試點項目,就像Bill說的,是總統(tǒng)去年11月AI行政命令撥款的一小部分計算資源。所以這是行政命令的一部分。我積極地看到私營公司走到一起,試圖支持這項工作。作為一名學者,我太忙于支持NAIRR,錯過了申請這些算力的截止日期。所以這一輪我不會受益,但我確實看到全國各地申請這個項目的同事有可能受益。 但我也直言不諱地說,這個項目太小了,我不知道這算不算是杯水車薪。我不是想否定它,這是一個很好的第一步,但我希望沒有人對此感到滿足。我希望白宮、國會、行業(yè)領袖們都不要滿足于此,因為它實在是太小了?紤]到當前大模型的規(guī)模、數(shù)據(jù)的規(guī)模以及公共部門可以用這些計算資源做的事情的潛力,這真的只是滄海一粟。我們還有很多工作要做。 AI就像電力,給它設置單獨監(jiān)管機構沒意義 Bill Dally:你一直在把公共部門和私立大學混為一談。如果把它們分開,問一下你認為政府實際上會如何使用AI?它會更好地為人民服務嗎?它會簡化各種政府服務的途徑嗎?真正的公共部門應用有哪些? 李飛飛:順便說一下,即使是私立大學也是非營利組織,所以我說的公共部門更多的是非營利組織。但你提出了一個很好的問題,關于政府使用AI這件事,因為就AI而言,政府既是服務提供者,也是監(jiān)管者。我認為政府扮演著這兩個角色。在斯坦福HAI,我們有頂尖的學者與美國政府合作,無論是國稅局、環(huán)保局還是其他機構,我們都在利用AI實現(xiàn)政府服務的現(xiàn)代化。 老實說,我們在座的人都會受此影響。我們可能覺得許多政府部門的服務缺乏現(xiàn)代化,所以我認為AI真的可以像幫助企業(yè)一樣,無論是呼叫中心還是個性化幫助,AI都可以大有作為。此外,在金融部門或者公共部門的金融領域,AI可以進行欺詐檢測,可以幫助確定案件的優(yōu)先級。上周我在華盛頓特區(qū)與退伍軍人事務部部長交談,討論我們?nèi)绾卫肁I更好地服務退伍軍人。所以政府確實有很多應用,只是為了實現(xiàn)服務的現(xiàn)代化,讓服務更有效率、更有成效。 Bill Dally:你提到的政府在AI方面的另一個角色是監(jiān)管。歐盟最近通過了一項AI監(jiān)管法案。在美國,當然也有一些參議員和國會議員在談論做類似的事情,在許多情況下,他們覺得自己在社交媒體上錯過了機會。他們不想在AI上落后。你認為AI監(jiān)管將走向何方?它會帶來好處還是壞處? 李飛飛:這是一個非常深刻的問題。當然,就安全至上的監(jiān)管而言,歐盟往往在時間上領先于美國。而美國作為一個社會引以為豪的是我們的創(chuàng)新環(huán)境。我絕對是個中間派,這讓我很無聊。 Bill Dally:但你絕不無聊。 李飛飛:謝謝。我絕對相信監(jiān)管有它的作用。就像如果你有一個房子,如果你家里有孩子,就會有一些準則,對吧?所以對每一項創(chuàng)新,你都要設計對應的安全帶。想想安全帶拯救了多少生命,臨床監(jiān)管努力使我們的藥品更安全,盡管還不完美。AI是一項如此深遠的技術。我們不能不監(jiān)管它。但如何進行有效監(jiān)管非常關鍵。 你也在PCAST任職,從政府的角度來看,我們有兩種方向的力量:一種是讓社會創(chuàng)新,利用這項技術,提升每個人和社會的繁榮。另一種是確保它安全、可信、公平、透明。我認為這就是監(jiān)管和激勵之間的張力。我們必須深思熟慮地去做。 舉個例子,我個人確實相信垂直領域,尤其是醫(yī)療、金融、交通等這些我們已經(jīng)有監(jiān)管框架的垂直領域,是時候更新它了。因為確實有許多迫切的用例,現(xiàn)在確實是時候讓他們審視AI的影響了。例如,醫(yī)療器械。我們有很多醫(yī)療器械,它們受到很寬松的FDA檢查或許可。我們應該真正關注這些垂直領域,看看我們?nèi)绾卧诋a(chǎn)品和服務中保證AI的安全,讓其在這些領域發(fā)揮作用。 更深層次的監(jiān)管措施,比如它如何影響我們的民主,社交媒體。我不得不承認,這是公民社會、學術界、政府等許多部門正在進行的一場復雜的斗爭。我認為在過去二十年,或者至少十五年里,我們做得并不好。我同意你的看法,Bill,讓我們希望我們不要繼續(xù)犯錯,至少我們需要從中吸取教訓,對吧? Bill Dally:我同意關注垂直領域是正確的做法,每個垂直領域,無論是監(jiān)管汽車AI的NHTSA,還是監(jiān)管醫(yī)藥AI的FDA等等。我認為你也可以將其應用于社交媒體,它對應的監(jiān)管機構是FCC。FCC監(jiān)管通信,無論是廣播還是互聯(lián)網(wǎng)。有人建議,我們實際上需要一個新的機構來監(jiān)管AI,獨立于應用領域。這對我來說沒有任何意義。你怎么看? 李飛飛:我認為AI在某種程度上類似于電力或計算機。我認為我們不能為電力或計算機設立一個機構。所以我很難想象一個獨立的AI機構。AI是如此的橫向。 AI在醫(yī)學中的應用 可能是最深遠、最廣泛的 Bill Dally:從蛋白質(zhì)折疊到天氣模擬,AI正在迅速加速科學發(fā)展。過去一個博士生折疊一個蛋白質(zhì),而AlphaFold一夜之間就完成了大約20萬個。你認為AI在科學領域最大的應用是什么?你認為這將如何改變科學事業(yè)? 李飛飛:我認為這是最令人興奮的。我已經(jīng)提到,如果你看人類文明的歷史,最終還是這些科學發(fā)現(xiàn)和創(chuàng)新產(chǎn)生了深遠影響。而AI作為一種輔助科學發(fā)現(xiàn)的新工具,是我們這個世紀的機遇。 我很榮幸坐在斯坦福校園里,與來自神經(jīng)科學、材料科學、納米科學、航空航天、腫瘤學、化學等領域的朋友和同事交談。不管我把目光投向哪里,我都能看到他們對AI所產(chǎn)生的數(shù)據(jù)的興奮,對它們形成的新假設的興奮,以及AI如何成為加速他們發(fā)現(xiàn)過程的超級力量的討論。 所以我認為,回到公共部門,特別是大學的作用這個問題上,我認為加倍、三倍地投入科學發(fā)現(xiàn),正是大學應該做的,這就是機會所在。 Bill Dally:你個人非常投入將AI應用于醫(yī)學的許多努力。在這個領域,你認為目前最令人興奮的事情是什么?你認為這個領域十年后會是什么樣子? 李飛飛:說到寫這本書的續(xù)集,如果我要寫續(xù)集,我希望一半的內(nèi)容是關于醫(yī)療保健和醫(yī)學,因為我認為AI在醫(yī)學中的應用可能是最深遠、最廣泛的。我個人并沒有從事上游的藥物發(fā)現(xiàn)、生物化學、基因組學等工作,但在那里,AI和生物技術的結合正在迅速加速。 在過去十多年里,我恰好從事醫(yī)療保健最下游的工作,也就是醫(yī)療服務提供。這是護士、醫(yī)生、家庭護理工作者照顧病人、老人和慢性病患者的地方。這里安全是一個問題、也存在著勞動力短缺。即使有護理人員,這也是一個非常不平衡的市場,往往主要是女性和有色人種在這個領域工作,但他們甚至沒有被計入GDP。所以,醫(yī)療服務提供中存在很多不平衡、低效率和人類苦難。 所以,我看到的機會是,AI真的可以成為守護天使或輔助守護天使。例如,我與斯坦福醫(yī)院合作,在病房中安裝被動傳感器,非侵入性的、保護隱私的被動傳感器,幫助醫(yī)院監(jiān)測重要的臨床相關事件:比如病人即將跌倒的危險,病人病情突然惡化的征兆,臨床醫(yī)生不當?shù)氖植啃l(wèi)生習慣等。這些都是當前醫(yī)療保健中尚處于黑暗空間的臨床相關工作,而作為一種智能傳感器的AI真的可以幫助照亮那個黑暗空間。未來它甚至可以進入家庭。 如果我們相信技術將帶來繁榮,將轉變工作,那么我們需要相信人類生活需要繼續(xù)以更有尊嚴、更獨立、更自尊的方式生活。隨著社會老齡化,我們希望老年人擁有尊嚴、獨立和良好的生活環(huán)境。AI可以幫助確保這一點:即使你獨自生活,即使你患有慢性病,AI傳感器和AI技術也可以在不侵犯你的空間的情況下關注你,與你的護理人員或家人保持關于你健康狀況的溝通。 這就是我工作的醫(yī)療服務提供領域,我對此充滿熱情。 除了縮放定律,AI的另一個方向是建立感知的基礎模型 Bill Dally:這是一個非常令人興奮的未來。我們已經(jīng)看到模型從早期ImageNet時代的ContralNets,到用于語言的RNN,再到Transformer,它發(fā)展得非?。接下來會是什么?這些新的狀態(tài)空間模型是否有前景?或者你認為未來我們的主導網(wǎng)絡模型會是什么? 李飛飛:目前最新的是擴散模型,但我還沒有一個名字給你。如果我有,我現(xiàn)在就會去注冊。 但我認為,首先,我繼續(xù)相信數(shù)據(jù)的縮放定律。我認為我們還沒有看到這方面的終點。關于我們是否已經(jīng)看到了語言數(shù)據(jù)的極限有很多猜測,但我不知道答案,因為我不從事語言領域的工作。 但就世界數(shù)據(jù)、多模態(tài)數(shù)據(jù)而言,還有很多(數(shù)據(jù)可用)。人類和自然正在生產(chǎn)并利用這些數(shù)據(jù)。繼續(xù)看好使用支持這些數(shù)據(jù)的模型架構。 Bill Dally:如果你把這種chinchilla縮放定律應用于LLMs,應用于多模態(tài)數(shù)據(jù),那就意味著隨著我們獲得越來越多的世界數(shù)據(jù)進行訓練,我們需要越來越大的模型。你認為事情正朝著這個方向發(fā)展嗎? 李飛飛:我認為這是一個方向。我相信的另一個方向是世界的結構。我有點嫉妒我那些搞NLP的同事,因為從根本上說,語言是一個一維結構。而我從事視覺工作。它從根本上是三維的。如果加上時間,就是四維的。三維結構要豐富得多,但也復雜得多。 所以當我們用大數(shù)據(jù)進行擴展時,如果是完全盲目的擴展,那么我想英偉達會很高興,你們會賣出更多芯片。但我想看到的是結構化建模,或著說偏向于三維感知和結構的模型與大數(shù)據(jù)相結合。我認為,要真正創(chuàng)造出空間智能,創(chuàng)造出我們今天仍然缺乏的世界模型。 Bill Dally:你是在暗示類似于許多類型科學模擬中使用的物理信息神經(jīng)網(wǎng)絡。你會擴展到利用人類對世界的先驗知識,用它來使這些世界模型更有效? 李飛飛:是的,物理學就是對動力學和結構的信息輸入及推導。 Bill Dally:那么你認為基礎模型是會出現(xiàn)在世界層面上?也就是說我們可以問它任何關于世界的問題,而它會以多模態(tài)四維格式回答我們嗎? 李飛飛:我確實認為基礎模型會出現(xiàn)在世界層面。我認為你不需要只是問它問題。這是一種以語言為中心的交互方式。我認為實際上你應該可以與它互動?纯慈祟,或者生物體,作為一個計算機視覺人,我想提醒大家一件事,自然花了5.4億年的時間來創(chuàng)造感知大腦。而創(chuàng)造語言大腦只花了幾十萬年。所以感知是非常非常深刻的。 AI替代不了人性的部分,而這就是未來的工作 Bill Dally:這是一個很好的觀點。感知領先語言幾百萬年。或者說感知更難,所以需要更長時間。人們對AI的一個擔憂是它會擾亂就業(yè)市場。你可以說它會創(chuàng)造就業(yè)機會,也可能使其他工作變得不那么重要。你認為什么樣的人類工作是AI或機器人永遠無法取代的? 李飛飛:這是一個很棒的問題,Bill。你應該提前告訴我你要問這個。這些問題我?guī)滋烨岸冀o你發(fā)過了(笑)。 這是一個危險的問題。自人類文明伊始,我們的祖先想象過的每一種工作基本上都是由機器協(xié)作完成的,對吧?移動、飛行、計算等等。所以我覺得工作的定義是什么?如果工作是一項任務,比如抓起某樣東西或做一個煎蛋,我想它會被機器完成。但如果工作是人性的一部分,是定義我們創(chuàng)造力的一部分,定義我們的獨特性,定義我們的意圖、我們的同情心、我們與他人獨特的情感聯(lián)系,以及我們每個人對他人或對社會可能產(chǎn)生的獨特貢獻。我認為這些永遠不會被完全取代。我們會利用機器來幫助我們更好地完成這類工作。但我沒有看到一個根本性的取代。讓我們再次回到醫(yī)療保健領域,我花了幾十年時間在醫(yī)院里照顧我年邁的外籍父母。每次我?guī)е改缸哌M病房,我都會看著人類照顧人類,或者人類需要人類來照顧人類。在這種關系和互動中有一些非常深刻的東西,是任何機器人、AI、電腦、AR/VR,或者你認為的任何下一代技術都無法完全取代的。 老師和孩子、父母和孩子也是如此,我們真正珍視的服務,我們所做的旅行。在人性方面,在人與人的互動方面,有太多超越了計算、計算、機械的東西,我認為這些將是那種會保留下來并不斷演變的工作。這樣我們將越來越多地被機器賦予超能力,但作為人類的核心不會被取代。 Bill Dally:很明顯,觀眾被你深深打動了。你以一種人性關懷的方式與他們建立了聯(lián)系。但你是在暗示同理心、情感聯(lián)系和關懷……還有創(chuàng)造力。創(chuàng)造力是人類的核心特質(zhì),但如果我們選擇訓練AI模型具有這些特征,我們能做到嗎?我們可以建立有同情心的AI模型,讓它能夠在情感上與人聯(lián)系嗎? 李飛飛:在某種程度上可以。我再次強調(diào)一下,我從事計算機視覺工作。現(xiàn)在已經(jīng)有了深度創(chuàng)造性的文本到圖像以及文本到視頻的生成(模型)。但我也認為,就像這里沒有人能預測下一個愛因斯坦會是誰一樣,這種創(chuàng)造力,創(chuàng)造力的不確定性,將永遠存在于我們?nèi)祟惿鐣。所以無論你如何訓練機器,你都無法訓練出那種人類智能或人類創(chuàng)造力。這不僅僅是愛因斯坦,還有貝多芬、莎士比亞、梵高。還有太多太多了。而且不一定非要是那么聰明的人。我自己的孩子,我不認為任何機器都能創(chuàng)造出那樣一個甜美、聰明、幽默的小家伙。 Bill Dally:這是獨一無二的人性,機器無法取代。說到創(chuàng)造力,生成式AI正在做一些了不起的事情。OpenAI最近推出了Sora,你可以輸入一個提示,就能得到一個看起來很棒的視頻。我們最終,也許當你在十年后寫續(xù)集時,是否會發(fā)展到如果你想看一部電影,只需寫幾行提示,它就會為你生成一部兩小時的電影? 李飛飛:我不認為這需要十年,Bill。所以多生產(chǎn)一些B200,它很快就會出現(xiàn)。就技術而言,我認為這即將到來:創(chuàng)建更長時間的生成性世界、生成性故事情節(jié)、生成性角色互動的能力指日可待。 Bill Dally:在這樣一個世界里,我們有AI程序生成大部分內(nèi)容,那些在好萊塢或游戲工作室等地方的人類內(nèi)容創(chuàng)作者的角色是什么? 李飛飛:這又回到了人類的獨特性。我不知道你們中有多少人是宮崎駿、吉卜力工作室的粉絲。是的,它是最棒的,我就是喜歡一遍又一遍地看他們的電影。從計算機圖形學的角度來看,它相當初級。他們不做皮克斯和夢工廠那樣的(復雜)圖形。然而,那些獨特的故事,比如《龍貓》那個故事多簡單,那部電影中人性的表達那么單純,除了宮崎駿,沒有人,沒有人能創(chuàng)造出那樣的東西。我認為這仍然是人性。AI會創(chuàng)作電影,會創(chuàng)作娛樂人們的內(nèi)容,但只有人能利用AI創(chuàng)作那些能觸動他人、啟發(fā)他人或服務他人的內(nèi)容,而AI做不到。我確實看到了這種共生的可能性。 不管那些技術詞匯多陌生,我也希望你在AI時代中有一個角色Bill Dally:你是在暗示AI基本上會接管這些創(chuàng)意事物的制作部分,制作真正引人注目的視頻,讓圖像看起來很棒。但最終在情感層面上與人聯(lián)系,去講述一個能讓人流淚的故事,這將是人類應該努力的部分。 李飛飛:沒錯。我一直強調(diào)的一點,Bill,就是在這個機器時代,不要忘記我們的人性,不要忘記我們的尊嚴,不要忘記彼此的尊嚴和人性。這就是我們的核心,這就是我們的獨特之處。這也是我們構建機器應用、使用機器的開端。 (掌聲) Bill Dally:我們還剩1分32秒。你還有什么想傳達給觀眾的嗎?也許能再次讓他們給予掌聲? 李飛飛:(讓觀眾鼓掌)這是一個很高的標準。 我想說的一點是,GTC是一個特別的會議。你們來到這里,是因為你們都以某種方式參與了AI。當我寫出這本書并與全球各地的觀眾,特別是年輕觀眾交談時,我經(jīng)常被問到的一個問題。而每次有人問這個問題,我仍然會被觸動——那就我(在這個AI時代)的角色是什么?我不是計算機科學家,也不是斯坦福大學的理科專業(yè);我不做軟件工程,我不是在有電腦的家庭長大的。我熱愛跳舞,我也會為我的一個類似農(nóng)村的社區(qū)服務。 但所有這些來自各行各業(yè)的人都在問我,他們會在AI時代扮演什么角色。因為AI看起來如此復雜,它有7000億個參數(shù),你怎么用自己的大腦來理解這么龐大的東西呢?然后是所有這些花哨的詞,transformer、生成式、擴散式,它們似乎離你每個人都很遙遠。 但我真的想把它歸結為:這是一個工具。它是一個需要一些數(shù)學和計算來實現(xiàn)的工具。但歸根結底,人類不僅是工具的創(chuàng)造者,我們也是如何使用工具的決策者;我們是工具應用的創(chuàng)造者,我們也是工具的用戶;我們是決定如何管理工具以及管理想要使用工具的人的選民。所以在參與AI方面有很多公民的可能性。 我特別希望年輕人,那些熱愛藝術、熱愛社區(qū)、熱愛法律、熱愛醫(yī)學、熱愛化學的人,無論你的興趣是什么,都能以負責任的態(tài)度擁抱這項技術,你們實際上可以為讓它變得更好、更好地使用它而有所作為。 這真的是我對每個人的懇求:你們在AI發(fā)展中有一個角色,請加入我們,讓它變得更好。謝謝。 Bill Dally:謝謝你,飛飛。我想你激勵了每個人,也給了我們很多思考的內(nèi)容。非常感謝你抽出時間。 李飛飛:謝謝你邀請我,Bill。祝大家在GTC玩得開心。感謝大家的參與。 Bill Dally:謝謝。 文章來源:騰訊科技
|
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選