不知道你是否曾有過這樣的想法:當(dāng)一個(gè)「甩手掌柜」,把一切家務(wù)都交給家務(wù)機(jī)器人。說(shuō)實(shí)話,這是在科幻作品中經(jīng)常能夠看到的場(chǎng)景。 畢竟,誰(shuí)不想擁有一位任勞任怨的「賽博仆人」呢? 來(lái)自舊金山的初創(chuàng)公司 Physical Intelligence(物理智能,簡(jiǎn)稱 Pi)正在致力于幫助人們實(shí)現(xiàn)這個(gè)夢(mèng)想。這家公司近日展示了一種「接受了前所未有的數(shù)據(jù)量訓(xùn)練」的人工智能模型,它已經(jīng)學(xué)會(huì)了干各種有用的家務(wù)活。 Physical Intelligence 發(fā)布的視頻顯示,他們的機(jī)器人可以十分靈巧地完成各種家務(wù)活,包括但不限于:整理擺滿了杯子和盤子的桌面: 把咖啡豆從袋子舀到機(jī)器當(dāng)中: 甚至可以組裝紙箱: 最令人深刻的是,它們可以取出烘干機(jī)內(nèi)的衣物并折疊整齊。兩只機(jī)械臂如同人類的雙手一般,配合熟練: 有趣的是,該公司開發(fā)的這種算法有時(shí)會(huì)表現(xiàn)出一些的類似人類的怪癖,例如搖晃 T 恤和短褲,讓它們平整地鋪開。 Physical Intelligence 的首席執(zhí)行官豪斯曼(Hausman)指出,折疊衣服對(duì)于機(jī)器人來(lái)說(shuō)尤其具有挑戰(zhàn)性,需要更多關(guān)于物理世界的一般智能,因?yàn)樗婕疤幚砀鞣N會(huì)不可預(yù)測(cè)地變形和皺折的柔性物品。 他還表示,目前的算法并不很穩(wěn)定。就像 AI 聊天機(jī)器人有時(shí)也會(huì)「崩潰」一樣,這些「家務(wù)機(jī)器人」有時(shí)也會(huì)做出一些令人不可思議的舉動(dòng):比如它會(huì)將雞蛋塞滿已經(jīng)裝不下的紙箱,把紙箱強(qiáng)行合上;有一次在裝東西時(shí),機(jī)器人突然把盒子從桌上扔了下去。 盡管算法還不完美,但 Physical Intelligence 至少為未來(lái)的「通用家務(wù)機(jī)器人」提供了一種可能性。 然而,豪斯曼的野心遠(yuǎn)不止于此!讣覄(wù)」只是其中一種用途,「通用」才是公司的雄心壯志: 我們的目標(biāo)是通過一個(gè)通用模型將人工智能帶入物理世界,基本上對(duì)于任何應(yīng)用程序來(lái)講,該模型可以為任何機(jī)器人或任何物理設(shè)備提供動(dòng)力。 換句話說(shuō),Physical Intelligence 的目標(biāo)是創(chuàng)建一個(gè)類似于大型語(yǔ)言模型(LLMs)的物理世界模型,這是一種「通用人工智能模型」。 他們將構(gòu)建語(yǔ)言模型的技術(shù)與控制和指導(dǎo)機(jī)器的自有方法相結(jié)合,并通過訓(xùn)練大量的機(jī)器人數(shù)據(jù)來(lái)實(shí)現(xiàn)。豪斯曼表示,他們的方法「非常通用」,可以利用來(lái)自不同機(jī)器人類型的數(shù)據(jù)進(jìn)行訓(xùn)練,類似于人們訓(xùn)練語(yǔ)言模型的方式。 公司在過去八個(gè)月中開發(fā)了其「基礎(chǔ)模型」,名為 π0(pi-zero)。π0 通過使用來(lái)自多種機(jī)器人執(zhí)行各種家務(wù)的數(shù)據(jù)進(jìn)行訓(xùn)練,公司還經(jīng)常讓人類遠(yuǎn)程操作機(jī)器人以提供必要的教學(xué)。 Physical Intelligence 的聯(lián)合創(chuàng)始人之一、加州大學(xué)伯克利分校的副教授謝爾蓋·萊文(Sergey Levine)表示,他們訓(xùn)練的數(shù)據(jù)量比以往任何機(jī)器人模型都要大得多,并且「幅度非常大」。 與其他公司譬如 Figure AI 和特斯拉專注于構(gòu)建仿人機(jī)器人,以及像 Covariant 這樣的公司開發(fā)通用機(jī)器人軟件不同,Pi 旨在創(chuàng)建可以應(yīng)用于廣泛機(jī)器人硬件的軟件。 對(duì)此,知名科技投資者,也是 Pi 的聯(lián)合創(chuàng)始人之一的拉奇·格魯姆(Lachy Groom)表示「使人類變得有趣的是我們的大腦,而不是我們的硬件,我們是終極的通用主義者」。 特斯拉開發(fā)的名為「Optimus」的人形機(jī)器人 Physical Intelligence 面臨的一個(gè)關(guān)鍵挑戰(zhàn)是,與大型語(yǔ)言模型訓(xùn)練中可用的文本數(shù)據(jù)相比,用于訓(xùn)練的機(jī)器人數(shù)據(jù)規(guī)模有限。 因此,公司必須生成自己的數(shù)據(jù),并想出提高從更有限數(shù)據(jù)集中學(xué)習(xí)的技巧。 實(shí)際上,為了開發(fā) π0,公司結(jié)合了所謂的視覺語(yǔ)言模型(在圖像和文本上訓(xùn)練)和擴(kuò)散建模(從 AI 圖像生成中借鑒的技術(shù)),以實(shí)現(xiàn)更通用的學(xué)習(xí)。 一切的一切,都在為「通用」而努力。 對(duì)于 Physical Intelligence 的現(xiàn)狀和未來(lái),萊文的觀點(diǎn)是: 為了讓機(jī)器人能夠承擔(dān)人類要求它們做的任何雜務(wù),這種學(xué)習(xí)需要大幅擴(kuò)大。盡管還有很長(zhǎng)的路要走,但我們有一些你可以認(rèn)為是基礎(chǔ)框架的東西,未來(lái)的事情從中可見一斑。 但同時(shí),萊文對(duì) Pi 的發(fā)展充滿信心。他表示有足夠的跡象表明,在現(xiàn)實(shí)世界中使用機(jī)器人的最大障礙「現(xiàn)在已經(jīng)可以解決」。 本文來(lái)源:Appso |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選