太平洋科技要聞

新一代賽博仆人！這款機(jī)器人要幫你把各種家務(wù)活都做了

appso 整合編輯：太平洋科技發(fā)布于：2024-11-17 20:22

不知道你是否曾有過這樣的想法：當(dāng)一個(gè)「甩手掌柜」，把一切家務(wù)都交給家務(wù)機(jī)器人。說(shuō)實(shí)話，這是在科幻作品中經(jīng)常能夠看到的場(chǎng)景。

畢竟，誰(shuí)不想擁有一位任勞任怨的「賽博仆人」呢？

來(lái)自舊金山的初創(chuàng)公司 Physical Intelligence（物理智能，簡(jiǎn)稱 Pi）正在致力于幫助人們實(shí)現(xiàn)這個(gè)夢(mèng)想。這家公司近日展示了一種「接受了前所未有的數(shù)據(jù)量訓(xùn)練」的人工智能模型，它已經(jīng)學(xué)會(huì)了干各種有用的家務(wù)活。

Physical Intelligence 發(fā)布的視頻顯示，他們的機(jī)器人可以十分靈巧地完成各種家務(wù)活，包括但不限于：整理擺滿了杯子和盤子的桌面：

把咖啡豆從袋子舀到機(jī)器當(dāng)中：

甚至可以組裝紙箱：

最令人深刻的是，它們可以取出烘干機(jī)內(nèi)的衣物并折疊整齊。兩只機(jī)械臂如同人類的雙手一般，配合熟練：

有趣的是，該公司開發(fā)的這種算法有時(shí)會(huì)表現(xiàn)出一些的類似人類的怪癖，例如搖晃 T 恤和短褲，讓它們平整地鋪開。

Physical Intelligence 的首席執(zhí)行官豪斯曼（Hausman）指出，折疊衣服對(duì)于機(jī)器人來(lái)說(shuō)尤其具有挑戰(zhàn)性，需要更多關(guān)于物理世界的一般智能，因?yàn)樗婕疤幚砀鞣N會(huì)不可預(yù)測(cè)地變形和皺折的柔性物品。

他還表示，目前的算法并不很穩(wěn)定。就像 AI 聊天機(jī)器人有時(shí)也會(huì)「崩潰」一樣，這些「家務(wù)機(jī)器人」有時(shí)也會(huì)做出一些令人不可思議的舉動(dòng)：比如它會(huì)將雞蛋塞滿已經(jīng)裝不下的紙箱，把紙箱強(qiáng)行合上；有一次在裝東西時(shí)，機(jī)器人突然把盒子從桌上扔了下去。

盡管算法還不完美，但 Physical Intelligence 至少為未來(lái)的「通用家務(wù)機(jī)器人」提供了一種可能性。

然而，豪斯曼的野心遠(yuǎn)不止于此�！讣覄�(wù)」只是其中一種用途，「通用」才是公司的雄心壯志：

我們的目標(biāo)是通過一個(gè)通用模型將人工智能帶入物理世界，基本上對(duì)于任何應(yīng)用程序來(lái)講，該模型可以為任何機(jī)器人或任何物理設(shè)備提供動(dòng)力。

換句話說(shuō)，Physical Intelligence 的目標(biāo)是創(chuàng)建一個(gè)類似于大型語(yǔ)言模型（LLMs）的物理世界模型，這是一種「通用人工智能模型」。

他們將構(gòu)建語(yǔ)言模型的技術(shù)與控制和指導(dǎo)機(jī)器的自有方法相結(jié)合，并通過訓(xùn)練大量的機(jī)器人數(shù)據(jù)來(lái)實(shí)現(xiàn)。豪斯曼表示，他們的方法「非常通用」，可以利用來(lái)自不同機(jī)器人類型的數(shù)據(jù)進(jìn)行訓(xùn)練，類似于人們訓(xùn)練語(yǔ)言模型的方式。

公司在過去八個(gè)月中開發(fā)了其「基礎(chǔ)模型」，名為 π0（pi-zero）。π0 通過使用來(lái)自多種機(jī)器人執(zhí)行各種家務(wù)的數(shù)據(jù)進(jìn)行訓(xùn)練，公司還經(jīng)常讓人類遠(yuǎn)程操作機(jī)器人以提供必要的教學(xué)。

Physical Intelligence 的聯(lián)合創(chuàng)始人之一、加州大學(xué)伯克利分校的副教授謝爾蓋·萊文（Sergey Levine）表示，他們訓(xùn)練的數(shù)據(jù)量比以往任何機(jī)器人模型都要大得多，并且「幅度非常大」。

與其他公司譬如 Figure AI 和特斯拉專注于構(gòu)建仿人機(jī)器人，以及像 Covariant 這樣的公司開發(fā)通用機(jī)器人軟件不同，Pi 旨在創(chuàng)建可以應(yīng)用于廣泛機(jī)器人硬件的軟件。

對(duì)此，知名科技投資者，也是 Pi 的聯(lián)合創(chuàng)始人之一的拉奇·格魯姆（Lachy Groom）表示「使人類變得有趣的是我們的大腦，而不是我們的硬件，我們是終極的通用主義者」。

特斯拉開發(fā)的名為「Optimus」的人形機(jī)器人

Physical Intelligence 面臨的一個(gè)關(guān)鍵挑戰(zhàn)是，與大型語(yǔ)言模型訓(xùn)練中可用的文本數(shù)據(jù)相比，用于訓(xùn)練的機(jī)器人數(shù)據(jù)規(guī)模有限。

因此，公司必須生成自己的數(shù)據(jù)，并想出提高從更有限數(shù)據(jù)集中學(xué)習(xí)的技巧。

實(shí)際上，為了開發(fā) π0，公司結(jié)合了所謂的視覺語(yǔ)言模型（在圖像和文本上訓(xùn)練）和擴(kuò)散建模（從 AI 圖像生成中借鑒的技術(shù)），以實(shí)現(xiàn)更通用的學(xué)習(xí)。

一切的一切，都在為「通用」而努力。

對(duì)于 Physical Intelligence 的現(xiàn)狀和未來(lái)，萊文的觀點(diǎn)是：

為了讓機(jī)器人能夠承擔(dān)人類要求它們做的任何雜務(wù)，這種學(xué)習(xí)需要大幅擴(kuò)大。盡管還有很長(zhǎng)的路要走，但我們有一些你可以認(rèn)為是基礎(chǔ)框架的東西，未來(lái)的事情從中可見一斑。

但同時(shí)，萊文對(duì) Pi 的發(fā)展充滿信心。他表示有足夠的跡象表明，在現(xiàn)實(shí)世界中使用機(jī)器人的最大障礙「現(xiàn)在已經(jīng)可以解決」。

本文來(lái)源：Appso