幾天前,馬斯克在財報會上曾表示,爭取年底讓擎天柱進(jìn)工廠測試。 竟是因為,具備人格的擎天柱表示:自己想做一個有用的「人」。 繼疊T恤、辦公室走路之后,它現(xiàn)在還學(xué)會了分揀電池! 快看,這不慌不忙的樣子,擎天柱將電池精準(zhǔn)地放在收納盒子里。 不僅如此,擎天柱最近還在忙著努力學(xué)習(xí)執(zhí)行各種任務(wù)。 而這些動作的實現(xiàn),正是基于其端到端的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,能夠在特斯拉FSD計算機(jī)實時運(yùn)行。 僅通過2D攝像頭,以及手部觸覺,和力傳感器,就可以做到對物體的分類。 下面是擎天柱執(zhí)行任務(wù)時的第一視角。 有時,擎天柱不小心將電池沒有將電池插入槽中,還會自主糾正,再正確將其放回準(zhǔn)確的位置。 擎天柱神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,其數(shù)據(jù)是通過人類遠(yuǎn)程操作完成收集,并針對各種任務(wù)進(jìn)行擴(kuò)展。 值得一提的是,多個擎天柱現(xiàn)在已經(jīng)進(jìn)入了特斯拉工廠「實習(xí)」,在分揀電池時,都幾乎不用人類干預(yù)。 還記得今年2月,擎天柱在辦公室閑逛的視頻,有模有樣地在辦公室巡邏。 近兩次的配文,可以說是「人味」拉滿了 而它走路的姿態(tài)幾乎與人類別無二致,引網(wǎng)友驚呼。最近,擎天柱能走的更遠(yuǎn)了。 網(wǎng)友紛紛表示,第二代擎天柱才面世5個月,成長速度飛快到令人難以置信。 甚至,有人已經(jīng)開始期待第三代擎天柱了。 馬斯克還預(yù)告,「即將在今年晚些時候推出的新款Optimus,會搭載具備22個自由度(目前是11個)的靈巧手」。 話說,分揀電池這種精細(xì)的工作,擎天柱具體是怎么勝任的? 端到端神經(jīng)網(wǎng)絡(luò),讓擎天柱自我糾正 視頻一出,擎天柱的工程主管Milan Kovac便分享了特斯拉機(jī)器人的訓(xùn)練方法。 正如之前所說,特斯拉團(tuán)隊已經(jīng)訓(xùn)練、部署了一個神經(jīng)網(wǎng)絡(luò),讓擎天柱去執(zhí)行實用任務(wù)。 而從傳送帶上拿起電池,精確地放入托盤中只是其中的一種,未來還將擴(kuò)展到多種任務(wù)上。 這個端到端的神經(jīng)網(wǎng)絡(luò),只處理自機(jī)器人2D攝像頭的視頻,以及機(jī)器人本體感知的傳感器數(shù)據(jù),并直接生成控制關(guān)節(jié)的序列。 整個系統(tǒng)完全運(yùn)行在機(jī)器人內(nèi)置的FSD計算機(jī)上,并由由機(jī)載電池供電。 這樣的設(shè)計,使得單一神經(jīng)網(wǎng)絡(luò)能夠隨著訓(xùn)練過程中,越來越豐富的數(shù)據(jù)加入,進(jìn)而執(zhí)行更多種類的任務(wù)。 Milan Kovac提到,雖然目前系統(tǒng)還不夠完美且反應(yīng)稍慢,但成功率逐漸提高,錯誤率也在減少。 最重要的是,團(tuán)隊還在訓(xùn)練擎天柱如何從從失誤中學(xué)習(xí)經(jīng)驗,并已經(jīng)觀察到自行糾正行為。 除此以外,特斯拉團(tuán)隊還在進(jìn)一步努力,提高擎天柱的移動速度,使其能夠適應(yīng)更多復(fù)雜的地形環(huán)境,讓它走路姿態(tài)更像人。 此外,他們還在專注于提高整個機(jī)器人集群的操作一致性,訓(xùn)練神經(jīng)網(wǎng)絡(luò)來應(yīng)對動態(tài)校準(zhǔn)和機(jī)器人之間微小的差異。 最后,Milan還順便附上了特斯拉的招聘官網(wǎng),并預(yù)告更多的更新即將到來。 與此同時,英偉達(dá)高級研究科學(xué)家Jim Fan也對擎天柱的最大優(yōu)勢之一——人類數(shù)據(jù)收集和處理系統(tǒng),進(jìn)行了一波分析。 1. 擎天柱的手是世界上最頂尖的五指靈活機(jī)器人手之一。 它配備了觸覺感應(yīng),具有11個自由度(DOF),相較于其他只有6-7個自由度的選手,它的堅固性能夠承受頻繁的物體交互,而無需不斷維護(hù)。 2. 遠(yuǎn)程操作軟件:視頻中可見,操作員戴著VR眼鏡和手套。 設(shè)置能夠?qū)崟r傳輸?shù)谝蝗朔Q視角視頻和精確控制信號的軟件,并保持極低延遲,這是一項極具挑戰(zhàn)的技術(shù)。人類對自己的動作和機(jī)器人的響應(yīng)之間即使是微小的延遲也極為敏感。擎天柱配備了一套流暢的全身控制系統(tǒng),能夠?qū)崟r精確地復(fù)現(xiàn)人類的動作。 3. 龐大的機(jī)器人集群:并行數(shù)據(jù)收集需要多臺機(jī)器人,以及訓(xùn)練有素且能夠每天多班次工作的人類承包商(理想情況下為24/7),還需有隨時待命的維護(hù)團(tuán)隊確保機(jī)器人持續(xù)運(yùn)作。這種操作的復(fù)雜性是學(xué)術(shù)研究所未曾設(shè)想的。 4. 任務(wù)與環(huán)境:確定要遠(yuǎn)程操作什么同樣至關(guān)重要。 當(dāng)前,大多數(shù)此類嘗試都是以演示為驅(qū)動:收集適合社交媒體視頻展示的任務(wù)數(shù)據(jù)。然而,要實現(xiàn)通用機(jī)器人的目標(biāo),我們必須仔細(xì)考慮任務(wù)和環(huán)境的多樣性。從視頻的43-51秒,我們可以看到機(jī)器人在工廠和家庭環(huán)境中進(jìn)行的操作,如移動電池、洗衣服、整理日常物品等。 網(wǎng)友:讓它給我彈琴,給我炒飯 擎天柱的外形進(jìn)化圖來看,它是越來越像人了。 這也為它進(jìn)廠打工、成為家政機(jī)器人,鋪墊了一步。 在擎天柱的官博下,網(wǎng)友們也紛紛展開暢想。 人口斷崖式下跌?不用急,幾百萬個大規(guī)模機(jī)器人來解決這個問題。這個數(shù)量,是特斯拉造車數(shù)的1000倍。 這位表示:今天,擎天柱能分類電池。 明天,它就能計算出星際飛船的加速度,把速度提高到每小時72,150英里,到達(dá)火星。它還能擔(dān)任飛船船長,和人類建一個火星殖民地。 當(dāng)然,它也能為你彈琴唱歌。 為你下廚。 為你洗衣、打掃、整理。 成為你的私人管家,畢竟誰能拒絕成為下一位鋼鐵俠呢。 當(dāng)然,在不久的未來,Optimus或許還能為我們量身定制不同的版本。 它可以是我們的私人模特、私人發(fā)型設(shè)計師、私人妝造師,各種私人定制都可基于技術(shù)更新?lián)Q代,通過數(shù)據(jù)庫遴選完成,和我們無比適配。 昨天偶遇擎天柱的網(wǎng)友,已經(jīng)開心地曬出合影了。 畢竟,它看起來已經(jīng)是個靈巧的電腦了。 而特斯拉,已經(jīng)絕不僅僅是一家汽車公司。 參考資料: https://twitter.com/_milankovac_/status/1787028644399132777 https://twitter.com/Tesla_Optimus/status/1787027808436330505 https://x.com/elonmusk/status/1787157110804910168 https://twitter.com/DrJimFan/status/1787154880110694614 文章來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選