首頁(yè) > 科技要聞 > 科技> 正文

GPT-4o 打《黑神話·悟空》!AI「馬嘍」拿捏 Boss ,勝率超人類

appso 整合編輯:太平洋科技 發(fā)布于:2024-10-01 00:15

《黑神話·悟空》這個(gè)游戲就一個(gè)怪嗎?

我承認(rèn),當(dāng)朋友對(duì)我發(fā)出這樣的質(zhì)疑時(shí),那一刻,我破防了。

從意識(shí)到必拿下楊戩,到必?fù)嗡阑⑾蠕h,我只花了不到半天的時(shí)間,而如果想通關(guān)《黑神話》,我們能夠指望 AI 嗎?

翻滾閃避,拉開(kāi)距離,精怪的行動(dòng)盡收眼底。

時(shí)機(jī)一到,天命人猛地?fù)]出重棍。

借助 AI 的力量,一套絲滑連招下來(lái),Boss 被拿捏得毫無(wú)還手之力,不知饞哭多少游戲手殘黨。

阿里研究團(tuán)隊(duì)最近提出了一個(gè) VARP 智能體框架。而這個(gè) AI「馬嘍」正是出自他們之手。

可以說(shuō),不是外掛,卻勝似外掛。

直面大圣的 GPT 們,還真不比人類差

AI 直面大圣,其實(shí)也沒(méi)那么復(fù)雜。

傳統(tǒng)上,游戲 AI 依賴游戲 API 來(lái)獲取環(huán)境信息和可執(zhí)行的動(dòng)作數(shù)據(jù)。但問(wèn)題是,不是每個(gè)游戲都愿意提供開(kāi)放的 API,或者即使提供,有的 API 也缺胳膊少腿,很難滿足實(shí)際需求。

而且,傳統(tǒng)方法也總感覺(jué)少點(diǎn)什么,無(wú)法完全模擬人類玩家的真實(shí)游戲體驗(yàn)。

基于此,阿里研究團(tuán)隊(duì)提出了一個(gè)新的 VARP(Vision Action Role-Playing)智能體框架。

VARP 智能體框架在接收輸入的游戲屏幕截圖后,通過(guò)運(yùn)用一組 VLMs 進(jìn)行推理,最終生成 Python 形式的代碼來(lái)操控游戲角色,包括一系列原子命令的組合,如輕攻擊、躲避、重攻擊和回血等。

VARP 包含三個(gè)知識(shí)庫(kù):情境庫(kù)、動(dòng)作庫(kù)和人類引導(dǎo)庫(kù),以及兩個(gè)系統(tǒng):動(dòng)作規(guī)劃系統(tǒng)和人類引導(dǎo)軌跡系統(tǒng)。

簡(jiǎn)單來(lái)說(shuō),動(dòng)作規(guī)劃系統(tǒng)相當(dāng)于圖書(shū)館管理員,負(fù)責(zé)從情境庫(kù)和可更新的動(dòng)作庫(kù)中找出最合適的資料。

系統(tǒng)根據(jù)輸入的游戲屏幕截圖,挑選或生成符合當(dāng)前情境的動(dòng)作,然后這些動(dòng)作和情境會(huì)被存入或更新到這兩個(gè)庫(kù)中。

而人類引導(dǎo)軌跡系統(tǒng)則利用人類操作數(shù)據(jù)集來(lái)提升VARP 在復(fù)雜任務(wù)中的表現(xiàn),比如尋路任務(wù)和高難度戰(zhàn)斗任務(wù)等。

在動(dòng)作庫(kù)中,「def new_func_a()」表示由動(dòng)作規(guī)劃系統(tǒng)生成的新動(dòng)作,而「def new_func_h()」表示由人類引導(dǎo)軌跡系統(tǒng)生成的新動(dòng)作!竏ef pre_func()」表示預(yù)定義的動(dòng)作。

在上文提到的《黑神話·悟空》游戲中,研究團(tuán)隊(duì)設(shè)定了 12 個(gè)任務(wù),其中 75% 涉及戰(zhàn)斗,并使用包括 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 pro 等 VLMs 進(jìn)行了基準(zhǔn)測(cè)試。

結(jié)果顯示,VARP 在基本任務(wù)和簡(jiǎn)單到中等難度的戰(zhàn)斗中,勝率高達(dá) 90 %。但在面對(duì)高難度任務(wù)時(shí),VARP 的表現(xiàn)容易掉鏈子,整體水平仍然不如人類玩家。

此外,VARP 智能體在處理游戲中的決策時(shí),因?yàn)橐蕾囉谝曈X(jué)語(yǔ)言模型(VLM)的推理速度,所以不能夠?qū)崟r(shí)地分析每一個(gè)游戲幀(即游戲畫(huà)面)。

換句話說(shuō),它不能像人類玩家那樣,幾乎瞬間對(duì)屏幕上發(fā)生的一切作出反應(yīng)。相反,它只能每隔幾秒鐘處理一次游戲畫(huà)面,選擇一些重要的幀(關(guān)鍵幀)來(lái)進(jìn)行分析和決策。

《黑神話·悟空》上線時(shí)曾被吐槽缺乏地圖,且存在大量的「空氣墻」,所以在沒(méi)有人類的輔助下,AI 也會(huì)像無(wú)頭蒼蠅一樣找不到 Boss。

生成式 AI 點(diǎn)燃了世界變革的火種,而在它尚未涌入大眾視野之時(shí),普通人對(duì) AI 更直觀的羈絆或許大多源于游戲。

在電子游戲史上,AI 遠(yuǎn)比我們想象的重要

可能很多人都沒(méi)想到,最早一批搭上 AI 快車的游戲會(huì)是經(jīng)典街機(jī)游戲《吃豆人》。

玩家勝利的前提是吃掉迷宮內(nèi)的所有豆子,而看似傻乎乎的彩色鬼魂則擁有不同的追擊算法,它們會(huì)以不同的路徑和方式對(duì)玩家展開(kāi)圍追堵截。

每個(gè)鬼魂的算法招數(shù)異常簡(jiǎn)單,也缺乏任何學(xué)習(xí)能力,一旦玩家摸透了這些規(guī)律,游戲的挑戰(zhàn)難度便會(huì)直線下降。

1987 年推出的《合金裝備》則標(biāo)志著游戲 AI 的另一個(gè)重要里程碑。

游戲中的 AI 角色開(kāi)始展現(xiàn)出更為復(fù)雜的行為模式,并首次引入了對(duì)玩家的敵對(duì)反應(yīng)機(jī)制。如果玩家被敵人發(fā)現(xiàn),敵人會(huì)觸發(fā)警報(bào)系統(tǒng),呼叫增援,改變巡邏路線,甚至設(shè)置陷阱。

再后來(lái),如果粗淺地將 AI 與游戲的發(fā)展歷程用一連串標(biāo)志性事件羅列出來(lái),大致如下:

1997,IBM 的「深藍(lán)」在國(guó)際象棋比賽中擊敗人類世界冠軍,標(biāo)志著 AI 在棋類游戲中的重大突破。

2004 年,《半條命 2》發(fā)布,游戲中的 AI 角色能夠進(jìn)行更復(fù)雜的決策和互動(dòng),提升了游戲的沉浸感。

2011 年,IBM 的「沃森」在智力問(wèn)答節(jié)目《危險(xiǎn)邊緣》中擊敗了人類冠軍,展示了 AI 在自然語(yǔ)言處理和知識(shí)推理方面的進(jìn)步。

2016 年,AlphaGo 在圍棋比賽中擊敗了李世石,標(biāo)志著 AI 在復(fù)雜策略游戲中的重大突破。

2018 年,《荒野大鏢客 2》發(fā)布,游戲 AI 角色和環(huán)境互動(dòng)水平大幅提高,提供了高度逼真的游戲體驗(yàn)。

2020 年,英偉達(dá)推出了 DLSS 技術(shù),利用 AI 加速圖形渲染,提升了游戲的性能和畫(huà)質(zhì)。

置于當(dāng)下的游戲環(huán)境中審視,游戲依然主打一個(gè)陪伴,而 AI 則如同一臺(tái)放大器,將這份陪伴放大了無(wú)數(shù)倍。

在今年的 CES 展會(huì)上,英偉達(dá)使用 Avatar Cloud Engine(ACE)讓游戲 NPC「活」起來(lái),也借此火爆出圈。

在名為 Kairos 的演示中,玩家能夠與拉面店老板 Jin 進(jìn)行互動(dòng)。雖然 Jin 只是一個(gè) NPC,但在生成式 AI 的幫助下,像真人一樣回答問(wèn)題。

AI 與游戲的結(jié)合也總是讓人感到既愛(ài)又恨。

就拿競(jìng)技類游戲來(lái)說(shuō)吧,過(guò)往的做法只是生硬地調(diào)整難度,而現(xiàn)在則是模仿人的操作,讓游戲體驗(yàn)更加真實(shí)。

支持者認(rèn)為,當(dāng)模擬人類的 AI 成為對(duì)手或隊(duì)友的時(shí)候,反過(guò)來(lái)也能提升因缺乏真人玩家所帶來(lái)的游戲競(jìng)技感。

而弊端也正在于此,玩家的的留存率是提高了,但在系統(tǒng)的操控下,玩家們也逃脫不了被 AI 玩弄的漩渦。

前期豪言壯語(yǔ),中期胡言亂語(yǔ),后期沉默不語(yǔ)。

當(dāng)我們熬夜通宵只為再贏一把的時(shí)候,已經(jīng)很難說(shuō)清楚究竟是我們?cè)谕孢@個(gè)游戲,還是這個(gè)游戲在玩我們。

尤其當(dāng)你意識(shí)到隊(duì)友可能是 AI 時(shí),那種無(wú)力感就像是拳頭打在了棉花上。心里也軟綿綿的,毫無(wú)著力點(diǎn)。

老黃預(yù)言家!未來(lái)游戲或?qū)⒂?AI 生成?

即便是代碼小白,我們也能用 AI 手搓游戲。

這放在幾年前,估計(jì)只能在夢(mèng)里想想了,但生成式 AI 到來(lái)讓這一切有了落地的空間。

往小了說(shuō),創(chuàng)建一個(gè) GPTs 玩起故事劇本殺,大了點(diǎn)說(shuō),那就是 AI 輔助生成小程序游戲,雖然互動(dòng)性差點(diǎn)意思,但勝在畫(huà)面精美。

再往大了說(shuō),甚至未來(lái)連 3A 大作級(jí)別的游戲,都有可能直接通過(guò) AI 渲染生成。

去年英偉達(dá)創(chuàng)始人黃仁勛曾預(yù)言,未來(lái)游戲中的每一個(gè)像素都將被生成,而不是渲染。當(dāng)時(shí)這話說(shuō)的時(shí)候,但大家可能還半信半疑。

通常,制作一款小型游戲的環(huán)境可能需要一周時(shí)間,對(duì)于工作室項(xiàng)目,創(chuàng)建游戲環(huán)境可能需要更長(zhǎng)的時(shí)間,具體取決于設(shè)計(jì)的復(fù)雜程度。

上個(gè)月,Google DeepMind 公布了首個(gè)「AI 游戲引擎」GameNGen。

它能夠在單個(gè) TPU 芯片上以超過(guò) 20 幀每秒的速度實(shí)時(shí)模擬經(jīng)典射擊游戲《毀滅戰(zhàn)士》。

其工作原理是利用擴(kuò)散模型實(shí)時(shí)預(yù)測(cè)每一幀,這意味著,游戲中的每一刻都是根據(jù)玩家的操作和環(huán)境的復(fù)雜互動(dòng)實(shí)時(shí)生成的。

當(dāng)時(shí),英偉達(dá)高級(jí)科學(xué)家 Jim Fan 不禁感慨,被黑客們?cè)诟鞣N地方瘋狂運(yùn)行的《毀滅戰(zhàn)士》竟然在純粹的擴(kuò)散模型中實(shí)現(xiàn)了,每個(gè)像素都是生成的。

再后來(lái),類似更多成果也正在涌現(xiàn)。

前不久,騰訊也放了大招,推出了一款專門(mén)面向 3A 開(kāi)放世界游戲的大模型——GameGen-O。

GameGen-O 能模擬各類 3A 游戲,比如《巫師 3》、《賽博朋克 2077》《刺客信條》以及《黑神話:悟空》里的角色、動(dòng)態(tài)環(huán)境,以及復(fù)雜動(dòng)作等,生成的游戲場(chǎng)景質(zhì)量也很高。

為了構(gòu)建數(shù)據(jù)集,下血本的騰訊搜集了超過(guò) 32000 個(gè)游戲視頻,每個(gè)視頻短則幾分鐘,長(zhǎng)則幾小時(shí),然后經(jīng)過(guò)人工數(shù)據(jù)標(biāo)注挑選了 15000 個(gè)可用視頻。

這些精選的視頻通過(guò)場(chǎng)景檢測(cè)被切割成片段,然后按照美學(xué)、光流分析和語(yǔ)義內(nèi)容進(jìn)行了嚴(yán)格的排序和過(guò)濾。

美國(guó)游戲開(kāi)發(fā)商 Electronic Arts 最近也通過(guò)一段「從想象到創(chuàng)造」視頻,向業(yè)界展示了未來(lái) AI 在游戲開(kāi)發(fā)落地的美好愿景。

視頻中,玩家僅憑簡(jiǎn)單的指令,就能使用 AI 工具創(chuàng)建游戲場(chǎng)景、角色和其他內(nèi)容。

CEO Andrew Wilson 稱未來(lái)生成式 AI 可改進(jìn)公司一半以上開(kāi)發(fā)流程,預(yù)計(jì)將在三至五年內(nèi)設(shè)計(jì)創(chuàng)造更大、更身臨其境的游戲世界。

AI 不僅能夠提升現(xiàn)有游戲的開(kāi)發(fā)效率,還可能創(chuàng)造出全新的游戲體驗(yàn)。

也許你會(huì)說(shuō),不管游戲用的是什么高大上的技術(shù),歸根結(jié)底,好玩才是王道。

但在 GTA 6 反復(fù)跳票,遲遲不見(jiàn)蹤影的情況下,我們或許也會(huì)萌生一種自己動(dòng)手、豐衣足食的念頭。

畢竟,如果能親手打造一個(gè)「罪惡都市」,感覺(jué)好像也還不錯(cuò)。

本文來(lái)源:Appso

appso

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部