首頁 > 科技要聞 > 科技> 正文

OpenAI下一代模型突遭泄露!「半GPT-5」旗艦模型獵戶座要來了?

新智元 整合編輯:太平洋科技 發(fā)布于:2024-12-12 15:06

OpenAI的新模型,竟被意外泄露了?

圣誕馬拉松第四天,網(wǎng)友們從OpenAI研究員Karina Nguyen介紹Canvas功能的帖子里,發(fā)現(xiàn)了蛛絲馬跡。

一個名叫「ChatGPT ε」的模型,現(xiàn)身了。

有人猜測,這很有可能就是OpenAI的下一代模型「獵戶座」。

這個帖子很快引爆了社區(qū),網(wǎng)友們經(jīng)過更細致的研究,發(fā)現(xiàn)了新的亮點——

在Karina的瀏覽器收藏夾內(nèi),一個文件夾名為「Agents」,還有一個名為「Scientist Assistant」的標簽頁。

眼看引起了軒然大波,Karina旋即將帖子刪除了。

傳聞中的獵戶座,并不是GPT-5?

模型名稱中的「ε」,正是獵戶座中的那顆——參宿二(Alnilam)。

說起Orion這個名字,我們都不陌生。

此前OpenAI醞釀許久的草莓模型(推理模型o1的原型),曾引出多篇猜測。

The Information的一篇報道中曾寫道,草莓曾用來改進名為獵戶座(Orion)的新模型。具體來說,Orion的預訓練數(shù)據(jù),正是由草莓模型生成的。

當時,有人猜測獵戶座就是下一代模型GPT-5,甚至GPT-6。

而草莓的作用,就是幫OpenAI克服獲取高質(zhì)量數(shù)據(jù)的限制,從現(xiàn)實世界數(shù)據(jù)(如互聯(lián)網(wǎng)獲取的文本或圖像)中訓練新模型。

草莓可以幫Orion減少幻覺的產(chǎn)生,因為AI模型是從訓練數(shù)據(jù)中學習的,所以它們看到的復雜推理的正確示例越多,就越好。

一個月前,The Information給出的全新曝料,也和所謂的「預訓練Scaling Law撞墻說」對上了。

據(jù)悉,獵戶座相對于GPT-4的提升,要遠小于GP4-3相對GPT-3的提升。因此,獵戶座大概不會被命名為GPT-5。

與之對應的,X上的「曝料哥」Tibor Blaho也透露說——

一些測試Orion的OpenAI員工說,在完成20%的訓練后,它就達到了GPT-4級的性能,但質(zhì)量的提高小于從GPT-3到GPT-4的飛躍,這表明隨著高質(zhì)量數(shù)據(jù)變得有限,傳統(tǒng)的Scaling Law可能正在放緩。

Orion的訓練涉及來自GPT-4和推理模型等先前模型的AI生成數(shù)據(jù),這可能會導致它重現(xiàn)舊模型的一些行為。

OpenAI已經(jīng)創(chuàng)建了一個「基礎(chǔ)」團隊,以開發(fā)新的方法,隨著高質(zhì)量數(shù)據(jù)供應的減少,

OpenAI正在為明年初的計劃發(fā)布完成Orion的安全測試,該測試可能會打破「GPT」命名慣例,以反映模型開發(fā)的變化

此外,還有爆料稱,OpenAI目前正在訓練一個在預訓練規(guī)模上介于GPT-4o和Orion之間的模型。

他們會先預訓練一個「基礎(chǔ)模型」,然后從中派生出兩個模型:一個是傳統(tǒng)的聊天模型,另一個是真正的推理模型。

而Orion的訓練時間,也打破了1-2個月的常規(guī),超過了3個月。

原因就在于,推理模型的「反饋循環(huán)」機制,使得這種情況發(fā)生了變化。

而Karina屏幕中透露的「Agents」,也讓人有諸多聯(lián)想。

智能體是所有人一直期待的東西。而這次泄露是OpenAI有意的嗎?

有人猜測,Scientist Assistant可能是prompt摘要,agents folder看起來像傳統(tǒng)的瀏覽器文件夾

網(wǎng)友熱議:OpenAI明天又有大發(fā)布?

對于ChatGPT ε,有網(wǎng)友猜測道:「在同一張截圖中,他們似乎正在運行某種epsilon模型——可能是GPT 4.5?」

還有網(wǎng)友理性分析了引起討論的標簽頁和文件夾,猜測「Scientist Assistant」可能是提示的摘要,而「agents」文件夾看起來像是一個傳統(tǒng)的瀏覽器文件夾。

也就是說,這些可能和新功能新產(chǎn)品沒什么關(guān)系。

還有網(wǎng)友覺得無論如何,這都是「有意為之」。有可能就是一種營銷手段。

在這條Reddit帖子下,還有人總結(jié)了一下OpenAI的圣誕馬拉松規(guī)律——

看起來他們現(xiàn)在似乎在遵循一種「A/B模式」,交替進行「大發(fā)布」和「小發(fā)布」。希望明天能迎來一個「大發(fā)布」。期待能有高級模式的視頻功能!

是的,有關(guān)視頻功能的消息也已經(jīng)初見端倪了。

ChatGPT的視覺語音模式要來了?

據(jù)悉,ChatGPT帶有視覺功能的高級語音模式(以下簡稱「視覺語音模式」)即將向付費用戶開放。

60 Minutes最近在X上發(fā)布了一條將近3分鐘的視頻。視頻中,OpenAI總裁Greg Brockman親自向我們展示了ChatGPT視覺語音模式的能力。

它可以通過實時視頻看到視野范圍內(nèi)的人們正在做什么,并與他們進行實時的語音互動。

視頻中,ChatGPT實力變身全能老師,既當生物考官,又當數(shù)學老師——

它流暢地主持了一場解剖學測驗,能夠?qū)崟r審閱黑板上的手繪答案并提供反饋;還寫了一首三角形面積公式的押韻歌,并用英式口音唱了出來。

解剖學測驗

在演示視頻中,Brockman向ChatGPT發(fā)令:「你將對他進行測試,讓他畫出你想測試的任何身體部位,并讓他標注出來!

指令發(fā)出后,Brockman的手機攝像頭便一直對準黑板,ChatGPT開始主持這場對Anderson Cooper的測試。

ChatGPT開考第一題:請標注心臟的位置!

Anderson在一個非常草率的人體示意圖里,隨便畫了一個完全不圓的圈,標注出心臟的位置,GPT便成功地理解了他在做什么。

接著,ChatGPT又請他畫出大腦的位置,Anderson準確地畫了出來。GPT毫不吝嗇地稱贊了他。

然后,ChatGPT又出了一個題,讓Anderson畫出肝臟的位置。

Anderson聽到題目后感慨了一句「這有點難」,ChatGPT立馬就捕捉到了他的輕微焦慮,并告訴他「別緊張」。整段對話流暢得像真人家教,唯一的區(qū)別是,GPT的聲音有點機器人味兒。

Anderson把肝臟畫在了錯誤的一側(cè),ChatGPT禮貌地糾正了他。

最后,Brockman讓GPT評價了一下這張圖——

計算三角形面積

視頻中,大家還讓GPT客串了一下數(shù)學老師。一開始,它準確地說出了計算三角形面積的公式。

不過,當Khan故意指著三角形的邊問「這里的高是這個4嗎」,AI并沒有發(fā)現(xiàn)錯誤。

看來,平面幾何題要比人體器官部位要難一些。

參考資料:

https://x.com/kimmonismus/status/1866570298121916881

https://x.com/60Minutes/status/1865921920543186953

本文來源:新智元

新智元

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部