首頁(yè) > 科技要聞 > 科技> 正文

OpenAI重磅更新定檔下周一,奧特曼暗示會(huì)有「魔法」!

新智元 整合編輯:龔震 發(fā)布于:2024-05-12 23:15

確認(rèn)了,沒有GPT-5,沒有搜索引擎,但還會(huì)有驚喜!

OpenAI今天官宣預(yù)告,即將在13日,下周一上午10點(diǎn)(太平洋時(shí)間)開啟線上直播。

屆時(shí),會(huì)有全新的ChatGPT demo演示,以及GPT-4升級(jí)更新。

傳送門:https://openai.com/(OpenAI還在網(wǎng)頁(yè)UI整了個(gè)小心機(jī)設(shè)計(jì),一點(diǎn)滿屏字頗有趣味)

而Altman本人更是興奮地表示,「對(duì)我來(lái)說(shuō),感覺就像魔法一樣」。

本來(lái),發(fā)布「搜索引擎」這件事基本實(shí)錘,甚至連路透援引內(nèi)部人士消息這篇報(bào)道,昨天在全網(wǎng)瘋轉(zhuǎn)。

然而,發(fā)布時(shí)間是對(duì)上了,但奧特曼突然變卦,直言「沒有搜索引擎」。

據(jù)網(wǎng)友爆料,這是OpenAI投出的誘餌,目的是揪出內(nèi)部泄密者。而經(jīng)常給Jimmy Apples、Flowers泄密的爆料人,已經(jīng)被OpenAI解雇。

不得不說(shuō),還是OpenAI套路深。

那么,萬(wàn)眾期待的GPT-5沒有,確認(rèn)了再確認(rèn)的「搜索引擎」也沒有,下周一OpenAI的「魔法」究竟是啥?

Information獨(dú)家報(bào)道,OpenAI正在開發(fā)一個(gè)全能的AI語(yǔ)音助手,預(yù)計(jì)在下周展示。

這項(xiàng)新技術(shù)可以通過聲音和文本,與人交流,可以聽出不同人的語(yǔ)調(diào)、語(yǔ)氣,并能識(shí)別物體和圖像。

網(wǎng)友紛紛表示,又是沒等到GPT-5的一天。

Her即將成真!AI語(yǔ)音助手要來(lái)

其實(shí),OpenAI希望,能夠開發(fā)出一款像人類一樣交流的AI。

Altman曾表示,自己對(duì)Spike Jonze導(dǎo)演的電影《Her》深感興趣,并稱其具有預(yù)見性。

在這個(gè)影片中,講述了主人公愛上了一個(gè)對(duì)話操作系統(tǒng)——Semantha,并在互動(dòng)過程中,AI也逐漸熟悉了他。

「她」記得他的故事,他的習(xí)慣,還發(fā)展出了自己的個(gè)性。

因此,打一開始,OpenAI致力于最終開發(fā)出類似于《Her》中的虛擬助手,同時(shí)讓現(xiàn)有語(yǔ)音助手,如Siri更加出色。

新模型有音頻輸入、音頻輸出功能,以及更好的推理能力。在一些查詢上甚至超過了GPT-4 Turbo

據(jù)兩位知情人士透露,OpenAI已經(jīng)向一些客戶展示了這項(xiàng)新技術(shù),包括優(yōu)于現(xiàn)有模型的邏輯推理能力在內(nèi)的多項(xiàng)能力。

而且,預(yù)計(jì)在下周一的活動(dòng)中,將首次公開展示這款進(jìn)階后的AI。

可以確認(rèn)的是,OpenAI這波操作再次截胡谷歌,搶占奪人眼睛的先機(jī)。

谷歌預(yù)計(jì)在14日召開I/O大會(huì)(OpenAI掐點(diǎn)的直播時(shí)間真及時(shí),簡(jiǎn)直不給谷歌留下喘氣的機(jī)會(huì))

據(jù)網(wǎng)友發(fā)現(xiàn),在Altman官宣不會(huì)發(fā)布「搜索引擎」,谷歌的股價(jià)立馬飆升。

精準(zhǔn)識(shí)別語(yǔ)調(diào)語(yǔ)氣,但體積太大裝不進(jìn)手機(jī)

OpenAI團(tuán)隊(duì)篤定的是,具備視覺+音頻能力的AI助手,可能會(huì)像智能手機(jī)一樣,將給世界帶來(lái)顛覆性的變革性。

ChatGPT,還只是這類強(qiáng)大AI助手的雛形。

理論上,他們?cè)O(shè)想的這款A(yù)I助手,可以完成不可能的任務(wù)。

比如,指導(dǎo)學(xué)生寫論文、解決數(shù)學(xué)難題,或人們?cè)儐枙r(shí),提供及時(shí)豐富的信息、翻譯標(biāo)志,甚至指導(dǎo)如何修理故障的汽車。

不幸的是,OpenAI這款A(yù)I目前體積太大,根本無(wú)法在個(gè)人終端設(shè)備運(yùn)行。

不過,客戶可以在短期內(nèi)使用基于云的版本,來(lái)增強(qiáng)OpenAI已經(jīng)支持的軟件功能,例如自動(dòng)客戶服務(wù)智能體。

另?yè)?jù)了解這項(xiàng)AI的人透露,新軟件的音頻功能可以幫助,這些智能體更精準(zhǔn)地理解來(lái)電者的「語(yǔ)調(diào)」,以及他們是否在提出請(qǐng)求時(shí)使用「諷刺語(yǔ)氣」。

目前,OpenAI已經(jīng)開發(fā)了用于轉(zhuǎn)錄音頻(Whisper)以及文本轉(zhuǎn)語(yǔ)言(TTS)的模型。

ChatGPT背后便集成了這些能力,不過在用到的時(shí)候,需要分別調(diào)用這些工具。

據(jù)稱,OpenAI即將推出的新模型,將這些能力整合到一個(gè)模型之中,即打造一個(gè)「原生多模態(tài)模型」。

這個(gè)全新多模態(tài)模型,在理解圖像和音頻方面表現(xiàn)更佳,同時(shí)其響應(yīng)速度也超過了那些能力較弱的模型。

微軟搶先體驗(yàn)

一如既往,OpenAI更新那天,作為「金主爸爸」的微軟,定是最先用上新功能的那個(gè)人。

預(yù)計(jì),微軟將會(huì)利用OpenAI新技術(shù)升級(jí)自己的語(yǔ)音助手。

而且,他們?cè)O(shè)想試圖去壓縮這個(gè)技術(shù),以便將其「裝進(jìn)」包括配備前置攝像頭的可穿戴設(shè)備中,能夠捕捉到用戶的周圍環(huán)境。

不過,目前雖尚不清楚OpenAI何時(shí)會(huì)向其付費(fèi)客戶提供這些新功能,但最終目標(biāo)是,將其納入ChatGPT的免費(fèi)版本中。

據(jù)一位體驗(yàn)過的人士透露,OpenAI的目標(biāo)是,讓具備新功能的AI模型的運(yùn)營(yíng)成本,低于其當(dāng)前收費(fèi)的最尖端的模型GPT-4-Turbo。

他還指出,新模型在回答某些問題上表現(xiàn)得更好。然而,它依舊會(huì)出現(xiàn)「幻覺」。

GPT-5年底前發(fā),冰山之下深藏的秘密

OpenAI的領(lǐng)先優(yōu)勢(shì),幾乎無(wú)人能及。

一直以來(lái),谷歌高管夢(mèng)想著,利用AI開發(fā)出強(qiáng)大的助手。

去年12年,谷歌首次展示了對(duì)話AI「Gemini」,能夠?qū)崟r(shí)響應(yīng)人的語(yǔ)音指令,并識(shí)別人類正在觀看的圖片。

一時(shí)間,這個(gè)宣傳視頻在全網(wǎng)掀起軒然大波,讓許多人瞬間對(duì)谷歌刮目相看。

沒想到,還沒發(fā)布一天,視頻竟被曝出「造假」?!

谷歌隨后解釋,這些能力的實(shí)現(xiàn),需要研究人員通過圖片和文本指令來(lái)引導(dǎo)模型,并非視頻所展示的那種簡(jiǎn)單對(duì)話。

此后,隨著Gemini的迭代升級(jí),也增加了一些新功能,除了分析圖像和文本之外,還能分析音頻。

盡管如此,它依舊不能理解多數(shù)傳統(tǒng)語(yǔ)音命令,也不能像Siri和Google Assistant等傳統(tǒng)語(yǔ)音助手那樣與用戶進(jìn)行交流。

而OpenAI即將發(fā)布的AI語(yǔ)音助手,或許對(duì)谷歌來(lái)說(shuō),又是一個(gè)致命性的打擊。

另外,OpenAI也在全力以赴,確保自己在AI領(lǐng)域的領(lǐng)先地位,不被主打「開源王牌」的Meta趕超。

今年4月,Llama 3的8B和70B版本發(fā)布,并預(yù)告了400B+開源大模型,直接狙擊GPT-4。

而具備「音頻+視覺」能力的AI模型,只是OpenAI正在開發(fā)的眾多產(chǎn)品之一。

雖這次不會(huì)發(fā)布「網(wǎng)絡(luò)搜索引擎」,但這件事確實(shí)在OpenAI內(nèi)部正在推進(jìn),就是為了與谷歌搜索競(jìng)爭(zhēng)。

畢竟,OpenAI在上周的主頁(yè)中,已經(jīng)對(duì)外展示了一個(gè)新的UI。

此外,OpenAI還在開發(fā)一種自動(dòng)化軟件,稱為「計(jì)算機(jī)操作智能體」(computer-using agent)。

該軟件有望加速軟件開發(fā),及其他計(jì)算機(jī)相關(guān)任務(wù)。

另外,今年年初,AI視頻生成器Sora的誕生,已經(jīng)在好萊塢掀起巨震,雖然目前尚未公開發(fā)布。

更重要的是,GPT-5也在默默推進(jìn)中,并且要顯著優(yōu)于GPT-4。知情人士透露,OpenAI可能在今年年底前完成GPT-5的開發(fā),并公開發(fā)布。

之所以,OpenAI內(nèi)部在產(chǎn)品和AI模型開發(fā)上進(jìn)展迅速,是因?yàn)榇饲靶嫉捻?xiàng)目,未能獲得足夠的關(guān)注。

比如,他們?cè)兄Z開發(fā)者最在今年第一季度,通過構(gòu)建定制聊天機(jī)器人,來(lái)為其商店賺錢。

但到目前為止,OpenAI尚未推出實(shí)現(xiàn)這一目標(biāo)的具體方式。

ChatGPT裝進(jìn)iPhone,與蘋果合作基本達(dá)成

另一方面,打造視覺+音頻AI助手可以幫助OpenAI,將其能力引入數(shù)億,甚至數(shù)十億的蘋果設(shè)備中。

就在剛剛,彭博報(bào)道稱,蘋果與OpenAI正在敲定一項(xiàng)協(xié)議,貌似接近尾聲,基本達(dá)成。

這項(xiàng)協(xié)議,即將為今年的iOS提供全新的生成式AI能力。

此前,還曾爆出蘋果與谷歌就Gemini的談判正在進(jìn)行中,不過還未達(dá)成協(xié)議。

畢竟,距蘋果今年的開發(fā)者大會(huì)WWDC(6月10日),留給蘋果的時(shí)間不多了。

多家媒體爆料稱,這屆大會(huì)將AI整合進(jìn)全新iOS 18系統(tǒng)中。

對(duì)于大家的期待,蘋果可不想辜負(fù)。

硬件設(shè)備,OpenAI也要自己做

此外,Altman還與iPhone設(shè)計(jì)師Jony Ive合作,去開發(fā)一款獨(dú)立的AI消費(fèi)設(shè)備。

Information曾報(bào)道,這款一個(gè)硬件可能從Emerson Collective和Thrive Capital等投資者那里,籌集到高達(dá)10億美元的資金。

過去一年,AI Pin、Rabbit R1等AI驅(qū)動(dòng)的設(shè)備和可穿戴產(chǎn)品蜂擁而出,Altman此舉也是希望加入這一陣列。

不得不承認(rèn)的是,即便OpenAI最先進(jìn)的AI模型推出,也將因其龐大的規(guī)模,只限在云端運(yùn)行,并且需要聯(lián)網(wǎng)操作。

而未來(lái),若想讓復(fù)雜的具備「視覺+音頻」的對(duì)話AI,縮小到足以在設(shè)備上運(yùn)行,可能還需要幾個(gè)月,甚至幾年的時(shí)間。

全網(wǎng)大預(yù)測(cè):智能體、gpt4-lite...

OpenAI這波官宣,可謂是戳中了所有人的興奮點(diǎn)。

爆料人Jimmy Apples又來(lái)泄密,「預(yù)計(jì)下周,我們會(huì)看到智能體的發(fā)布」。

而「搜索引擎」可能會(huì)在蘋果WWDC大會(huì)上,一起發(fā)布。

OpenAI研究科學(xué)家Bowen Cheng甚至表示,要發(fā)的可比GPT-5酷多了。

不知為何,這個(gè)帖子目前卻被刪除了。

另一位OpenAI負(fù)責(zé)視頻生成的科學(xué)家Will Depue發(fā)了一張圖,不知在暗示著什么。

還有一位網(wǎng)友Siqi Chen預(yù)測(cè)下周一,在GPT-4模型方面的更新:

- gpt4-lite:替換gpt-3.5

- gpt4-auto:一個(gè)新的模型端點(diǎn)(endpoint),可自動(dòng)從網(wǎng)絡(luò)檢索數(shù)據(jù),并集成內(nèi)部數(shù)據(jù)來(lái)增強(qiáng)響應(yīng)(不是「搜索引擎」)

- gpt4-lite-auto:與gpt4-auto類似,但使用的是lite版本。

同樣,也有人稱,gpt4-lite即將發(fā)布。

離職OpenAI,入職谷歌的Logan Kilpatrick表示,「6個(gè)月后,AI領(lǐng)域的格局將會(huì)完全不同。大多數(shù)人會(huì)對(duì)事情的發(fā)展感到驚訝」。

還有一個(gè)疑問是,OpenAI這次會(huì)對(duì),gpt2做解釋嗎?

接下來(lái)一個(gè)月,AI海嘯將翻涌而來(lái)。

關(guān)于GPT-5何時(shí)面世,最近Altman在All-In Pod中回應(yīng),「我甚至不確定我們是否會(huì)命名它為GPT-5」。

他暗示,未來(lái)可能不再遵循GPT N+1的發(fā)布模式,而是轉(zhuǎn)向持續(xù)的改進(jìn)過程。

但,GPT-5還得再等等。

參考資料:

https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-apple

https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone

https://twitter.com/sama/status/1788989777452408943

文章來(lái)源:新智元

新智元

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部