確認(rèn)了,沒有GPT-5,沒有搜索引擎,但還會(huì)有驚喜! OpenAI今天官宣預(yù)告,即將在13日,下周一上午10點(diǎn)(太平洋時(shí)間)開啟線上直播。 屆時(shí),會(huì)有全新的ChatGPT demo演示,以及GPT-4升級(jí)更新。 傳送門:https://openai.com/(OpenAI還在網(wǎng)頁(yè)UI整了個(gè)小心機(jī)設(shè)計(jì),一點(diǎn)滿屏字頗有趣味) 而Altman本人更是興奮地表示,「對(duì)我來(lái)說(shuō),感覺就像魔法一樣」。 本來(lái),發(fā)布「搜索引擎」這件事基本實(shí)錘,甚至連路透援引內(nèi)部人士消息這篇報(bào)道,昨天在全網(wǎng)瘋轉(zhuǎn)。 然而,發(fā)布時(shí)間是對(duì)上了,但奧特曼突然變卦,直言「沒有搜索引擎」。 據(jù)網(wǎng)友爆料,這是OpenAI投出的誘餌,目的是揪出內(nèi)部泄密者。而經(jīng)常給Jimmy Apples、Flowers泄密的爆料人,已經(jīng)被OpenAI解雇。 不得不說(shuō),還是OpenAI套路深。 那么,萬(wàn)眾期待的GPT-5沒有,確認(rèn)了再確認(rèn)的「搜索引擎」也沒有,下周一OpenAI的「魔法」究竟是啥? Information獨(dú)家報(bào)道,OpenAI正在開發(fā)一個(gè)全能的AI語(yǔ)音助手,預(yù)計(jì)在下周展示。 這項(xiàng)新技術(shù)可以通過聲音和文本,與人交流,可以聽出不同人的語(yǔ)調(diào)、語(yǔ)氣,并能識(shí)別物體和圖像。 網(wǎng)友紛紛表示,又是沒等到GPT-5的一天。 Her即將成真!AI語(yǔ)音助手要來(lái) 其實(shí),OpenAI希望,能夠開發(fā)出一款像人類一樣交流的AI。 Altman曾表示,自己對(duì)Spike Jonze導(dǎo)演的電影《Her》深感興趣,并稱其具有預(yù)見性。 在這個(gè)影片中,講述了主人公愛上了一個(gè)對(duì)話操作系統(tǒng)——Semantha,并在互動(dòng)過程中,AI也逐漸熟悉了他。 「她」記得他的故事,他的習(xí)慣,還發(fā)展出了自己的個(gè)性。 因此,打一開始,OpenAI致力于最終開發(fā)出類似于《Her》中的虛擬助手,同時(shí)讓現(xiàn)有語(yǔ)音助手,如Siri更加出色。 新模型有音頻輸入、音頻輸出功能,以及更好的推理能力。在一些查詢上甚至超過了GPT-4 Turbo 據(jù)兩位知情人士透露,OpenAI已經(jīng)向一些客戶展示了這項(xiàng)新技術(shù),包括優(yōu)于現(xiàn)有模型的邏輯推理能力在內(nèi)的多項(xiàng)能力。 而且,預(yù)計(jì)在下周一的活動(dòng)中,將首次公開展示這款進(jìn)階后的AI。 可以確認(rèn)的是,OpenAI這波操作再次截胡谷歌,搶占奪人眼睛的先機(jī)。 谷歌預(yù)計(jì)在14日召開I/O大會(huì)(OpenAI掐點(diǎn)的直播時(shí)間真及時(shí),簡(jiǎn)直不給谷歌留下喘氣的機(jī)會(huì)) 據(jù)網(wǎng)友發(fā)現(xiàn),在Altman官宣不會(huì)發(fā)布「搜索引擎」,谷歌的股價(jià)立馬飆升。 精準(zhǔn)識(shí)別語(yǔ)調(diào)語(yǔ)氣,但體積太大裝不進(jìn)手機(jī) OpenAI團(tuán)隊(duì)篤定的是,具備視覺+音頻能力的AI助手,可能會(huì)像智能手機(jī)一樣,將給世界帶來(lái)顛覆性的變革性。 ChatGPT,還只是這類強(qiáng)大AI助手的雛形。 理論上,他們?cè)O(shè)想的這款A(yù)I助手,可以完成不可能的任務(wù)。 比如,指導(dǎo)學(xué)生寫論文、解決數(shù)學(xué)難題,或人們?cè)儐枙r(shí),提供及時(shí)豐富的信息、翻譯標(biāo)志,甚至指導(dǎo)如何修理故障的汽車。 不幸的是,OpenAI這款A(yù)I目前體積太大,根本無(wú)法在個(gè)人終端設(shè)備運(yùn)行。 不過,客戶可以在短期內(nèi)使用基于云的版本,來(lái)增強(qiáng)OpenAI已經(jīng)支持的軟件功能,例如自動(dòng)客戶服務(wù)智能體。 另?yè)?jù)了解這項(xiàng)AI的人透露,新軟件的音頻功能可以幫助,這些智能體更精準(zhǔn)地理解來(lái)電者的「語(yǔ)調(diào)」,以及他們是否在提出請(qǐng)求時(shí)使用「諷刺語(yǔ)氣」。 目前,OpenAI已經(jīng)開發(fā)了用于轉(zhuǎn)錄音頻(Whisper)以及文本轉(zhuǎn)語(yǔ)言(TTS)的模型。 ChatGPT背后便集成了這些能力,不過在用到的時(shí)候,需要分別調(diào)用這些工具。 據(jù)稱,OpenAI即將推出的新模型,將這些能力整合到一個(gè)模型之中,即打造一個(gè)「原生多模態(tài)模型」。 這個(gè)全新多模態(tài)模型,在理解圖像和音頻方面表現(xiàn)更佳,同時(shí)其響應(yīng)速度也超過了那些能力較弱的模型。 微軟搶先體驗(yàn) 一如既往,OpenAI更新那天,作為「金主爸爸」的微軟,定是最先用上新功能的那個(gè)人。 預(yù)計(jì),微軟將會(huì)利用OpenAI新技術(shù)升級(jí)自己的語(yǔ)音助手。 而且,他們?cè)O(shè)想試圖去壓縮這個(gè)技術(shù),以便將其「裝進(jìn)」包括配備前置攝像頭的可穿戴設(shè)備中,能夠捕捉到用戶的周圍環(huán)境。 不過,目前雖尚不清楚OpenAI何時(shí)會(huì)向其付費(fèi)客戶提供這些新功能,但最終目標(biāo)是,將其納入ChatGPT的免費(fèi)版本中。 據(jù)一位體驗(yàn)過的人士透露,OpenAI的目標(biāo)是,讓具備新功能的AI模型的運(yùn)營(yíng)成本,低于其當(dāng)前收費(fèi)的最尖端的模型GPT-4-Turbo。 他還指出,新模型在回答某些問題上表現(xiàn)得更好。然而,它依舊會(huì)出現(xiàn)「幻覺」。 GPT-5年底前發(fā),冰山之下深藏的秘密 OpenAI的領(lǐng)先優(yōu)勢(shì),幾乎無(wú)人能及。 一直以來(lái),谷歌高管夢(mèng)想著,利用AI開發(fā)出強(qiáng)大的助手。 去年12年,谷歌首次展示了對(duì)話AI「Gemini」,能夠?qū)崟r(shí)響應(yīng)人的語(yǔ)音指令,并識(shí)別人類正在觀看的圖片。 一時(shí)間,這個(gè)宣傳視頻在全網(wǎng)掀起軒然大波,讓許多人瞬間對(duì)谷歌刮目相看。 沒想到,還沒發(fā)布一天,視頻竟被曝出「造假」?! 谷歌隨后解釋,這些能力的實(shí)現(xiàn),需要研究人員通過圖片和文本指令來(lái)引導(dǎo)模型,并非視頻所展示的那種簡(jiǎn)單對(duì)話。 此后,隨著Gemini的迭代升級(jí),也增加了一些新功能,除了分析圖像和文本之外,還能分析音頻。 盡管如此,它依舊不能理解多數(shù)傳統(tǒng)語(yǔ)音命令,也不能像Siri和Google Assistant等傳統(tǒng)語(yǔ)音助手那樣與用戶進(jìn)行交流。 而OpenAI即將發(fā)布的AI語(yǔ)音助手,或許對(duì)谷歌來(lái)說(shuō),又是一個(gè)致命性的打擊。 另外,OpenAI也在全力以赴,確保自己在AI領(lǐng)域的領(lǐng)先地位,不被主打「開源王牌」的Meta趕超。 今年4月,Llama 3的8B和70B版本發(fā)布,并預(yù)告了400B+開源大模型,直接狙擊GPT-4。 而具備「音頻+視覺」能力的AI模型,只是OpenAI正在開發(fā)的眾多產(chǎn)品之一。 雖這次不會(huì)發(fā)布「網(wǎng)絡(luò)搜索引擎」,但這件事確實(shí)在OpenAI內(nèi)部正在推進(jìn),就是為了與谷歌搜索競(jìng)爭(zhēng)。 畢竟,OpenAI在上周的主頁(yè)中,已經(jīng)對(duì)外展示了一個(gè)新的UI。 此外,OpenAI還在開發(fā)一種自動(dòng)化軟件,稱為「計(jì)算機(jī)操作智能體」(computer-using agent)。 該軟件有望加速軟件開發(fā),及其他計(jì)算機(jī)相關(guān)任務(wù)。 另外,今年年初,AI視頻生成器Sora的誕生,已經(jīng)在好萊塢掀起巨震,雖然目前尚未公開發(fā)布。 更重要的是,GPT-5也在默默推進(jìn)中,并且要顯著優(yōu)于GPT-4。知情人士透露,OpenAI可能在今年年底前完成GPT-5的開發(fā),并公開發(fā)布。 之所以,OpenAI內(nèi)部在產(chǎn)品和AI模型開發(fā)上進(jìn)展迅速,是因?yàn)榇饲靶嫉捻?xiàng)目,未能獲得足夠的關(guān)注。 比如,他們?cè)兄Z開發(fā)者最在今年第一季度,通過構(gòu)建定制聊天機(jī)器人,來(lái)為其商店賺錢。 但到目前為止,OpenAI尚未推出實(shí)現(xiàn)這一目標(biāo)的具體方式。 ChatGPT裝進(jìn)iPhone,與蘋果合作基本達(dá)成 另一方面,打造視覺+音頻AI助手可以幫助OpenAI,將其能力引入數(shù)億,甚至數(shù)十億的蘋果設(shè)備中。 就在剛剛,彭博報(bào)道稱,蘋果與OpenAI正在敲定一項(xiàng)協(xié)議,貌似接近尾聲,基本達(dá)成。 這項(xiàng)協(xié)議,即將為今年的iOS提供全新的生成式AI能力。 此前,還曾爆出蘋果與谷歌就Gemini的談判正在進(jìn)行中,不過還未達(dá)成協(xié)議。 畢竟,距蘋果今年的開發(fā)者大會(huì)WWDC(6月10日),留給蘋果的時(shí)間不多了。 多家媒體爆料稱,這屆大會(huì)將AI整合進(jìn)全新iOS 18系統(tǒng)中。 對(duì)于大家的期待,蘋果可不想辜負(fù)。 硬件設(shè)備,OpenAI也要自己做 此外,Altman還與iPhone設(shè)計(jì)師Jony Ive合作,去開發(fā)一款獨(dú)立的AI消費(fèi)設(shè)備。 Information曾報(bào)道,這款一個(gè)硬件可能從Emerson Collective和Thrive Capital等投資者那里,籌集到高達(dá)10億美元的資金。 過去一年,AI Pin、Rabbit R1等AI驅(qū)動(dòng)的設(shè)備和可穿戴產(chǎn)品蜂擁而出,Altman此舉也是希望加入這一陣列。 不得不承認(rèn)的是,即便OpenAI最先進(jìn)的AI模型推出,也將因其龐大的規(guī)模,只限在云端運(yùn)行,并且需要聯(lián)網(wǎng)操作。 而未來(lái),若想讓復(fù)雜的具備「視覺+音頻」的對(duì)話AI,縮小到足以在設(shè)備上運(yùn)行,可能還需要幾個(gè)月,甚至幾年的時(shí)間。 全網(wǎng)大預(yù)測(cè):智能體、gpt4-lite... OpenAI這波官宣,可謂是戳中了所有人的興奮點(diǎn)。 爆料人Jimmy Apples又來(lái)泄密,「預(yù)計(jì)下周,我們會(huì)看到智能體的發(fā)布」。 而「搜索引擎」可能會(huì)在蘋果WWDC大會(huì)上,一起發(fā)布。 OpenAI研究科學(xué)家Bowen Cheng甚至表示,要發(fā)的可比GPT-5酷多了。 不知為何,這個(gè)帖子目前卻被刪除了。 另一位OpenAI負(fù)責(zé)視頻生成的科學(xué)家Will Depue發(fā)了一張圖,不知在暗示著什么。 還有一位網(wǎng)友Siqi Chen預(yù)測(cè)下周一,在GPT-4模型方面的更新: - gpt4-lite:替換gpt-3.5 - gpt4-auto:一個(gè)新的模型端點(diǎn)(endpoint),可自動(dòng)從網(wǎng)絡(luò)檢索數(shù)據(jù),并集成內(nèi)部數(shù)據(jù)來(lái)增強(qiáng)響應(yīng)(不是「搜索引擎」) - gpt4-lite-auto:與gpt4-auto類似,但使用的是lite版本。 同樣,也有人稱,gpt4-lite即將發(fā)布。 離職OpenAI,入職谷歌的Logan Kilpatrick表示,「6個(gè)月后,AI領(lǐng)域的格局將會(huì)完全不同。大多數(shù)人會(huì)對(duì)事情的發(fā)展感到驚訝」。 還有一個(gè)疑問是,OpenAI這次會(huì)對(duì),gpt2做解釋嗎? 接下來(lái)一個(gè)月,AI海嘯將翻涌而來(lái)。 關(guān)于GPT-5何時(shí)面世,最近Altman在All-In Pod中回應(yīng),「我甚至不確定我們是否會(huì)命名它為GPT-5」。 他暗示,未來(lái)可能不再遵循GPT N+1的發(fā)布模式,而是轉(zhuǎn)向持續(xù)的改進(jìn)過程。 但,GPT-5還得再等等。 參考資料: https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-apple https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone https://twitter.com/sama/status/1788989777452408943 文章來(lái)源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選