12月12日凌晨,OpenAI 的馬拉松更新迎來了第五天。今天與其說是展示OpenAI的產(chǎn)品,不如說是一場OpenAI與蘋果的“聯(lián)姻”宣告。 在發(fā)布會一開始,OpenAI的CEO Sam Altman首先發(fā)言。 他以輕松的語氣宣布了這個重要合作:“今天是關(guān)于讓ChatGPT變得更容易使用。我們的朋友蘋果正在為iPhone、iPad和macOS發(fā)布ChatGPT集成。”隨后,來自工程團隊的Dave和產(chǎn)品團隊的McDon展示了具體的功能實現(xiàn)。 就在10月末尾,彭博社記者馬克·古爾曼的最新一期《PowerOn》時事通訊中指出,蘋果在AI領(lǐng)域至少落后頭部公司兩年時間。 這個判斷來自于他得到的蘋果內(nèi)部分析。在分析報告中,OpenAI的ChatGPT在回答問題時的準確率就比蘋果的Siri高出25%,且能回答30%更多的問題。在這樣的背景下,蘋果選擇與OpenAI合作,將ChatGPT整合進iOS、iPadOS和macOS系統(tǒng),似乎是無奈之舉。 畢竟Apple Intelligence剛剛發(fā)布之時,蘋果還信心滿滿的將OpenAI列為“合作伙伴”之一,意圖用自己自研的模型唱主角,F(xiàn)在則不得不交出默認權(quán)限,讓ChatGPT登堂入室。 如果你想看前三天OpenAI都發(fā)布了哪些有趣的東西,可以點擊以下鏈接: OpenAI系列發(fā)布第二彈:“強化微調(diào)”驚艷了不在現(xiàn)場的奧特曼 OpenAI年末狂歡第一彈:“滿血版”o1模型來了,還有個200美元/月的Pro版會員 ChatGPT,讓Apple Intelligence能看見了 這次Apple Intelligence對ChatGPT的深度整合主要包含三個方面: 首先是與Siri的協(xié)同。當Siri判斷某個任務(wù)可能需要ChatGPT的協(xié)助時,它可以將任務(wù)移交給ChatGPT處理; 其次是寫作工具的增強,用戶現(xiàn)在可以使用ChatGPT從頭開始撰寫文檔,還能進行文檔細化和總結(jié); 第三是iPhone 16的相機控制功能,它能夠通過視覺智能讓用戶更深入地了解拍攝對象。 在實際演示環(huán)節(jié),McDon展示了如何在iPhone上啟用這些功能。用戶需要首先進入設(shè)置,啟用Apple intelligence和Siri,然后開啟新的ChatGPT擴展。 用戶可以選擇登錄ChatGPT賬號,系統(tǒng)還提供了確認ChatGPT請求的選項,確保用戶對數(shù)據(jù)分享有完全的控制權(quán)。 特別值得注意的是,Apple Intelligence在這里是以拓展(extension)的方式調(diào)用的ChatGPT,這為之后其他第三方調(diào)用開了個口子。但至少當下,ChatGPT是唯一的選擇。 團隊現(xiàn)場策劃了一場圣誕派對。通過簡單地讓Siri詢問ChatGPT,系統(tǒng)就能生成完整的派對計劃,包括一張歌單建議。 特別引人注目的是,用戶可以輕松地在ChatGPT應(yīng)用程序中繼續(xù)編輯和完善這些建議。演示中還包括了生成節(jié)日播放列表和專輯封面的有趣環(huán)節(jié),其中特別加入了一個“青蛙”元素。 這展示了ChatGPT的創(chuàng)意能力,也讓人想起蘋果遲遲難以上線的Emoji生成能力。 這場發(fā)布會最引人注目的環(huán)節(jié),就是ChatGPT為蘋果設(shè)備帶來的視覺智能能力。OpenAI團隊用一場即興的“圣誕毛衣大賽”來演示了這項技術(shù)。 當開發(fā)者長按iPhone的相機控制按鈕,ChatGPT就能實時分析畫面中的內(nèi)容。在演示中,系統(tǒng)不僅能識別出每個人身上毛衣的特征,還能以一種近乎幽默的方式為這些節(jié)日裝扮打分排名。 但ChatGPT最后宣布Sam Altman平平無奇的毛衣是最具“趣味性”的,全場都大跌眼鏡。看起來AI也會“向上管理”。 這項視覺集成的意義遠不止于此。它實際上彌補了蘋果AI系統(tǒng)最致命的短板之一。 要知道,在此之前,Siri的視覺識別能力一直是其軟肋,而現(xiàn)在通過與ChatGPT的合作,iPhone用戶可以隨時通過相機獲取周圍物體的深度信息和解釋。這種即時的視覺分析能力是蘋果向競爭對手低頭的象征——承認在某些領(lǐng)域,與其執(zhí)著于自研,不如尋求最好的合作伙伴。畢竟在國產(chǎn)手機AI系統(tǒng)都突飛猛進的當下,讓用戶再多等一年才能體驗到這個核心功能,風險太大。 但這次發(fā)布會演示的ChatGPT的視覺能力,與前兩天Greg Brockman給《60 Minutes》節(jié)目展示的能實時語音對話的ChatGPT視覺比起來,操作上顯得更麻煩。你得輸入文字,才能獲得回答。不知道是蘋果有意限制OpenAI,還是OpenAI的視覺能力還沒做好完全的準備。 在Mac端的演示就有些索然無味了。用戶只需在系統(tǒng)設(shè)置中啟用Apple intelligence,就能在macOS 15.2 Sequoia中使用ChatGPT擴展。 值得注意的是,用戶可以在幾乎任何應(yīng)用程序中喚醒Siri或?qū)懽鞴ぞ。通過雙擊命令鍵,就能調(diào)出Siri提示框,而當Siri判斷任務(wù)過于復(fù)雜時,系統(tǒng)會詢問是否需要ChatGPT的協(xié)助。 再一次,Siri干不了的,就直接讓渡給ChatGPT。 實際應(yīng)用場景中,團隊展示了如何處理一份49頁的系統(tǒng)文檔。用戶可以選擇分享整個PDF文件或僅分享截圖,ChatGPT能夠理解文檔內(nèi)容并回答相關(guān)問題。 所有對話都可以在ChatGPT桌面應(yīng)用中保存和繼續(xù),這種無縫的體驗正是這次整合的核心價值。 這次發(fā)布會的深層意義,遠超表面的技術(shù)整合。 它標志著科技行業(yè)格局的一次微妙轉(zhuǎn)變:OpenAI成功地將自己嵌入了全球最大消費級硬件生態(tài)系統(tǒng)的核心位置。 作為蘋果智能的“半官方”合作伙伴,OpenAI將直接觸達數(shù)十億蘋果設(shè)備用戶。這種觸達不是通過應(yīng)用商店的下載,而是作為系統(tǒng)級服務(wù)存在——每一次Siri的求助,每一次文檔處理的請求,都可能轉(zhuǎn)化為對ChatGPT的調(diào)用。對OpenAI而言,這種系統(tǒng)級的整合帶來的不僅是用戶數(shù)量的暴增,更是品牌認知的根本提升:從“一個熱門AI公司”變成“蘋果設(shè)備的默認AI大腦”。 這種轉(zhuǎn)變,某種程度上讓OpenAI獲得了類似ARM在移動處理器領(lǐng)域的地位。 而對始終標榜封閉生態(tài)的蘋果來說,這種妥協(xié)既是無奈,也是務(wù)實:與其在AI領(lǐng)域繼續(xù)落后,不如借助最好的工具來服務(wù)用戶。畢竟在商業(yè)競爭中,有時候開放比固守更能贏得未來。 OpenAI連續(xù)發(fā)布,反倒頹勢更顯 然而,就在這場溫馨的“相親發(fā)布會”進行前的一個小時,Google卻扔下了重磅炸彈。Gemini 2.0 Flash的發(fā)布,就像一位不速之客闖入了別人的派對,而且還帶來了讓所有人側(cè)目的禮物。 這個全新版本不僅在速度上實現(xiàn)了翻倍提升,還支持音頻與圖像的多模態(tài)輸出能力,讓它成了第一個接近實現(xiàn)原生雙向多模態(tài)的模型,這讓它對大模型行業(yè)的意義也是非比尋常。同時更強的原生工具使用能力,和由 Gemini 2.0 驅(qū)動的編碼Agent(Colab 和 Jules)系統(tǒng)更是讓昨天OpenAI的Canva展示顯得相形見絀。 回顧OpenAI這五天的發(fā)布會,除了第一天的o1之外,其他日子的發(fā)布似乎都缺少了那份令人驚嘆的創(chuàng)新。Sora的視頻生成固然出色,與Canva的合作也頗具戰(zhàn)略意義,但總給人一種“差了那么一點”的感覺。至于這次和蘋果的合作,與其說是技術(shù)突破,不如說是一場商業(yè)聯(lián)姻。那個充滿節(jié)日氣氛的倒數(shù)日歷,就像一個精心包裝卻缺乏驚喜的圣誕禮物,拆開后難掩失望。 OpenAI這12天馬拉松式的“AI嘉年華”發(fā)布會,現(xiàn)在看起來更像是一場精心設(shè)計的注意力管理戰(zhàn)役:通過持續(xù)不斷的小型更新來稀釋競爭對手可能帶來的沖擊。 通過將發(fā)布會拉長,用類似“圣誕倒數(shù)日歷”這樣富有節(jié)日氣氛的包裝,OpenAI試圖壟斷整個十二月的科技頭條。 然而,當Gemini 2.0帶著令人瞠目的性能提升和多模態(tài)能力華麗登場時,這個精心編織的注意力網(wǎng)似乎瞬間被撕開了一道口子。 在殘酷的科技競爭中,再精心的舞臺設(shè)計也掩蓋不了臺下正在發(fā)生的真正變革。 本文來源:騰訊科技 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選