首頁 > 科技要聞 > 科技> 正文

奧特曼:自認(rèn)比o1聰明請(qǐng)舉手到o2還這么想么?

量子位 整合編輯:太平洋科技 發(fā)布于:2024-10-08 14:28

這一幕,最近在OpenAI開發(fā)者日最后一個(gè)環(huán)節(jié)——奧特曼爐邊談話中上演。

對(duì)話由奧特曼和OpenAI首席產(chǎn)品官Kevin Weil進(jìn)行,奧特曼還對(duì)未來作出如下判斷:

無限上下文長(zhǎng)度將在十年內(nèi)發(fā)生

o1正在推動(dòng)智能體應(yīng)用,人們將要求AI在一小時(shí)內(nèi)完成以前人類數(shù)月或數(shù)年的工作

然后每個(gè)人將擁有10個(gè)智能體,再然后擁有1000個(gè)

擔(dān)心科幻(Sci-fi)是我們最重要的事之一

除此之外,活動(dòng)上宣布了OpenAI API大量重磅更新:

實(shí)時(shí)語音API:每個(gè)APP里都可以擁有“Her”

視覺微調(diào)API:只需100張圖提升GPT-4o特定任務(wù)圖像理解能力

自動(dòng)提示詞緩存:模型最近見過的輸入tokens統(tǒng)統(tǒng)打5折

模型蒸餾API:用前沿模型的輸出微調(diào)GPT-4o mini

圍繞這些功能的精彩現(xiàn)場(chǎng)演示,也引起眾人圍觀。

比如GPT-4o驅(qū)動(dòng)的實(shí)時(shí)語音API, 配合函數(shù)調(diào)用+Twillio(云通訊服務(wù)),可以直接打電話訂外賣了。

訂購400個(gè)草莓裹巧克力醬甜點(diǎn),參會(huì)者人人都有的吃。

看起來演示現(xiàn)場(chǎng)是OpenAI員工在臺(tái)上扮演食品店員工,真正的訂購過程是在幕后完成。

沒過一會(huì),還有人曬會(huì)場(chǎng)外草莓快被領(lǐng)完了。

最新發(fā)布的推理大模型o1也露了一手,從頭編程操控?zé)o人機(jī),現(xiàn)場(chǎng)蕪湖起飛。

這邊大會(huì)辦得熱鬧,與OpenAI相關(guān)的周邊消息也不斷傳出:

剛剛離職的幾位中,前研究VP Barret Zoph已決定要成立一家新公司

前CTO Mira Murati還沒宣布下一步要干什么,但投資人開始圍追堵截她,希望她盡快成立自己的公司。

還有一位此前已離職的OpenAI聯(lián)合創(chuàng)始人Durk Kingma,宣布加入隔壁Anthropic。

OpenAI開發(fā)者日

與去年相比,今年的OpenAI開發(fā)者日活動(dòng)不再現(xiàn)場(chǎng)直播,并拆分成三部分在不同地點(diǎn)舉辦(美國(guó)、英國(guó)、新加坡)。

剛剛在舊金山舉辦的第一場(chǎng),宣布了多項(xiàng)API更新。

Realtime API

實(shí)時(shí)語音API為公開測(cè)試版,所有開發(fā)者都能在自己的APP中構(gòu)建與ChatGPT高級(jí)語音模式類似的體驗(yàn)。

價(jià)格也不貴,每分鐘音頻輸入約0.06美元,每分鐘音頻輸出約0.24美元。

語言學(xué)習(xí)應(yīng)用Speak已使用Realtime API開發(fā)AI角色扮演練口語功能。

此外還在Chat Completions API中增加了音頻輸入和輸出,可以用在對(duì)時(shí)延要求不高的地方,將在未來幾周內(nèi)作為gpt-4o-audio-preview發(fā)布。

視覺微調(diào)

開發(fā)者現(xiàn)在可以用圖像對(duì)GPT-4o微調(diào),以提高視覺能力。

可以用來增強(qiáng)視覺搜索功能、改進(jìn)自動(dòng)駕駛汽車或智能城市的物體檢測(cè)以及更準(zhǔn)確的醫(yī)學(xué)圖像分析等應(yīng)用。

外賣和共享出行公司Grab,將車道計(jì)數(shù)的準(zhǔn)確性提高20%,將限速標(biāo)志的定位提高13%。

在UI設(shè)計(jì)上,微調(diào)過的GPT-4o生成的網(wǎng)頁區(qū)域也能更好匹配整個(gè)頁面的風(fēng)格。

視覺微調(diào)的過程與文本微調(diào)類似,按照OpenAI指定的格式準(zhǔn)備圖像數(shù)據(jù)集,然后將數(shù)據(jù)集上傳到OpenAI開發(fā)平臺(tái)

只需使用100張圖像就能提高GPT-4o在視覺任務(wù)中的性能,當(dāng)然用的更多提升也能更大。

GPT-4o的微調(diào)費(fèi)用為$25/100萬tokens,微調(diào)后推理費(fèi)用為每 100 萬個(gè)輸入tokens 3.75美元,每100萬個(gè)輸出令牌15美元。

不過在2024年10月31日之前,每天免費(fèi)為視覺微調(diào)提供100萬個(gè)訓(xùn)練token。

羊毛薅起來~

提示詞緩存

許多開發(fā)者在構(gòu)建人工智能應(yīng)用程序時(shí),會(huì)在多個(gè)API調(diào)用中重復(fù)使用相同的上下文,例如在編輯代碼庫或與聊天機(jī)器人進(jìn)行長(zhǎng)時(shí)間、多輪對(duì)話時(shí)。

提示詞緩存功能可以在降低成本的同時(shí)降低推理延遲。

OpenAI推出這個(gè)功能是比較晚的,此前谷歌Gemini、Claude,以及國(guó)內(nèi)DeepSeek,Kimi等都已上線。

不過OpenAI搞出來的特色在于:一切都是自動(dòng)的。

從今天起,提示詞緩存已適配最新版本的GPT-4o、GPT-4o mini、o1-preview和o1-mini,以及這些模型的微調(diào)版本。

只要是AI見過的token,自動(dòng)統(tǒng)統(tǒng)打五折。

緩存將在閑置5-10分鐘后清除,最多保留1小時(shí)。

模型蒸餾

讓開發(fā)者可以用o1-preive和GPT-4o等前沿模型的輸出,對(duì)GPT-4o mini等小模型微調(diào)。

此前,模型蒸餾是一個(gè)多步驟、易出錯(cuò)的過程,需要開發(fā)人員在互不關(guān)聯(lián)的工具中手動(dòng)協(xié)調(diào)多個(gè)操作,從生成數(shù)據(jù)集到微調(diào)模型和評(píng)估性能。

由于蒸餾本質(zhì)上是迭代的,需要反復(fù)運(yùn)行每個(gè)步驟,大大增加了工作量和復(fù)雜性。

這次OpenAI推出了新的集成工作流程,可自動(dòng)獲得前沿模型生成的輸入-輸出對(duì)、運(yùn)行自定義評(píng)估、以及完成微調(diào)。

同樣在10月31日之前,在GPT-4o mini上每天提供200萬個(gè)免費(fèi)培訓(xùn)token,在GPT-4o上每天提供100萬個(gè)免費(fèi)訓(xùn)練token

離職高管被資本熱捧,聯(lián)創(chuàng)加入Claude團(tuán)隊(duì)

OpenAI持續(xù)發(fā)布新模型、新功能的壓力,讓OpenAI內(nèi)部研究和安全團(tuán)隊(duì)疲于奔命,難以跟上步伐。

此前已有消息證實(shí)GPT-4o發(fā)布前,團(tuán)隊(duì)只有9天時(shí)間做安全評(píng)估,每天工作20多個(gè)小時(shí)。

財(cái)富雜志最新消息表示,o1發(fā)布前也遇到了同樣的情況,并且在公司高層之間引發(fā)了摩擦

許多向前CTO Mira Murati匯報(bào)工作的團(tuán)隊(duì)都認(rèn)為o1還沒有做好發(fā)布的準(zhǔn)備,還沒有真正形成產(chǎn)品,不過他們的反對(duì)意見被駁回了。

除了奧特曼之外唯一還在的聯(lián)創(chuàng)Woijceich Zarembra發(fā)聲,承認(rèn)了在o1開發(fā)階段他和后訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人Barret Zoph發(fā)生激烈沖突,但沒有透露詳細(xì)細(xì)節(jié)。

現(xiàn)在后訓(xùn)練團(tuán)隊(duì)仍在繼續(xù)完善o1,但Barret Zoph已經(jīng)辭職了。

Barret Zoph目前表示將成立一家新公司,但目前尚不清楚他具體會(huì)做什么,也不清楚他是否會(huì)和Murati合作。

再看Murati這邊,她本人還沒有宣布下一步任何計(jì)劃,但投資人爭(zhēng)相與她會(huì)面,希望她盡快創(chuàng)辦自己的公司。

據(jù)Business Insider消息,許多投資人正在試圖接近她,即使以前沒有聯(lián)系過的也會(huì)給她發(fā)冷郵件。

作為去年11月奧特曼被短暫趕下臺(tái)的余波,OpenAI高層持續(xù)動(dòng)蕩,已經(jīng)流失不少研究和管理人才。

與此同時(shí),OpenAI 一直在瘋狂招聘,規(guī)模相比去年擴(kuò)大了一倍多,員工人數(shù)從不到800人增加到1800人。

有老員工開始抱怨:新員工的涌入改變了OpenAI的氛圍和文化。

關(guān)于研究的對(duì)話少了,關(guān)于產(chǎn)品或向社會(huì)部署的對(duì)話多了。

離職的OpenAI研究人才中,有相當(dāng)一部分去了隔壁Anthropic。

聯(lián)合創(chuàng)始人John Schulman、超級(jí)對(duì)齊負(fù)責(zé)人Jan Leike跳槽加入之后,Anthropic又吸引來一位早年已經(jīng)離職的OpenAI聯(lián)創(chuàng)Durk Kingma。

Durk Kingma博士畢業(yè)于阿姆斯特丹大學(xué),師從機(jī)器學(xué)習(xí)大牛Max Welling。

兩人合作開發(fā)了變分自編碼器VAE,相關(guān)論文于今年獲得ICLR首屆時(shí)間檢驗(yàn)獎(jiǎng)。

Durk Kingma于2018年離開OpenAI,做了一段時(shí)間天使投資人,后加入谷歌大腦,再后來被合并進(jìn)了Google DeepMind。

這次他加入Anthropic將主要在荷蘭遠(yuǎn)程辦公,沒有透露他將具體加入哪個(gè)團(tuán)隊(duì)或負(fù)責(zé)哪部分工作。

總之OpenAI變得不像以前的自己,但隔壁Anthropic越來越像以前的OpenAI了。

還有人提出,如果去年11月奧特曼真的下臺(tái)了,OpenAI現(xiàn)在會(huì)不會(huì)更好呢?

健康的公司,有優(yōu)秀的CEO,不會(huì)用報(bào)酬威脅員工簽封口協(xié)議,也不會(huì)有高管辭職,更不會(huì)有那么多丑聞。

本文來源:量子位

OpenAI    API    奧特曼
量子位

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
極氪“流血”上市,最急的是埃安、哪吒?jìng)?

在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來者必須面對(duì)越來越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。

劉凡 劉凡 2024-05-11 11:26
極氪   吉利   哪吒   埃安
  • 二維碼 回到頂部