自美國(guó)當(dāng)?shù)貢r(shí)間12月5日起,OpenAI開(kāi)啟了一輪密集的新功能發(fā)布周期,計(jì)劃在接下來(lái)的12天內(nèi)通過(guò)12場(chǎng)直播活動(dòng)陸續(xù)推出新產(chǎn)品和功能。在此之前,OpenAI已經(jīng)陸續(xù)發(fā)布了多項(xiàng)創(chuàng)新,包括滿血版o1模型、ChatGPT Pro計(jì)劃、強(qiáng)化微調(diào)技術(shù)、視頻生成工具Sora、交互界面Canvas、高級(jí)語(yǔ)音視覺(jué)功能、智能文件夾Projects以及向全體ChatGPT用戶開(kāi)放ChatGPT搜索功能等。 12月18日,也就是在OpenAI發(fā)布會(huì)進(jìn)行到第九天時(shí),該公司正式宣布,將通過(guò)其應(yīng)用程序編程接口(API)向第三方開(kāi)發(fā)者開(kāi)放其尖端大模型o1系列。這一消息對(duì)開(kāi)發(fā)者而言無(wú)疑是巨大的福音,因?yàn)樗麄兛释麡?gòu)建全新的高級(jí)人工智能應(yīng)用程序,或者將OpenAI的最先進(jìn)技術(shù)融入他們現(xiàn)有的應(yīng)用程序和工作流程之中,無(wú)論這些應(yīng)用是面向企業(yè)還是消費(fèi)者。 OpenAI的o1系列模型于2024年9月發(fā)布,作為公司“新家族”系列中的首款力作,它超越了GPT系列大語(yǔ)言模型(LLM)的范疇,并引入了“推理”功能。 o1系列模型包括o1和o1 mini,雖然需要更長(zhǎng)的時(shí)間來(lái)響應(yīng)用戶提示并生成答案,但它們?cè)谛纬纱鸢傅倪^(guò)程中會(huì)進(jìn)行自我校驗(yàn),確保答案的準(zhǔn)確性,并有效避免產(chǎn)生“幻覺(jué)”。發(fā)布時(shí),OpenAI就宣稱o1能夠處理更為復(fù)雜、達(dá)到博士水平的問(wèn)題,這一點(diǎn)也在用戶的實(shí)際反饋中得到了驗(yàn)證。 盡管開(kāi)發(fā)者們此前已經(jīng)能夠訪問(wèn)o1的預(yù)覽版本,并在此基礎(chǔ)上開(kāi)發(fā)自己的應(yīng)用程序,如博士顧問(wèn)或?qū)嶒?yàn)室助理等,但通過(guò)API發(fā)布的完整o1模型帶來(lái)了更高的性能、更低的延遲以及新功能,使其更加便于集成到實(shí)際的應(yīng)用場(chǎng)景中。 大約兩周半之前,OpenAI已經(jīng)通過(guò)ChatGPT Plus和ChatGPT Pro計(jì)劃向消費(fèi)者推出了o1模型,并增加了模型分析以及響應(yīng)用戶上傳的圖像和文件的功能。 在今日發(fā)布的同時(shí),OpenAI還宣布了其實(shí)時(shí)API的重大更新,以及降價(jià)策略和新的微調(diào)方法,旨在幫助開(kāi)發(fā)者更好地掌控他們的模型。 開(kāi)放完整o1模型 新推出的o1模型內(nèi)部編號(hào)為o1-2024-12-17,特別設(shè)計(jì)用于處理復(fù)雜的多步驟推理任務(wù)。與早期的o1預(yù)覽版本相比,這一版本在準(zhǔn)確性、效率和靈活性方面均實(shí)現(xiàn)了顯著提升。 OpenAI公布了一系列基準(zhǔn)測(cè)試的結(jié)果,展示了新模型在編碼、數(shù)學(xué)和視覺(jué)推理任務(wù)上的顯著進(jìn)步。例如,在SWE-bench Verified(旨在通過(guò)更可靠方法評(píng)估人工智能模型解決現(xiàn)實(shí)世界軟件問(wèn)題能力的基準(zhǔn)測(cè)試)中,o1的編碼結(jié)果從41.3提升至48.9。而在以數(shù)學(xué)為重點(diǎn)的AIME測(cè)試中,o1的性能更是從42躍升至79.2。這些顯著的改進(jìn)使得o1成為構(gòu)建簡(jiǎn)化客戶支持流程、優(yōu)化物流解決方案或解決挑戰(zhàn)性分析問(wèn)題的理想工具。 此外,o1還新增了幾個(gè)特性,進(jìn)一步增強(qiáng)了其為開(kāi)發(fā)者提供的功能。結(jié)構(gòu)化輸出功能允許模型的響應(yīng)能夠可靠地匹配自定義格式(如JSON模式),從而確保與外部系統(tǒng)交互時(shí)的一致性和準(zhǔn)確性。函數(shù)調(diào)用功能的引入則簡(jiǎn)化了o1連接到API和數(shù)據(jù)庫(kù)的過(guò)程,使得集成更加便捷。同時(shí),o1還具備了在視覺(jué)輸入上進(jìn)行推理的能力,這一特性在制造、科學(xué)和編碼等領(lǐng)域開(kāi)辟了新的應(yīng)用場(chǎng)景。 為了讓開(kāi)發(fā)者能夠更精細(xì)地控制o1的行為,OpenAI還推出了新的reasoning_effort參數(shù)。該參數(shù)允許開(kāi)發(fā)者根據(jù)任務(wù)需求調(diào)整模型在任務(wù)上花費(fèi)的時(shí)間,從而在性能和響應(yīng)時(shí)間之間找到最佳平衡點(diǎn)。 OpenAI的實(shí)時(shí)API迎來(lái)升級(jí) 為智能會(huì)話語(yǔ)音/音頻AI助手提供支持 OpenAI還宣布了其實(shí)時(shí)API的重大更新,旨在支持低延遲、自然的會(huì)話體驗(yàn),如語(yǔ)音助手、實(shí)時(shí)翻譯工具或虛擬導(dǎo)師等應(yīng)用場(chǎng)景。 此次更新中,新的WebRTC集成成為一大亮點(diǎn)。它直接支持音頻流、噪聲抑制和擁塞控制,極大地簡(jiǎn)化了基于語(yǔ)音的應(yīng)用程序的構(gòu)建過(guò)程。開(kāi)發(fā)者現(xiàn)在只需進(jìn)行最小化的設(shè)置,即可集成實(shí)時(shí)功能,即使在多變的網(wǎng)絡(luò)環(huán)境下也能保持穩(wěn)定的性能。 在定價(jià)方面,OpenAI也推出了新的策略,使得GPT-4o音頻的成本降低了60%。具體而言,每100萬(wàn)輸入Tokens的費(fèi)用為40美元,每100萬(wàn)輸出Tokens的費(fèi)用為80美元。同時(shí),緩存音頻輸入的成本也降低了87.5%,現(xiàn)在的定價(jià)為每100萬(wàn)輸入Tokens 2.5美元。 為了進(jìn)一步提高性價(jià)比,OpenAI還推出了GPT-4o mini,這是一種更小、更具成本效益的模型。其價(jià)格更為親民,每100萬(wàn)輸入Tokens的費(fèi)用為10美元,每100萬(wàn)輸出Tokens的費(fèi)用為20美元。此外,GPT-4o mini的文本Tokens費(fèi)率也相對(duì)較低,輸入Tokens的起始價(jià)格為0.60美元,輸出Tokens的起始價(jià)格為2.40美元。 除了定價(jià)方面的調(diào)整,OpenAI還賦予了開(kāi)發(fā)者對(duì)實(shí)時(shí)API響應(yīng)的更多控制權(quán)。例如,并發(fā)的帶外響應(yīng)等特性允許后臺(tái)任務(wù)(如內(nèi)容審核)在不干擾用戶體驗(yàn)的情況下運(yùn)行。開(kāi)發(fā)者還可以根據(jù)實(shí)際需求定制輸入上下文,專注于對(duì)話的特定部分,并控制語(yǔ)音響應(yīng)的觸發(fā)時(shí)機(jī),從而實(shí)現(xiàn)更準(zhǔn)確、更無(wú)縫的交互體驗(yàn)。 偏好微調(diào)提供了新的自定義選項(xiàng) 另一個(gè)重要的新增功能是偏好微調(diào),這是一種創(chuàng)新的模型定制方法,能夠根據(jù)用戶和開(kāi)發(fā)者的偏好來(lái)優(yōu)化模型表現(xiàn)。 與傳統(tǒng)的依賴于精確輸入輸出的監(jiān)督式微調(diào)不同,偏好微調(diào)采用成對(duì)比較的方式來(lái)指導(dǎo)模型選擇更優(yōu)的響應(yīng)。這種方法在處理主觀性較強(qiáng)的任務(wù)時(shí)尤為有效,例如總結(jié)、創(chuàng)造性寫作或是語(yǔ)氣和風(fēng)格更重要的應(yīng)用場(chǎng)景。 與Rogo AI等合作伙伴的早期測(cè)試已經(jīng)展現(xiàn)出了偏好微調(diào)的巨大潛力。Rogo AI致力于打造專為金融分析師服務(wù)的助手,他們報(bào)告稱,與傳統(tǒng)的微調(diào)方法相比,偏好微調(diào)顯著提升了模型處理復(fù)雜、超出分布范圍查詢的能力,任務(wù)準(zhǔn)確率提高了5%以上。這一功能目前已在GPT-4o-2024-08-06和GPT-4o-mini-2024-07-18模型中可用,并計(jì)劃于明年初擴(kuò)展至更多新模型上。 面向Go和Java開(kāi)發(fā)者的新SDK 為了進(jìn)一步優(yōu)化集成流程,OpenAI正拓展其官方SDK產(chǎn)品線,現(xiàn)推出Go和Java版本的測(cè)試版SDK。這些新增的SDK與現(xiàn)有的Python、Node.js和.NET庫(kù)相輔相成,極大地拓寬了開(kāi)發(fā)者在不同編程環(huán)境中與OpenAI模型進(jìn)行交互的便利性。Go SDK在構(gòu)建可擴(kuò)展的后端系統(tǒng)方面展現(xiàn)出獨(dú)特優(yōu)勢(shì),而Java SDK則專為依賴強(qiáng)類型和穩(wěn)健生態(tài)系統(tǒng)的企業(yè)級(jí)應(yīng)用而設(shè)計(jì)。 通過(guò)這一系列更新,OpenAI為開(kāi)發(fā)者配備了一個(gè)功能更為全面的工具箱,旨在助力他們開(kāi)發(fā)出先進(jìn)且高度可定制的人工智能應(yīng)用程序。無(wú)論是利用o1模型增強(qiáng)的推理能力,還是實(shí)時(shí)API的顯著增強(qiáng),亦或是靈活多樣的微調(diào)選項(xiàng),OpenAI的最新產(chǎn)品均致力于為企業(yè)提供更卓越的性能表現(xiàn)和更高的成本效益,從而不斷擴(kuò)大人工智能集成的邊界。(騰訊科技特約編譯金鹿) 本文來(lái)源:騰訊科技 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來(lái)者必須面對(duì)越來(lái)越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。