微軟已經(jīng)有一段時(shí)間沒有向外界透露任何有關(guān)GenAI的訊息了。 在減少對OpenAI技術(shù)依賴的過程中,GenAI本該是微軟的重要戰(zhàn)略,但科技媒體The information了解到的微軟組織變革表明: 微軟在自主開發(fā)和訓(xùn)練生成式人工智能上遇到了瓶頸。 而同期微軟推出的AI相關(guān)的新工具,也佐證了其在生成式人工智能業(yè)務(wù)上的戰(zhàn)略轉(zhuǎn)向。 前途未卜的合成數(shù)據(jù)與蒸餾模型 今年的早些時(shí)候,微軟似乎在對先前內(nèi)部的一個(gè)名為「蒸餾」項(xiàng)目加倍投注。 這個(gè)項(xiàng)目的內(nèi)容大致為先使用OpenAI的模型生成大量數(shù)據(jù),然后再利用這些數(shù)據(jù)來訓(xùn)練類似ChatGPT的模型。 微軟的目標(biāo)是讓這些模型在某些任務(wù)上幾乎能達(dá)到與OpenAI模型相同的表現(xiàn),這樣微軟就可以根據(jù)自身的需要,對自己開發(fā)的模型進(jìn)行「公平市場價(jià)格」的定價(jià)和自由出售。 在人工智能的開發(fā)中,業(yè)內(nèi)幾乎都會(huì)使用某種形式的人工智能生成的訓(xùn)練數(shù)據(jù),即合成數(shù)據(jù)。 作為OpenAI的主要資助者,微軟擁有充分的自由來使用OpenAI的模型。 因此,微軟的研究人員能夠要求GPT-4生成數(shù)百萬段與教科書質(zhì)量類似的文本段落,包括文章和教科書風(fēng)格的練習(xí),這些練習(xí)附有解釋的問答內(nèi)容。 隨后,微軟便可以利用這些數(shù)據(jù)來訓(xùn)練一個(gè)較小但其性能表現(xiàn)與GPT-4相似的模型。 而大約從一年前開始,微軟就通過提煉OpenAI的模型開發(fā)了Phi。 Phi不僅開源,運(yùn)行成本也更低。 微軟研究人員在他們的論文中表示,雖然Phi的規(guī)模要小得多,但其性能幾乎可以與OpenAI的主要旗艦?zāi)P拖噫敲馈?/span> 微軟CEO納德拉將Phi形容為微軟在AI領(lǐng)域「掌握自己命運(yùn)」的一種方式。 他向股東們表示,Phi在Azure上與投資公司貝萊德、阿聯(lián)酋航空以及醫(yī)療軟件公司Epic等客戶進(jìn)行了合作。 在某些情況下,特別是當(dāng)問題相對簡單、不需要復(fù)雜解答時(shí),微軟用Phi替代了OpenAI 的模型,例如在Bing等產(chǎn)品中取代GPT-4作為AI聊天機(jī)器人。 在Phi初步成功之后,今年一月,微軟將負(fù)責(zé)Phi的首席研究員Sébastien Bubeck從微軟研究部門調(diào)往一個(gè)專注于構(gòu)建蒸餾模型的新組織。 同年三月,微軟以6.5億美元的協(xié)議聘請了Inflection的CEO 穆Mustafa Suleyman并讓他負(fù)責(zé)公司的消費(fèi)者AI業(yè)務(wù)后,Bubeck被調(diào)到了蘇萊曼所管理的微軟AI團(tuán)隊(duì)。 據(jù)兩位知情人士稱,他負(fù)責(zé)的是使用OpenAI的大型模型來生成訓(xùn)練數(shù)據(jù)。 然而,最近Bubeck已從Suleyman的團(tuán)隊(duì)離職,重新回到微軟研究部門,并再次向研究主管Peter Lee匯報(bào)工作。 而在八月,負(fù)責(zé)將Phi模型添加到Azure和其他微軟產(chǎn)品中的Misha Bilenko也離職前往了谷歌的DeepMind AI團(tuán)隊(duì)。 一位微軟AI研究員認(rèn)為,這些突如其來的人員變動(dòng)可能表明,Suleyman將不再把合成數(shù)據(jù)和蒸餾視為部門的發(fā)展方向以及微軟的首要目標(biāo)。 另一方面,今年五月被寄予期望的大型模型MAI-1毫無消息,且Suleyman團(tuán)隊(duì)之后也再也沒有公開發(fā)布過任何模型的情況,也佐證了這一戰(zhàn)略轉(zhuǎn)向。 微軟現(xiàn)如今依然要依靠OpenAI的模型來支持自己的人工智能服務(wù),據(jù)一些金融機(jī)構(gòu)的預(yù)測,微軟今年有望在Azure上通過轉(zhuǎn)售OpenAI的模型獲得超10億美元的收入。 值得在意的是,微軟近期推出了一項(xiàng)在Azure AI上的新服務(wù)—— 「校正」:人工智能幻覺的糾正工具 現(xiàn)階段阻礙生成式人工智能在現(xiàn)實(shí)中更廣泛地應(yīng)用落地的最大缺陷,就是「幻覺」(hallucinations)。 幻覺是指缺乏基礎(chǔ)數(shù)據(jù)支持的內(nèi)容的生成,輸出誤導(dǎo)性的信息。 這種現(xiàn)象尤其與大型語言模型( LLMs )相關(guān)。 在醫(yī)學(xué)、自動(dòng)駕駛等高風(fēng)險(xiǎn)領(lǐng)域,準(zhǔn)確的信息至關(guān)重要。 雖然人工智能有潛力改善對重要信息的獲取,但幻覺可能會(huì)導(dǎo)致誤解,造成嚴(yán)重的后果。 雖然業(yè)內(nèi)可以通過「過濾」來解決幻覺問題,但這種方法在輸出的文本因內(nèi)容被刪減或屏蔽而變得不連貫時(shí),會(huì)導(dǎo)致用戶體驗(yàn)不佳。 而微軟認(rèn)為,在Azure AI內(nèi)容安全的接地檢測(groundedness detection)中引入的一項(xiàng)新功能——校正(correction),能夠突破上述局限。 今年三月,微軟在Azure AI引入了接地檢測。它能夠?qū)⑷斯ぶ悄艿妮敵雠c原文檔進(jìn)行比較,以識別生成過程中的幻覺內(nèi)容。 但在用戶實(shí)際體驗(yàn)這項(xiàng)服務(wù)的過程中,一個(gè)疑問也隨之產(chǎn)生:「對這些檢測到的幻覺內(nèi)容除了屏蔽之外,我們還能做什么?」 為了解決這個(gè)問題,微軟在接地檢測中引入了校正功能,讓使用GenAI程序的用戶能夠遇到幻覺之前,實(shí)時(shí)識別和糾正幻覺。 但校正的運(yùn)作,需要程序連接到用于文檔摘要和給予RAG的接地文檔。 之后,Azure AI上的接地檢測將通過以下幾步運(yùn)行: 檢測:首先,Azure AI內(nèi)容安全會(huì)掃描AI生成內(nèi)容中的無根據(jù)部分。 幻覺現(xiàn)象并不是一個(gè)完全有或完全無的問題,大多數(shù)無根據(jù)的輸出實(shí)際上也包含了一些有根據(jù)的內(nèi)容。 這就是為什么有根據(jù)性檢測可以精確找到無根據(jù)內(nèi)容的具體部分。 當(dāng)無根據(jù)的內(nèi)容被識別出來后,模型會(huì)高亮顯示具體不正確、不相關(guān)或虛構(gòu)的文本。 推理:在識別出無根據(jù)的段落后,模型會(huì)生成解釋說明,說明為什么某些文本被標(biāo)記。 這種透明性非常重要,因?yàn)樗梢宰層脩裘鞔_無根據(jù)的點(diǎn),并評估其不接地的嚴(yán)重性。 修正:一旦無根據(jù)的內(nèi)容被標(biāo)記,系統(tǒng)會(huì)實(shí)時(shí)啟動(dòng)改寫過程。被標(biāo)記為不準(zhǔn)確的部分會(huì)被修改,以確保與相關(guān)數(shù)據(jù)源保持一致。 但如果該句子缺少任何與基礎(chǔ)文件相關(guān)的內(nèi)容,則可能會(huì)被完全過濾掉。 而在用戶看到最初的無根據(jù)內(nèi)容之前,修正就已經(jīng)完成。 輸出:最后,修正后的內(nèi)容將返回給用戶。 但微軟強(qiáng)調(diào),該工具提高的是人工智能生成的內(nèi)容和源材料之間的一致性,它并不能保證生成的內(nèi)容可以到達(dá)完美的準(zhǔn)確性。 畢竟最根本的是數(shù)據(jù)來源的真實(shí)性和客觀性;蛟S,這也是微軟決定內(nèi)部戰(zhàn)略轉(zhuǎn)向的原因。 而在構(gòu)建值得信賴的人工智能的道路上,業(yè)界的開發(fā)者們還需要更多不同的嘗試。 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選