太平洋科技要聞

首頁 > 科技要聞 > 科技> 正文

再不做AI應用，大模型靠什么贏？

鈦媒體整合編輯：龔震發(fā)布于：2024-04-18 18:00

成熟的“格子衫”和年輕的“臉龐”，與開發(fā)者有關的大會總是少不了這兩種元素，Create 2024百度AI開發(fā)者大會也不例外。

過去幾十年，層出不窮的編程語言、框架等新技術，把一代又一代年輕的臉龐，塑造為成熟的格子衫，軟件應用開發(fā)的效率確實在提升，但卻總是跟不上龐大而又繁雜的需求，似乎開發(fā)者將永遠陷入在這樣的循環(huán)。

直到大模型的出現(xiàn)。

“你只要會說話，就可以成為一名開發(fā)者，用自己的創(chuàng)造力改變世界。”百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏言之鑿鑿。

擲地有聲。成熟的格子衫還在思考，話語有幾分可信與其間難題，年輕的臉龐已經深信不疑，迫切想要聽到該如何“說話”，才能成為新時代的開發(fā)者。

基礎大模型的確炫人眼目，大部分人如今還沉浸在基礎模型層面，但是時候把更多目光聚焦在應用層面，先是大模型等新技術為應用場景提供了新的可能性，接下來就是軟件應用生態(tài)的繁榮，去推大模型的再次提升。

而百度正在做的事，就是掃平大模型和應用之間的障礙，這也是本次開發(fā)者大會，百度拿出的三大工具——智能體開發(fā)工具AgentBuilder、AI原生應用開發(fā)工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。

大模型，應用為王

“大語言模型本身并不直接創(chuàng)造價值，基于大模型開發(fā)出來的AI應用才能滿足真實的市場需求。”李彥宏表示。

正如李彥宏所言，過去一年，大模型足夠讓人側目，例如百度文心大模型，從3.0版本到3.5，再到4.0版本的進化，在代碼生成、代碼解釋、代碼優(yōu)化等通用能力方面，達到國際領先水平。

文心大模型已經成為了中國最領先、應用最廣泛的AI基礎模型。不僅如此，相比一年前，文心大模型的算法訓練效率提升到了原來的5.1倍，周均訓練有效率達到98.8%，推理性能提升了105倍，推理的成本降到了原來的1%。

但僅靠大模型還不足以催生出新的業(yè)態(tài)，就像互聯(lián)網(wǎng)起初只是一種技術概念，而互聯(lián)網(wǎng)應用融入到千行百業(yè)的場景，造就了如今耳熟能詳?shù)幕ヂ?lián)網(wǎng)巨頭。“他們”沒有發(fā)明互聯(lián)網(wǎng)技術，也沒有在互聯(lián)網(wǎng)的底層基礎設施做文章，卻是把互聯(lián)網(wǎng)用得最好的代表。

百度為開發(fā)者提供的大模型，就像是過去的互聯(lián)網(wǎng)，百度有動力也有必要，提供盡可能好的大模型，從而為大模型應用開發(fā)者打好基礎。

可以想象，百度沖在大模型第一線，踩坑是免不了的。李彥宏也直言，百度“踩了無數(shù)的坑，交了高昂的學費”，得出了一些基于大模型開發(fā)AI原生應用的具體思路和工具，直接分享給行業(yè)。

第一是MoE。未來大型的AI原生應用基本都是MoE架構，這里所說的MoE不是一般的學術概念，而是大小模型的混用，不依賴一個模型來解決所有問題。但什么時候調用小模型、什么時候調用大模型、什么時候不調用模型，要針對應用的不同場景做匹配。

第二是小模型。小模型推理成本低，響應速度快，在一些特定場景中，經過SFT精調后的小模型，其使用效果可以媲美大模型。

“這就是我們發(fā)布Speed，Lite、Tiny三個輕量模型的原因。我們通過大模型，壓縮蒸餾出來一個基礎模型，然后再用數(shù)據(jù)去訓練，這比從頭開始訓小模型，效果要好很多，比基于開源模型訓出來的模型效果更好，速度更快，成本更低。”李彥宏說。

第三是智能體。智能體是當下很熱的一個話題，隨著智能體能力的提升，會不斷催生出大量新的應用。

智能體機制，包括理解、規(guī)劃、反思和進化，它讓機器像人一樣思考和行動，可以自主完成復雜任務，在環(huán)境中持續(xù)學習、實現(xiàn)自我迭代和進化。在一些復雜系統(tǒng)中，還可以讓不同的智能體互動，相互協(xié)作，更高質量地完成任務。這些智能體能力，反思、規(guī)劃、自我計劃的能力，百度已經開發(fā)并向開發(fā)者全面開放。

AI應用開發(fā)三大“神器”

李彥宏表示，大模型和生成式AI，將徹底改變開發(fā)者群體。過去，開發(fā)者用代碼改變世界；未來，自然語言將成為新的通用編程語言。

與之相對應地，開發(fā)者的武器庫也需要與時俱進，以適應新時代的軟件開發(fā)體系，同時針對MoE、小模型、智能體這三大方向上，百度已經做好了“開箱即用”的工具。

AgentBuilder：最主流的大模型使用方式

首先是智能體開發(fā)工具AgentBuilder。智能體可能是未來離每個人最近、最主流的大模型使用方式，基于強大的基礎模型，智能體可以批量生成，應用在各種各樣的場景。

以新加坡旅游局為例，打開文心智能體平臺，創(chuàng)建頁面有著零代碼、低代碼兩種模式，新手可以直接選擇“零代碼模式”，用自然語言，幾句話就能創(chuàng)建一個智能體，實現(xiàn)酒店查詢、景點門票購買等服務能力，目前百度已經跟攜程合作，提供了酒店、景點、票務等旅游服務工具。

新加坡之外，大連、沈陽等文旅類智能體也都在文心智能體平臺上線，還有知識類、創(chuàng)作類、學習類、娛樂類等各式各樣的智能體。

目前，已經有3萬多個智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。文心智能體平臺還為開發(fā)者們提供了流量變現(xiàn)的通路。除了百度搜索，百度生態(tài)的其他產品，如小度、地圖、貼吧、車機等，都能接入智能體的相關能力，為開發(fā)者解決流量分發(fā)的后顧之憂，獲得實打實的收益。

有分發(fā)，就會有數(shù)據(jù)反饋；有數(shù)據(jù)反饋，飛輪轉起來，智能體就能夠自主迭代，越用越聰明。文心智能體平臺還上線了智能體的數(shù)據(jù)分析和問答調優(yōu)模塊，不久后還將有更多的新能力上線。文心智能體平臺將通過分發(fā)-診斷-收益的數(shù)據(jù)飛輪，驅動智能體形成質量更優(yōu)、流量更好、收益更大的正循環(huán)。

除了新加坡之外，大連、沈陽等文旅類智能體也都在文心智能體平臺上線，還有知識類、創(chuàng)作類、學習類、娛樂類等各式各樣的智能體，這些都能在AgentBuilder做出來。

AppBuilder：自然語言三步就能開發(fā)一個應用

AppBuilder提前封裝和預置了開發(fā)AI原生應用所需的各種組件和框架，可以大幅降低開發(fā)門檻，不寫一行代碼，最快只需三步，開發(fā)者就可以用自然語言開發(fā)出一個AI原生應用，并且能夠便捷地發(fā)布、集成到各種各樣的業(yè)務環(huán)境中。

以游樂場排隊助手為例，打開AppBuilder的開發(fā)界面，第一步先給應用起名“游樂場排隊助手”，第二步填寫角色指令，包括調用代碼解釋器、算出在固定時間內的最佳組合、輸出結果等；第三步再插入需要的工具組件。這樣，在零代碼的情況下，一個應用就生成了。

從去年開始，百度用AI重構了百度文庫，使它成為用戶“內容生產的起點”。如今，在AppBuilder的支持下，百度文庫新推出的智能漫畫和智能繪本，更是把場景延伸到了更加有趣的跨模態(tài)創(chuàng)作領域。

在AppBuilder上面，百度也提供了一定的跨模態(tài)能力，開發(fā)者只需要給一段文字，或者幾句話，就可以快速創(chuàng)建繪畫類的應用，像漫畫、兒童繪本等。百度文庫最新推出的漫畫生成和繪本生成功能，就利用了AppBuilder上提供的這類組件。

從行業(yè)視角來看，百度AppBuilder具備兩個明顯優(yōu)勢：

一是功能強大。依托文心4.0對指令的理解和遵循能力，百度AppBuilder能保證冷啟動狀態(tài)下就能達到一個不錯的水平，不會因為效果差，再花很長時間去調優(yōu)，大大降低了開發(fā)門檻。

依托檢索增強技術RAG，在知識問答等典型場景，問答準確率和友好回復程度都達到了95%以上，大幅超越其他同類產品。AppBuilder還提供豐富完整的組件工具，包括百度搜索等基于百度多年技術積累的AI能力組件、大模型能力組件，還有百度獨家開放的業(yè)務組件等55個組件。

此外，一些主流場景的第三方API，比如航班查詢、論文查詢等，百度也有提供，最新支持了自定義組件，客戶可以直接對接自己專有的任何工具和數(shù)據(jù)。這些豐富的組件，共同支撐起了AI原生應用的高效開發(fā)。

二是簡單易用。使用AppBuilder，只需三步即可快速創(chuàng)建應用、一鍵分發(fā)。百度也支持開源的SDK，方便大家進行二次開發(fā)。

ModelBuilder：高效低價生產模型

ModelBuilder是更適合專業(yè)開發(fā)者使用的工具，它可以根據(jù)開發(fā)者的需求定制任意尺寸的模型，并根據(jù)細分場景對模型進一步精調SFT，從而能達到更好的效果。

為了方便專業(yè)開發(fā)者快速上手，ModelBuilder預置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0旗艦版大模型，它適合通用的復雜場景，能力強大；

此外還有三個輕量級的大模型，Speed、Lite、Tiny；以及兩個垂直場景的模型——ERNIE Character適合角色扮演，ERNIE Functions適合對話或問答場景中的外部工具使用和業(yè)務函數(shù)調用。當然也包括國內外第三方主流模型，總數(shù)量達到77個，ModelBuilder是國內擁有大模型數(shù)量最多的開發(fā)平臺。

以小度添添AI機器人日程規(guī)劃為例，背后調用了不同的模型。先是由小模型ERNIE Tiny執(zhí)行了“模型路由”的工作——把晨跑中的天氣問題，分配給了基于ERNIE Lite打造的精調模型，快速查詢出了氣溫25度、天氣晴朗這些信息；同時，又把更復雜的日程安排，分配給了性能最好的大模型——文心4.0，來計算一天各項事項安排。

ModelBuilder的關鍵是高效低價生產模型的能力。企業(yè)客戶可以根據(jù)需要，兼顧效果、響應速度、推理成本等各種考慮，裁剪出適合各種場景的更小尺寸模型，并且支持精調和Post-pretrain。

通過降維裁剪出來的模型，比直接拿開源調出來的模型，同等尺寸下，效果明顯更好，同等效果下，成本明顯更低。

AI應用繁榮，大模型才能再進化

大模型到了聚合生態(tài)力量的新階段，無論是國內還是國外，頭部廠商都在試圖打造新的大模型生態(tài)，AI應用的繁榮不僅能夠證明大模型的價值，也能夠反過來推動大模型的再進化。

當AI應用大量被創(chuàng)造，越來越多的數(shù)據(jù)被生成和收集，模型有更多的機會學習到不同場景下的應用知識；規(guī)�；瘞韺Ｓ糜布钠占昂托阅芴嵘�，使得訓練和運行大模型變得更加可行和高效；多樣化的應用場景帶來正向商業(yè)收益，商業(yè)成功將轉化為AI應用和大模型的資源。

百度文心大模型正在走上這一條路，用大模型和AI應用的相互促進，實現(xiàn)大模型生態(tài)的正向商業(yè)循環(huán)。

李彥宏表示，文心大模型已經成為了中國最領先、應用最廣泛的AI基礎模型。百度在芯片、框架、模型、應用這四層架構上有著全棧的布局，通過端到端優(yōu)化，不斷地把成本打下來，讓更多人都可以高效、低價地用大模型來做AI應用，通過端到端優(yōu)化能力，不斷提高文心大模型和文心一言的效率。

“實戰(zhàn)是大模型最好的訓練場，龐大的調用量將給予文心大模型更多反饋，反向促進了文心大模型的能力提升，形成飛輪效應，進一步擴大文心大模型和國內同行的差距。”他說。

文心一言從去年3月16日首發(fā)，在一年零一個月的時間里，用戶數(shù)突破了2億，每天API的調用量也突破了2億，服務客戶數(shù)或者說企業(yè)達到了8.5萬，利用千帆平臺開發(fā)的AI原生應用數(shù)超過了19萬。

百度一并發(fā)布了文心大模型4.0的工具版，用戶可以在工具版上體驗代碼解釋器功能，通過自然語言交互，就能實現(xiàn)對復雜數(shù)據(jù)和文件的處理與分析，還可以生成圖表或文件，能夠快速洞察數(shù)據(jù)中的特點、分析變化趨勢、為后續(xù)的決策提供高效精準的支撐。

此外，創(chuàng)業(yè)者生態(tài)也是大模型的有生力量。去年5月份，百度啟動了“文心杯”創(chuàng)業(yè)大賽，第一屆“文心杯”創(chuàng)業(yè)大賽，收到了近1000支創(chuàng)業(yè)團隊報名，百度為其中的15支優(yōu)勝團隊，提供了近億元的投資支持，并且在技術、團隊和資源上持續(xù)提供全方位扶持。

李彥宏在現(xiàn)場宣布，第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動，本次將擴大項目篩選范圍、設置分賽場，面向全球市場及高校學子，招募創(chuàng)業(yè)創(chuàng)新團隊。

只要創(chuàng)業(yè)方向是AI原生應用，都可以在大賽官網(wǎng)報名參賽，同時百度也加大了對創(chuàng)業(yè)者的支持力度，提供更充足的投資資金、更豐富的業(yè)務資源，還首次設立了“特別大獎”，特別優(yōu)秀的項目將有機會獲得最高5000萬人民幣的現(xiàn)金和資源支持。

無論是成熟的“格子衫”，還是年輕的臉龐，都是中國大模型產業(yè)的一分子，百度通過AI應用開發(fā)三大“神器”，展示出了一幅通向大模型產業(yè)未來的道路。這條路，有百度，也有千千萬萬的開發(fā)者群體。

文章來源：鈦媒體

大模型百度 AI

鈦媒體

原創(chuàng)欄目