教育大模型,再成焦點。 在剛剛結(jié)束的世界人工智能大會(WAIC)上,教育展區(qū)熱度居高不下,網(wǎng)易有道、學而思、猿力科技等展位擠滿了帶娃逛展的家長。 復(fù)盤今年教育行業(yè)的AI進程,又增添了不少新看點,正在從去年的技術(shù)探索轉(zhuǎn)向大模型落地上,嘗試讓可商用邁入新的階段。 比如猿力科技亮相的教育全家桶,就涵蓋了面向國內(nèi)教育的飛象星球、猿編程、小猿學練機、海豚AI學,以及面向出海的CheckMath和LeapMath,釋放的全是落地信息。 現(xiàn)在,猿輔導(dǎo)終于不用賣咖啡、羽絨服或者月子套餐了。 這也似乎驗證了一件事,能讓教育行業(yè)二次崛起的,恐怕還是它的傳統(tǒng)藝能。 同時,教育領(lǐng)域的大模型落地也不僅在國內(nèi)有動作,在海外呈現(xiàn)出的勁頭也很強勁。比如在今年6月,一款名為Answer.AI的教育應(yīng)用就曾霸榜北美教育TOP1,上線6個月就狂攬200萬用戶。 鑒于教育行業(yè)在推動大模型落地上遙遙領(lǐng)先——畢竟還有很多行業(yè)停留在通用大模型的舊思路上,不禁激起了“AI新榜”的探索興趣。轉(zhuǎn)眼2024過半,教育大模型落地進展幾何了?不同企業(yè)之間在落地路徑上有什么區(qū)別?以及AI到底能不能讓教育變得更好? 教育大模型落地,走到哪了 2023年,被認為是教育大模型的元年。去年GPT-4o推出后,網(wǎng)易有道發(fā)布自研大模型“子曰”,學而思推出專注于數(shù)學的大模型MathGPT,作業(yè)幫上線自研銀河大模型,科大訊飛對星火大模型連番升級,松鼠AI發(fā)布全球首款全學科智適應(yīng)教育大模型等等。一時間,大模型成了教育企業(yè)的必爭之地,引得各企業(yè)紛紛下注。 這波熱潮過后,教育大模型似乎有了供過于求的跡象。因為市場最后只會選擇一兩個大模型作為技術(shù)基座,相比之下,應(yīng)用層的市場空間則要比模型層大的多。 很多業(yè)界大佬都曾為上述觀點站臺,比如百度創(chuàng)始人李彥宏就多次強調(diào)AI原生應(yīng)用。但這是否意味著大模型真的不重要了?答案顯然不是,因為上層應(yīng)用歸根到底由底層技術(shù)決定。 “AI新榜”梳理發(fā)現(xiàn),許多教企在發(fā)布新應(yīng)用時,往往伴隨自家大模型的更新?lián)Q代。比如網(wǎng)易有道在發(fā)布“子曰”1.0版本時,就同步推出了6款A(yù)I應(yīng)用。在發(fā)布“子曰”2.0版本時,又更新了3款A(yù)I應(yīng)用。 訊飛星火也是如此。自去年5月星火大模型發(fā)布以來,它的每一次升級都與教育密切相關(guān)。遠的不說,就說6月27日發(fā)布星火4.0時,訊飛也展示了其在教育、醫(yī)療、商業(yè)等多領(lǐng)域的應(yīng)用更新。 說完模型側(cè),咱們再來說說應(yīng)用側(cè)。 得益于教育行業(yè)的積極探索,國內(nèi)也的確出現(xiàn)了許多基于教育大模型的應(yīng)用。 比如在軟件方面,網(wǎng)易有道就結(jié)合自己在英語方面的賽道優(yōu)勢,推出了Hi Echo和小P老師等應(yīng)用,并通過將其打包進AI訂閱服務(wù),一季度狂賺會員費5000萬;學而思推出數(shù)學答疑原生工具九章隨時問,能針對學生提供個性化講解,既懂啟發(fā)也懂知識點;另外還有開篇提到的猿力科技,最近更是推出了AI應(yīng)用全家桶。 硬件方面的動作也不少,比如小度科技基于文心大模型落地學習機Z30;科大訊飛基于星火大模型推出學習機T20;除此之外,還有作業(yè)幫、步步高等一眾教企競相布局AI學習機。據(jù)艾瑞咨詢,2023年我國智能學習機市場規(guī)模達807億元,預(yù)計2025年將超千億,學習機的市場潛力可謂巨大。 不難發(fā)現(xiàn),目前國內(nèi)在教育大模型落地上的主流做法,就是用AI把解題、口語、批改、講題等場景重做一遍。這種做法雖然不出錯,但也說明AI只是頭部教企用于提升原有業(yè)務(wù)的工具。 當然這種現(xiàn)象也不難理解。正如A16Z的聯(lián)合創(chuàng)始人Marc Andreessen近日在文章里提到的那樣,當公司開拓新業(yè)務(wù)時,三個重要元素的排序分別是市場、產(chǎn)品和團隊。但如果這個市場足夠大,比如教育市場,那么新產(chǎn)品只要基本可接受就能獲得成功。 這也很好解釋了阿里云創(chuàng)始人王堅在今年WAIC的那句話,大企業(yè)把AI看做工具的革命,小企業(yè)把AI看做革命的工具。 除了上述提到的這些,教育大模型下一輪的落地方向是多模態(tài)。目前,教企也正嘗試利用大模型生成文本、圖像、視頻、音頻等不同形式的回復(fù),模擬人類處理信息的方式。多模態(tài)能力將使大模型更了解學習者的需求,從而能提供更個性化的學習支持。 教育大模型落地,藏著哪些生意經(jīng)? 可以說,教育行業(yè)正在被AI重寫,一波新的創(chuàng)業(yè)潮已在路上。 據(jù)多知網(wǎng),2023年,我國新注冊教育科技相關(guān)企業(yè)4萬家,同比增加22.3%。2024年前5個月,我國新注冊教育科技相關(guān)企業(yè)1.7萬家,同比增加5.4%。 在這個趨勢之下,“AI新榜”也來盤了盤教育大模型落地還藏著哪些商業(yè)機會。 1. 差異化是良性發(fā)展的前提 上文提到,當前各家企業(yè)的落地方向主要是在卷場景。但由于教育場景總共就這么多,同質(zhì)化的問題很快就顯現(xiàn)了出來。 想要尋求差異化,還能有哪些打法?讓我們一起來看看。 比如網(wǎng)易有道借鑒了多鄰國的做法,推出了AI訂閱服務(wù)。據(jù)多位網(wǎng)友反映,它大概率借鑒了多鄰國"游戲化"的機制,納入AI訂閱的Hi Echo和小P老師也都解鎖了很多趣味場景,能讓學生一邊娛樂一邊學習。 同樣選擇寓教于樂的還有科大訊飛推出的"小鷹愛學"。和有道相比,它不僅有學習換能量、獎牌、排名等趣味化的玩法,還在界面上選擇了二次元偏愛的UI設(shè)計,首頁甚至飄著各種彈幕。 除開游戲化玩法外,精耕內(nèi)容也是可以考慮的方向之一。比如在競爭激烈的英語賽道,高途依舊敢于晚下場布局高途AI英語。而它之所以有勇氣,恰恰在于它選擇了"分教材"、"同步課本"的差異化打法,并把客群瞄準在低齡學生。據(jù)高途稱,這也是國內(nèi)首個采取"分教材學習"的智能學習方案,從沒有人嘗試過。 在本輪創(chuàng)業(yè)潮中,小企業(yè)也充滿了想象力。有了AI的加持,小企業(yè)也不再跟著大企業(yè)亦步亦趨,而是實打?qū)嵉卦趪L試"把AI作為革命的工具"。 今年5月,VisionFlow創(chuàng)始人劉夜在法國發(fā)布了全新產(chǎn)品Talkit,稱這款工具能讓用戶沉浸式學外語。 打開這個App,用戶將進入一個3D虛擬世界。在這里,每個用戶都能選擇選擇一個專屬數(shù)字分身,并能定制對話發(fā)生的場景,如餐廳、打車途中、醫(yī)院等。通過模擬真實世界,它能為用戶提供最好的語言環(huán)境,從而實現(xiàn)快樂學習。 目前,Talkit還沒有在國內(nèi)發(fā)行,但試想一下,如果你能進入這個元宇宙,還用得進去別家的口語外教嗎? 2. “不出海,就出局” 受雙減政策影響,本輪落地潮中也有很多企業(yè)把目光轉(zhuǎn)向國外,真正做到了“墻內(nèi)開花墻外香”。 在美國市場,國內(nèi)表現(xiàn)最突出的兩款應(yīng)用分別是字節(jié)跳動旗下的Gauth和作業(yè)幫旗下的Question AI。據(jù)Sensor Tower數(shù)據(jù),今年5月,這兩款應(yīng)用已先后登頂美國教育類榜首,下載量均為170萬左右。 同樣問鼎過榜首的還有Answer.AI,這款由初創(chuàng)團隊打造的應(yīng)用,自去年年末上線以來,6個月內(nèi)迅速積累用戶超200萬,增長速度同樣令人矚目。 全科輔導(dǎo)產(chǎn)品之外,數(shù)學應(yīng)用在海外的表現(xiàn)也很出色,比如Solvely.AI,它作為今年的出海新兵,也順利進入了榜單前十。 值得一提的是,國內(nèi)教育應(yīng)用的高性價比是其海外擴張的關(guān)鍵。據(jù)Tech Crunch報道,美國家教費用非常昂貴,比如休斯頓一小時的家教費要60美元,在富庶的灣區(qū),價格可能還要再翻兩倍。相比之下,來自中國的教育應(yīng)用訂閱費才幾十美元一年,相當于真人家教1小時的費用,非常實惠。 3. 既To C,也To B 除開上述偏向于C端的策略外,To B同樣是商業(yè)版圖不可或缺的一塊。 由于大模型落地的成本比較高昂,為攤薄前期研發(fā)和運營的大幅投入,各家公司都在尋求規(guī)模效應(yīng),開始和G端、B端開展廣泛合作。 相對而言,科技巨頭在這方面存在一定優(yōu)勢。比如網(wǎng)易,其業(yè)務(wù)橫跨游戲、音樂、工業(yè)和教育四大領(lǐng)域,客戶資源相對較多,加上雄厚的資本積累,即便教育板塊遇到挑戰(zhàn),其余穩(wěn)健的業(yè)務(wù)依然能保證教育有資金布局前沿科技。 而教企的抗風險能力就會稍微遜色一些,它們雖然具有貼近C端的傳統(tǒng)優(yōu)勢,但畢竟距離G端、B端稍遠。 目前很多教企也正在向B端和G端發(fā)力。如猿力科技的“看云大模型”自5月15日完成備案后,就迅速與全國183個地區(qū)的學校建立了合作,覆蓋了作業(yè)設(shè)計、課后服務(wù)和課堂講評等多個教育場景,體現(xiàn)了其在教育領(lǐng)域的深度整合能力。 好未來也是如此,通過與傳統(tǒng)學校合作試點,從而構(gòu)建了更加緊密的教育生態(tài)鏈,提升了教育科技的整體競爭力。 科大訊飛更是邁出了國際化的步伐,不僅在新加坡設(shè)立了區(qū)域總部,還與當?shù)?2所中小學展開了合作試點,共同推進學生學習平臺項目的建設(shè)。 總而言之,隨著AI技術(shù)在教育領(lǐng)域的滲透加深,教育科技企業(yè)的生存發(fā)展越來越依賴與學校的合作深度和廣度。 AI真的能讓教育更好嗎? 說到底,AI是一種算法技術(shù),本質(zhì)仍是冰冷的代碼,而教育是與人打交道的,不是一串串冰冷的指令。 這就帶來了一個核心問題:AI真的能否扮演好個性化導(dǎo)師的角色、實現(xiàn)因材施教嗎? 鑒于描繪愿景的文章已屢見不鮮,“AI新榜”在此就不再重復(fù),而是想從技術(shù)的角度討論一下它該如何實現(xiàn)。在這里,我們重點參考了谷歌此前發(fā)布的技術(shù)報告《面向教育生成式人工智能的負責任開發(fā):一種評估驅(qū)動的方法》。 首先,由于大模型本身不懂教學行為,它需要研究者提前輸入具體的教學規(guī)范,比如谷歌技術(shù)報告就為AI提出了如下原則:
但這種籠統(tǒng)的原則無法建立一套通用的教學策略,因為許多學科的教學研究非常分散,即便是在同一學科內(nèi),很多時候也強調(diào)不同的教學標準,幾乎沒有重疊。 為此, 研究者需要和多個群體展開合作,包括學生、教育工作者、科研工作者以及其他研究人員。 同時,大模型作為導(dǎo)師,還需要學會如何提問。 目前如果不向大模型輸入讓其提問的指令,它只會默認生成回復(fù)。 為了解決這個問題,谷歌的研發(fā)者實驗了兩種方法,分別是提示和微調(diào)。 提示是調(diào)整AI最流行的方法,它只需要開發(fā)者提前輸入一套關(guān)于良好輔導(dǎo)行為的說明,比如“首先向?qū)W生介紹自己你是AI導(dǎo)師,你很擅長提問,每次只問一個問題......”,然后由AI來自行調(diào)整。 但提示存在很多局限性,因為有些具體的輔導(dǎo)行為很難用自然語言描述清楚,即便說得清楚,良好的輔導(dǎo)行為也不可能列舉窮盡。 然后是微調(diào)。微調(diào)是指在大模型生成回復(fù)后,再由人類對它的表現(xiàn)進行反饋,從而強化學習。如果微調(diào)的操作由高級教師來執(zhí)行,大模型就能捕捉到在有效教學中的一些直覺和推理,以至于能夠推導(dǎo)出更廣闊的教學空間。 成功的微調(diào)需要滿足兩個先決條件:足夠多的高質(zhì)量數(shù)據(jù)和衡量教學行為的客觀標準。但不論滿足與否,微調(diào)能帶來的效果都和它的名字一樣,即無法顛覆現(xiàn)有的教學模式,只能對其加以改進。 同時,AI對學生的了解也是一個循序漸進的過程,這一點很像現(xiàn)實中與人相處。大模型需要不斷對學生的回答進行打分,然后通過這些分數(shù)得出平均分,從而了解學生的真實水平和知識盲區(qū)。 當然這個操作代入學生視角會有點難受,畢竟誰會愿意有個老師每天在背后給自己打分。 還有一點,教育大模型也存在倫理風險。 正如香港科技大學首席副校長郭毅在去年的WAIC教育論壇上說的那樣,和人類先培養(yǎng)好奇心、再培養(yǎng)價值觀、最后再系統(tǒng)學習各學科的教育順序不同,機器學習是先輸入數(shù)據(jù),再被人類告知對錯,最后才掌握價值觀。 通過擬人化的交互系統(tǒng),大模型已顯著提升了用戶信任與接受度。但在另一角度看來,這也可能導(dǎo)致用戶對大模型產(chǎn)生情感依戀,比如使得未成年學生分享自己的敏感信息,或是對AI導(dǎo)師產(chǎn)生過度依賴。 所以研發(fā)團隊更要對此進行安全微調(diào),以保證AI說的每句話盡量都是合適的。 不過,正如猿力科技CTO楊元祖所說,大模型一定是教育未來發(fā)展的最大變量。雖然完美的AI導(dǎo)師還未出現(xiàn),但它也許就在不遠的未來。 本文來源:頭號AI玩家 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選