磨磨蹭蹭了快一年, OpenAI 終于舍得把 Sora 這盤菜端上來了。 這不,咱們還在做夢的時(shí)候, Sora 就已經(jīng)那能用了,登錄網(wǎng)址 Sora.com ,訂閱會員搶先體驗(yàn)。 反正從昨天晚上折騰到今天,國內(nèi)外各大媒體瘋狂報(bào)道,有不少老哥已經(jīng)把 Sora 生成的視頻發(fā)到了網(wǎng)上,那叫一個(gè)熱鬧。 可能哥幾個(gè)也好奇,這個(gè)傳說中的 Sora 到底有多少斤兩,跟國內(nèi)的視頻生成模型相比,誰又會更勝一籌? 本來吧,這個(gè)問題世超可以在第一時(shí)間替大伙兒解答,會員賬號早早就薅到手了。結(jié)果誰能想到, Sora 的服務(wù)器被擠爆了,現(xiàn)在進(jìn)都進(jìn)不去。。。 不過說實(shí)在的,光是發(fā)布會上對 Sora 具體功能的展示,硬貨就夠多的了。 所以今天世超就先拿發(fā)布會上的 “ 餐前甜點(diǎn) ” ,給大伙兒開開胃,看看 Sora 跟之前咱們體驗(yàn)過的那些視頻生成模型到底有啥區(qū)別。 首先在產(chǎn)品形態(tài)上,世超覺得, Sora 就更接近一個(gè)擁有完整工作流程的生產(chǎn)力工具。 這次發(fā)布的 Sora Turbo 支持文字、圖片和視頻三種生成方式,能夠生成最高分辨率 1080p 、時(shí)長 20 秒的視頻,支持寬屏、豎屏和方形比例。 但這些東西其實(shí)都挺常規(guī)的,最讓世超覺得驚艷的地方,還是 Sora 把 AI 生成的能力融入到了視頻創(chuàng)作的每一個(gè)環(huán)節(jié)中。 就比如 Storyboard 故事板功能,大伙兒可以簡單理解成,給一段視頻添加不同的分鏡。 咱直接來看官方的例子,一共 440 幀的視頻,前 114 幀的場景 prompt 是 “ 一片廣闊的紅色景觀,遠(yuǎn)處停靠著一艘宇宙飛船 ” 。 接著可以繼續(xù)發(fā)揮想象力,把 114-324 幀的場景變成 “ 從宇宙飛船內(nèi)部向外看,一位太空牛仔站在畫面中央 ” 。 最后用 “ 宇航員眼睛的特寫鏡頭,眼睛被針織面料制成的面罩框柱 ” 的 prompt ,結(jié)束這段視頻。 這些 “ 分鏡 ” 在哪個(gè)時(shí)間點(diǎn)添加,添加什么內(nèi)容,都可以由用戶自己決定。 而在故事板的基礎(chǔ)上,咱們又可以把生成好的視頻用 Re-cut ( 在線重新剪輯 )功能,繼續(xù)調(diào)整一波。 這種剪輯,跟咱們理解的這裁一段那剪一截還不太一樣。在視頻的時(shí)間軸上,你可以把不滿意的部分都剪掉,剩下來的活兒就可以扔給 Re-cut 功能,讓它幫你把空白的地方再重新補(bǔ)全。 這還沒完啊。 Sora 還有一個(gè) Remix 功能,那才叫一個(gè)酷炫。 用 prompt“ 毛茸茸的猛犸在沙漠中行走 ” 生成一段視頻,看起來也沒啥特別的對吧。 有意思的地方來了,如果你想把視頻里的猛犸象給換了,比如換成機(jī)器人, ok , Remix 功能就能派上用場了。 硅基生物無痕替換碳基生物,而且從替換后的視頻效果里也能看出來,機(jī)器人的步態(tài)、沙漠背景,幾乎沒有出現(xiàn)太大的畸變,畫面穩(wěn)定性和主體一致性整體都在線。 當(dāng)然這只是官方給的案例,咱們也別太局限,大膽點(diǎn)兒把沙漠變成大海,也不是不行。 另外, Sora 的發(fā)布會上還介紹了 Loop ( 循環(huán) )和 Blend ( 視頻融合 )兩個(gè)功能。 一個(gè)能讓視頻實(shí)現(xiàn)首尾視頻幀的絲滑銜接,讓視頻一直循環(huán)。 還有一個(gè),則是把兩個(gè)視頻無縫合并成一個(gè)視頻。 怎么個(gè)無縫法呢,用雪花飄落和花瓣飄落的視頻作為例子,大伙兒一看就明白了。 除此之外, Sora 還有個(gè) Style-Presets 的功能,其實(shí)說白了就是換換風(fēng)格。同樣都是兩頭猛犸象在雪地行走,但你可以把初始版換成黑白電影,或者紙板風(fēng)和膠片檔案風(fēng)。 相信看到這兒,大伙兒應(yīng)該多少能品出來, Sora 跟現(xiàn)在市面上很多視頻生成應(yīng)用的區(qū)別了吧? 咱沒有拉踩的意思,也沒有非要分個(gè)高下。單純從客觀地角度來說, Sora 已經(jīng)做到了一個(gè)視頻生成模型理想狀態(tài)下,相對完整的產(chǎn)品形態(tài)。 生成功能,不過是 Sora 最最基本的一塊磚,沒有了不行,但由一塊塊磚搭起來的大廈,肯定會更引人注目。 而之前咱們上手體驗(yàn)到的一些視頻生成模型,大多只專注在生成效果這個(gè)單一維度上,魔改玩玩還可以,但要當(dāng)真正的生產(chǎn)力工具,還差點(diǎn)意思。 其次,在最直觀的生成效果上, Sora 雖說有瑕疵,但總體上瑕不掩瑜。 看看外網(wǎng)老哥們在 X 上發(fā)的視頻,世超是真饞了。 先用 Midjourney 生成圖片,再把 prompt 喂給 Sora ,這清晰度,這穩(wěn)定性,老人臉上的皺紋都不帶動一下的,還有眼神里透出來的 “ 嚴(yán)肅和焦慮 ” ,也讓 Sora 悟到了。 該說不說, Sora 對物理規(guī)律的掌握,可比年初的時(shí)候好太多了。 等世超能用上了,高低也給咱火鍋也安排一次。 不過,也有一些網(wǎng)友用 Sora 跟咱們國內(nèi)的視頻生成應(yīng)用,對比了一把。 同樣的 prompt ,打眼這么一看真看不出來太大差距,非要說的話,就是 Sora 版的頭發(fā)更柔順一些。 問題是 KLING 免費(fèi)就能用。。 在一些網(wǎng)友的測試?yán)铮?Sora 生成的視頻還會出現(xiàn)手部不夠自然的情況。 包括昨晚的發(fā)布會上, Sora 也小小翻車了一下。 工作人員輸入了 “ 鶴把頭扎進(jìn)水中,叼起一條小魚 ” 的提示詞,結(jié)果視頻中的白鶴,壓根就沒叼到魚。 最后,可能是大伙兒不太關(guān)注到的一個(gè)點(diǎn), Sora 對 AI 生成的安全性考慮。 之前不是老有人嚷嚷 AI 為禍人間,看圖片看視頻,現(xiàn)在都分不清到底是人干的還是 AI 生成的了。 所以這次 Sora 生成的視頻都帶有 C2PA 元數(shù)據(jù), C2PA 咱們之前專門寫文章嘮過,感興趣的差友可以翻出來看看。它最大的特點(diǎn)就是可以溯源,內(nèi)容是誰創(chuàng)作的、歷史的修改記錄,這些都會被記錄下來。 總的來說,這次 Sora 的亮相還是帶來了不少驚喜,特別是在產(chǎn)品形態(tài)上,視頻創(chuàng)作的完整工作流提供了一個(gè)更新的視角。 不是我說,國內(nèi)視頻生成下一步要往哪卷,應(yīng)該有方向了吧。( 狗頭 ) 本文來源:差評 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選