前沿AI科技,現(xiàn)在已經(jīng)被用在了奧運會上。并且背后提供支持的,是中國科技力量。 就在巴黎奧運會比賽日正式開始,逐漸點燃觀眾激情的同時,一支“奧運8分鐘”短片也受到關(guān)注。 不僅國際奧委會主席巴赫力推:“感謝中國AI科技,讓這些女性在體育運動中的成就煥發(fā)新的色彩! 網(wǎng)友們也紛紛點贊: AI技術(shù)以現(xiàn)代的清晰度將歷史時刻帶入當下生活。 短片名為《永不失色的她》(To the Greatness of HER),由阿里巴巴和國際奧委會聯(lián)合推出。 百年奧運史上偉大女性的影響故事在此被濃縮在寶貴的8分鐘里,旨在致敬一代又一代在奧運賽場上不斷實現(xiàn)從0到1、不斷突破和拼搏的女運動員們。 值得關(guān)注的是,這支8分鐘短片不僅用上AI為歷史時刻重賦色彩,其中還有大模型、AIGC技術(shù)的加持。 永不失色的她 不少朋友可能已經(jīng)關(guān)注到了,奧運時隔100年再次在巴黎召開,其中一個明顯的變化是,100年前奧運項目罕有女運動員參與,而在2024年巴黎奧運會上,男女運動員比例首次達到了1:1。 而另一個顯著的改變是,這也是首屆廣泛應(yīng)用AI技術(shù)的奧運會。 △阿里云AI增強視頻 阿里云和國際奧委會攜手,希望用第二重變化帶來的技術(shù)變革,向公眾展現(xiàn)更多推動了第一重變化的女運動員們歷史上珍貴的賽場時刻。 比如蘇珊·朗格倫(Suzanne Lenglen),女子網(wǎng)球史上最偉大的運動員之一。 1921到1926年間,蘇珊·朗格倫保持了長達5年的世界第一。 而在傲人的賽場成績之外,蘇珊還是第一個打破女子網(wǎng)球運動服裝保守規(guī)定的人—— 改長袖為短袖,改長裙為過膝百褶裙,把網(wǎng)球裙的重量從18公斤改到了0.18公斤。 可以說,是從她開始,網(wǎng)球女運動員們得以掙脫服裝的束縛,在賽場上盡情發(fā)揮。 又比如首位奧運男女混合雙向飛碟女子冠軍張山。 在1992年之前,女子雙向飛碟并非正式奧運比賽項目,雙向飛碟比賽是男女混合項,就是說,女運動員被允許參加該項目的男子比賽。 張山之前,這個項目一直由男子選手獨攬金牌。而就在1992年,張山改變了這一切。 預(yù)賽中,張山以150靶全中的成績成功進入半決賽;接著,又在半決賽中平了世界紀錄,以200發(fā)200中的成績闖入決賽。 在決賽中,張山獨自面對5名男子選手的挑戰(zhàn)。最終,她贏得了比賽,也贏得了全場的尊重和歡呼。 頒獎時刻,分獲銀牌和銅牌的對手將張山高高扛起。一張經(jīng)典照片也有中國射擊隊另一位傳奇——許海峰當場記錄下來。 還有第一位正式參加波士頓馬拉松的女性——凱瑟琳·斯威策(Kathrine Switzer)。 1967年,19歲的凱瑟琳“冒天下之大不韙”隱瞞性別報名了波士頓馬拉松。在當時,馬拉松被認為是“女性不宜”的運動,甚至就在凱瑟琳本人的比賽過程中,主辦方工作人員突然出現(xiàn)要撕掉她的號碼牌,并沖她大吼:“你給我滾出賽道”。 直至她跑完全程,組委會也不承認她完賽的事實,還痛斥她擾亂了比賽。 “你想證明什么?” 這是當時的記者追問凱瑟琳的問題。 60年后的今天,凱瑟琳親自在巴黎的這8分鐘里給出答案: 不只是我,每個女性都有資格去做她想做的事。 這就是《永不失色的她》影片中的三位主角。為了讓屬于她們的歷史瞬間更加真切、生動地被還原出來,可以看到,阿里云用AI修復(fù)技術(shù),為老照片和老視頻進行了上色和基于生成技術(shù)的補全。 該項目主要包含三大處理步驟。 清晰化:借助圖像超分辨率技術(shù),將低分辨率的老照片轉(zhuǎn)化為高分辨率的清晰圖像。 上色化:通過先進的圖像上色技術(shù),為黑白照片添加逼真的色彩。 基于生成技術(shù)的視頻插幀補幀。 具體涉及的技術(shù)方案,包括基于生成對抗網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的圖像上色、圖像去噪和超分辨率,以及可控圖像生成技術(shù)等。 《她》背后的AI技術(shù) 聽上去,老照片、視頻修復(fù)并不是什么新鮮事,但實際上當修復(fù)的對象變成運動影像,背后的技術(shù)難度就大大增加了。 舉個例子,蘇珊·朗格倫的照片拍攝于100年多前,效果是這樣的: 一方面,人臉已經(jīng)看不太清楚了。 另一方面,背景觀眾眾多,增大了修復(fù)的復(fù)雜性。 阿里云修復(fù)團隊想到的解決方案,是利用大模型+Stable Diffusion等生成式AI技術(shù),加入文本引導(dǎo),讓AI發(fā)揮想象力的同時,對這種想象加以控制,使之不脫離歷史本身。 具體來說,技術(shù)人員先利用擴散技術(shù)對人物面部進行重繪。在重繪過程中,為了保留原始人物信息,會結(jié)合真實的史料信息作參考,并采用ControlNet等技術(shù),對人物面部的線條、深度等都進行了控制。 對于復(fù)雜的背景,由于透視關(guān)系,本身就比較模糊。修復(fù)團隊采用的方案聚焦照片中的重點人物、元素進行修復(fù),對背景則只進行小范圍的修復(fù),最后再將前后景拼接起來。 為了讓色彩更加自然,阿里云修復(fù)團隊還結(jié)合了歷史學(xué)家的專業(yè)意見,通過對歷史色彩庫的學(xué)習,讓AI上色的準確率達到了80%以上。 另外,在超分辨率方面,阿里云的技術(shù)方案能在1秒內(nèi)把640p分辨率圖像超分到4k分辨率,清晰度提升25倍。 視頻修復(fù)方面,阿里云修復(fù)團隊主要解決了視頻前后一致性和連續(xù)性問題。 舉個例子,修復(fù)一段跑步視頻,如果只是做逐幀上色,算法有可能把運動員的褲子一會兒上成紅色,一會兒上成黑色。 修復(fù)團隊對此進行了專門的優(yōu)化,包括對視頻進行細致拆分,逐個片段將上色效果、清晰度調(diào)整到最佳。 運動影像還有一個特點,是運動變化很快。對此,阿里云修復(fù)團隊基于生成技術(shù),對老視頻進行了插幀補幀,以達到更好的連續(xù)性效果。 事實上,由于修復(fù)的難度,最后我們看到的巴奧這8分鐘的成片,是在多輪反復(fù)修改后呈現(xiàn)的。 在這個過程中,修復(fù)團隊一遍又一遍耐心地揣摩,甚至“已經(jīng)看不出哪一張更像本人了”,核心原因,是在修復(fù)的過程之中,技術(shù)人員自身也受到了女運動員們的鼓舞: 希望能通過修復(fù)這組照片,讓更多人了解到歷史上的這些重要事件。同時也希望通過修復(fù)技術(shù),讓凱瑟琳女士等打破障礙、提高競技標準的女性的精神激勵更多人。 這也正是前沿科技對于歷史文化遺產(chǎn)的價值所在: AI能夠讓生活在當下的人們更直觀、更真切地感受到埋藏在歲月長河里的歷史印記。科技力量正在人類人文精神的延續(xù)和保護中發(fā)揮越來越大的價值。 其實,每一屆奧運會不僅給運動員,也給觀眾們帶來了很多感動和淚水。 當故事連點成線,在百年甚至更長的時間維度去觀察,這些感動會凝結(jié)成更值得傳承和銘記的人文精神。 《永不失色的她》是如此。那些賽場上更高、更快、更強、更團結(jié)的精神亦是如此。 AI技術(shù)的加持,加強了對歷史影像的保護和傳播,一方面能讓公眾更低門檻地了解其中故事和發(fā)展。 另一方面,也讓大家看到了人文與科技更深層次結(jié)合帶來的價值。 One More Thing 前面說到,巴黎奧運會是首屆廣泛應(yīng)用AI技術(shù)的奧運會。 如果你也關(guān)注了比賽,這樣高自由度、“子彈時間”式的回放畫面想必并不陌生: 另外,在巴黎奧運會上,云計算正在替代衛(wèi)星,成為奧運賽事直播的主要方式。超過三分之二奧運直播信號將通過阿里云支撐的奧運轉(zhuǎn)播云,從巴黎傳輸?shù)饺?00多個國家和地區(qū),走向數(shù)十億觀眾。 而云+AI的組合,正在給坐在屏幕前的全球觀眾,帶來更多新鮮、酷炫的體驗。 奧委會主席巴赫評價:阿里巴巴用云計算和AI技術(shù)為奧運會和體育的未來作出了寶貴貢獻。 在奧運會的技術(shù)進程中,現(xiàn)在,中國技術(shù)力量成為了舞臺中心那一個。 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選