投喂數據、獎懲訓練……5月8日,馬欄山視頻文創產業園內,音視頻工作者們正忙著“喂養”人工智能大模型。
從去年ChatGPT的火爆,到今年Sora的橫空出世,技術革新為音視頻產業發展提供了前所未有的機遇。
迎風來,乘風起。馬欄山正積極搶抓人工智能大模型發展機遇,建立“云、網、算”統一服務平臺,發揮“音視頻數據要素+大模型”支撐融合作用,為影視內容生產“采集、編輯、播出、傳輸、顯示”全鏈路的技術升級形成強大技術底座支撐。目前已累計服務上云企業216家,累計為企業節省生產成本超5000萬元。
海量數據催生大模型
輸入“云霧繚繞的張家界”文本后,一個云海張家界高清視頻快速構建;上傳一張手機拍攝的照片后,就能獲得一段充滿立體變幻特效的視頻;打上描述詞標簽,便可生成相應風格的音樂……今年1月,國內首個音視頻多媒體大模型“天幕”在園區發布,其文生視頻、圖生視頻、文生音樂等能力驚艷行業。
馬欄山是湖南音視頻產業發展主陣地,目前,以大模型為代表的人工智能正成為馬欄山“彎道超車”的新賽道。“喂養”大模型需要海量數據,馬欄山底氣從何而來?
“數據優勢,正是馬欄山大模型‘生根發芽’的沃土。”馬欄山投資開發建設有限公司技術總監呂紹和介紹,依托湖南廣電、長沙廣電等歷史積累以及新節目制作,園區擁有“安全可控、版權可溯”的音視頻節目素材超過百萬小時,為人工智能大模型訓練與應用提供了強大數據支撐。
目前,園區通過“云網算大模型”新基建項目,正打造涵蓋數據產生、處理、聚合、交易與使用的全鏈條數據平臺。為滿足大模型訓練需求,園區還將建設高性能大模型訓練平臺,實現數算一體格局。“建成后,企業只需帶著大模型算法,就能在園區的算力平臺上,利用園區的音視頻數據,完成大模型訓練。”呂紹和說。
大模型賦能音視頻產業
一條30秒的宣發視頻,傳統制作方式需要兩三天,而在大模型算力加持下,幾秒鐘就能輕松搞定,同時還能根據平臺用戶的不同需求,制作不同款式不同風格的視頻,大大提高了宣發效率。
一部短劇急于過審上架,人工審核排隊,幾個月等不來結果,大模型幫你幾天就審核完畢。
“數據訓練生成大模型,大模型同時反哺音視頻生產,這是馬欄山視頻生產的最大特色。”呂紹和表示。
今年初,網絡微短劇《柒兩人生》在抖音播出,該劇在馬欄山影視級XR虛擬影棚拍攝,是國內首部采用虛擬制作技術的網絡短劇。
未來,在大模型加持下,虛擬場景拍攝更方便。取景星辰大?;蚋瓯谘┥?,無需再千里迢迢外拍,大模型助你攬天地萬象。
事實上,大模型在訓練數據的生產中也發揮重要作用。大模型訓練需要簡單明了、風格單一的語料,視頻轉碼、分析、拆條、標注等環節,都可采用“機器+人”的方式,實現音視頻訓練語料的規?;a。
“實現數據可被反復使用”
讓更多數據“活”起來,數據交易不可或缺。
“今年下半年,馬欄山‘中國V鏈’數據擬同步上架湖南大數據交易所文化專板,這將為用戶購買音視頻產品新添一個渠道。”湖南大數據交易所生態合作部負責人張睿介紹。
此前,園區數據交易已取得初步成果。例如,中廣天擇已與萬興科技、上海某企業達成數據交易合作,合同金額達數千萬元。
關于數據交易模式,呂紹和有明確思路,“未來,我們將結合區塊鏈確權、隱私計算等技術,以‘使用權交易’代替‘所有權交易’,實現數據‘可用不可見’,實現數據可被反復使用、可被多家使用、可以多次變現的可持續發展之路。”
數據要素×音視頻產業,乘出的是無盡的星辰大海,馬欄山正快“馬”加鞭更上層樓。