抖音母公司將推「文字轉影片」功能。(節自抖音影片)
中國短影音平台「抖音」(TikTok)近年快速發展,在全球年輕世代的影響力強大,讓許多國家越來越擔憂假訊息透過抖音流傳,進而影響輿論。抖音母公司「字節跳動」(ByteDance)日前又宣布,接下來將研發利用生成式人工智能(AI)推出「文字轉影片」的功能,意味著未來創作生成內容會變得更容易,也表示將虛假訊息「弄假成真」也會更容易。
科技新聞網站Metaverse Post報導,抖音母公司、北京「字節跳動」(ByteDance)9日在論文網站「arXiv」發布「MagicVideo-V2:多階高美學影片生成」(MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation)一文,透露抖音正在研發將文本轉而產出高品質的影片,也就是使用者只要寫下1段足夠詳細描述人事時地物的文字,AI就能自動將其轉換成影像畫面,呈現出來,連想要什麼風格,都能夠使用文字下指令。
報告指出,MagicVideo-V2將文字到影像模型、影片運動產生器、參考影像embedding模組和幀內插模組整合到端到端的視訊生成流程中。由於這些架構設計的好處,MagicVideo-V2能夠產生具有極高保真度和流暢度的美觀高解析度影片。透過大規模用戶評估,它在性能上表現優越,超過了領先的文本到影片系統,如Runway、Pika-1.0、Morph、Moon Valley和Stable Video Diffusion模型。
MagicVideo-V2提出新的文字到影片生成流程,證實MagicVideo-V2 超越現有技術方法。MagicVideo-V2的模組化設計,整合文字到圖像、圖像到影片、影片到影片和影片幀插值,為生成流暢且高美學的影片提供新的策略。
這項功能肯定會讓創作者們產出內容變得方便許多,但也意味著使用者更難分辨接觸之資訊的真偽。已有人指出,這可能讓虛假訊息流傳更容易。