OpenAI正在測試名為「Sora」的文字生成影片模型。(截自OpenAI影片)
生成式人工智慧(AI)聊天機器人ChatGPT,以及圖像生成工具DALL-E的開發商「OpenAI」15日表示,正在訓練1款名為「Sora」的文字生成影片模型,讓用戶只要下達簡單的指令,就可以產出長達1分鐘的逼真影片。
英國衛報報導,這款文字生成影片模型叫做「Sora」,在日語中是「天空」的意思,使用者只要自己編寫簡單的主題及風格指令,Sora就可以根據這些指令,建立解析度1080p、長達1分鐘的影片。除了文字指令,Sora也能輸入既存的靜態圖像,並由此生成影片。
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
OpenAI執行長奧特曼(Sam Altman)在X平台表示,這款文字生成影片模型最開始將提供給「有限的創作者及研究人員」,也向1個專家團隊授予訪問權限,負責在正式推出之前評估Sora的安全性。
該專家團隊將對Sora進行紅隊演練(red-teaming),評估Sora的潛在危害和風險,並測試Sora的安全防護是否足以遏阻不適當內容的產生,包括「極端暴力、性內容、仇恨圖像、名人肖像或他人的知識產權」等相關內容。
OpenAI在2021年推出靜態圖像生成工具「Dall-E」,並於2022年11月推出生成式人工智慧(AI)聊天機器人ChatGPT。OpenAI並未透露訓練Sora時使用了多少鏡頭,也沒有透露訓練影片的來源,只是強調說他們使用的影片都是公開的,也都有獲得版權所有者許可。
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024