TikTok母企業推出「用照片產生影片」AI工具 升高「深偽」技術濫用憂慮

王能斌 2025年02月08日 17:39:00
TikTok母企業「字節跳動」旗下研究人員,近日公開可用照片產生動態影片的AI工具,加深外界對於深偽技術遭濫用的顧慮。(取自字節跳動公司網站)

TikTok母企業「字節跳動」旗下研究人員,近日公開可用照片產生動態影片的AI工具,加深外界對於深偽技術遭濫用的顧慮。(取自字節跳動公司網站)

就在外界聚焦美國川普政府,推動由美方接管具中國背景的短影音平台TikTok之際,該平台母公司「字節跳動」,於本周低調推出了新款人工智慧模型「OmniHuman-1 」,由於僅用靜態的照片便可產生動態影片,成果也幾可亂真,令科技專家憂心,未來該模型一旦開放一般用戶使用,恐造成「深偽」技術的濫用,引發包括國家安全等各領域的威脅。

 

「美國廣播公司新聞網」(ABC News)報導,TikTok母公司「字節跳動」(ByteDance)旗下的研究人員,在本周透過網路發表研究論文,表示在經過逾1.87萬小時人類影片的訓練之後,人工智慧(AI)模型「OmniHuman-1 」已具備利用靜止畫面,產生「極其逼真影片」的能力,且其精確以及客製化的程度都達到「前所未見」的境地,並且在論文中,展示了包括AI產生愛因斯坦(Albert Einstein)談話影片等範例。

 

 

對此,全球知名生成式AI、深偽(Deepfake)技術專家艾德(Henry Ajder)表示,由於該模型能夠精確產生人物談話時的嘴型、動作與聲音,因此產出的成品有可能騙過AI偵測工具,且相較於過往必須使用上百、甚至上千張照片才能生成較具真實性的影片,若「OmniHuman-1 」僅需1張照片就能做到,未來要針對特定人士產生特定內容的影片就更加容易,從而提高了深偽技術濫用的可能性。

 

此外,艾德也強調該模型能夠依據使用者需求,產生與影片相符音訊的能力令人印象深刻;對此,1名「字節跳動」的發言人曾經向財經雜誌「富比世」(Forbes)表示,該服務未來若開放一般用戶使用,將會搭配防止生成任何具有誤導性或是傷害性內容的措施,TikTok也在去年時,宣布該平台會自動對AI產生的影片加註。

 

專家認為,雖然該模型的出現,凸顯AI技術的迅速發展,但同時也造成了重大危機,包括用以操弄選舉,或是在未獲得合意下產生色情內容等等,對於社會穩定甚或國家安全都造成難以估量的威脅。

 

 






【加入上報國際圈,把繽紛世界帶到你眼前!】

提供新聞訊息人物邀訪異業合作以及意見反映煩請email至國際中心公用信箱: intnews@upmedia.mg,我們會儘速處理。

 

 

 





回頂端

上報 Up Media

facebook youtube instagram threads