TikTok母企業推出「用照片產生影片」AI工具　升高「深偽」技術濫用憂慮

王能斌 2025年02月08日 17:39:00

TikTok母企業「字節跳動」旗下研究人員，近日公開可用照片產生動態影片的AI工具，加深外界對於深偽技術遭濫用的顧慮。（取自字節跳動公司網站）

就在外界聚焦美國川普政府，推動由美方接管具中國背景的短影音平台TikTok之際，該平台母公司「字節跳動」，於本周低調推出了新款人工智慧模型「OmniHuman-1 」，由於僅用靜態的照片便可產生動態影片，成果也幾可亂真，令科技專家憂心，未來該模型一旦開放一般用戶使用，恐造成「深偽」技術的濫用，引發包括國家安全等各領域的威脅。

「美國廣播公司新聞網」（ABC News）報導，TikTok母公司「字節跳動」（ByteDance）旗下的研究人員，在本周透過網路發表研究論文，表示在經過逾1.87萬小時人類影片的訓練之後，人工智慧（AI）模型「OmniHuman-1 」已具備利用靜止畫面，產生「極其逼真影片」的能力，且其精確以及客製化的程度都達到「前所未見」的境地，並且在論文中，展示了包括AI產生愛因斯坦（Albert Einstein）談話影片等範例。

對此，全球知名生成式AI、深偽（Deepfake）技術專家艾德（Henry Ajder）表示，由於該模型能夠精確產生人物談話時的嘴型、動作與聲音，因此產出的成品有可能騙過AI偵測工具，且相較於過往必須使用上百、甚至上千張照片才能生成較具真實性的影片，若「OmniHuman-1 」僅需1張照片就能做到，未來要針對特定人士產生特定內容的影片就更加容易，從而提高了深偽技術濫用的可能性。

此外，艾德也強調該模型能夠依據使用者需求，產生與影片相符音訊的能力令人印象深刻；對此，1名「字節跳動」的發言人曾經向財經雜誌「富比世」（Forbes）表示，該服務未來若開放一般用戶使用，將會搭配防止生成任何具有誤導性或是傷害性內容的措施，TikTok也在去年時，宣布該平台會自動對AI產生的影片加註。

專家認為，雖然該模型的出現，凸顯AI技術的迅速發展，但同時也造成了重大危機，包括用以操弄選舉，或是在未獲得合意下產生色情內容等等，對於社會穩定甚或國家安全都造成難以估量的威脅。