OpenAI推出新模型,主打的是逼真的與電腦對話能力。(美聯社)
美國人工智慧(AI)公司OpenAI於13日推出更上層樓的AI模型GPT-4o,試圖鞏固旗下ChatGPT在生成式工具的領先地位,該模型主打的是能藉文字及圖像,直接與電腦對話,宛如科幻電影成真,而且免費開放給所有人使用。
路透報導,OpenAI在線上發表會上表示,與當前的語音助理相比,GPT-4o打破以往的技術障礙,能夠在用戶說話後,獲得立即回應,而且用戶可以在ChatGPT話還沒說完時先打斷,使得與ChatGPT的對話更為逼真。OpenAI執行長阿特曼(Sam Altman)說,這像是電影中才有的AI系統,「與電腦對話曾經是很不自然的事情,但之後不會是這樣了」。
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
在發表會上,研究人員以各種方式展示GPT-4o的實力,包括利用圖像與語音互動的方式,協助使用者破譯數學方程式;另一段演示,則是展現GPT-4o即席翻譯的能力;當使用者稱讚ChatGPT有多好用時,ChatGPT還會回答「你這樣讓我好害羞」,阿特曼也在X平台上,將GPT-4o與電影《雲端情人》(her)相提並論。
OpenAI技術長穆拉提(Mira Murati)表示,搭載GPT-4o模型的ChatGPT將免費提供,非付費用戶也可使用,因為該技術擁有更高的成本效益,而付費用戶則可享有更多的內容儲存空間。OpenAI表示,GPT-4o將在未來幾周內上路。
ChatGPT於2022年推出後,成為史上最快達到1億用戶的應用程式,但去年5月活躍用戶達到歷史新高後,使用人數一度快速下降,直到近日才回到當時的高點,顯示使用者來來去去並不穩定。OpenAI據信原訂在同一天宣布發表自家的搜尋引擎,和14日登場的Google開發者大會互別苗頭,但後來OpenAI決定延後發表。