OpenAI宣布ChatGPT功能將超出文字之外。(美聯社)
生成式人工智慧(AI)系統ChatGPT開發商OpenAI公司25日宣布,將新增語音及影像識別功能,讓ChatGPT「能看見、能聽到、能說話」,解決更多生活或工作的疑難雜症,預計未來兩周內就會上線。
路透報導,目前的ChatGPT雖然生成內容強大,但僅止於以文字和用戶字交流,增添語音功能後,將能夠讀懂用戶的談話,並透過語音回答,代表ChatGPT會變得愈來愈像蘋果(Apple)裝置內建的Siri,或是亞馬遜(Amazon)推出的Alexa等。
OpenAI在聲明中表示,新的語音功能不但能回答用戶的問題,還能進行對話,也可以要求ChatGPT在就寢時為家人說段睡前故事,或解決餐桌上的爭論。
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
至於影像識別,目前最強大的是Google Lens裝置,提供以圖搜圖、圖像上面的文字翻譯等,但ChatGPT的功能可能會更進一步,例如旅行時拍下一張地標的照片,就能即時討論當中有趣之處,或者拍下冰箱內部的照片就可取得餐點食譜的建議,還可以拍下孩子的數學作業照照片,就能幫忙解答問題。
OpenAI表示,預計未來兩周,付費版本就會具有新的語音及圖像識別功能。