(圖片取自Microsoft)
微軟公司宣布,他們的語音辨識系統已經達到 5.1% 的錯誤率,截自目前為止最低的紀錄。這超過了微軟人工智慧的研究人員在去年達到的 5.9% 的錯誤率,其準確性與具有多次聆聽文字優勢的專業人類抄寫員平分秋色。
這兩項研究都轉錄了從 Switchboard 資料庫得到的紀錄,約 2400 通電話對話紀錄的集合,並從九十年代初以來就被研究人員用來測試語音識別系統。這項新研究是由微軟人工智慧團隊所執行,研究目的是為了達到與人類抄寫員相同的準確度,人類抄寫員能夠多次傾聽轉錄、進入對話環境以及和其他抄寫員一起工作。
總體來說,最新研究的研究人員透過改善微軟語音識別系統,包括基於神經網絡的聲學和語言模型,因此錯誤率較去年降低了約 12% 。而且,他們還讓語音辨識器使用完全的對話技巧,使抄錄內容能夠符合上下文,並預測下一步可能出現的單字或短句,就像人類彼此交談時的方式。
微軟的語音辨識系統被應用在 Cortana 和 Presentation Translator 軟體,以及 Cognitive Services 。
新聞來源:TechCrunch
【延伸閱讀】
美食(飯店餐廳、精緻餐飲)、品酒相關採訪需求通知 / 提供最新新聞資訊
請聯繫副總編輯 → 吳文元 chloe_wu@upmedia.mg
通路(百貨、超商、賣場、電商)、美食(速食、飲品、冰品)、科技手機家電相關採訪需求通知 / 提供最新新聞資訊
請聯繫生活中心副主編 → 林冠伶 ling_lin@upmedia.mg
旅遊、IP 文創、市集、交通、美食(甜食、早午餐餐廳)相關採訪需求通知 / 提供最新新聞資訊
請聯繫生活中心記者 → 周羿庭 ting.zhou@upmedia.mg
美食(鹹食、連鎖餐廳)、能源、醫療、親子、寵物相關採訪需求通知 / 提供最新新聞資訊
請聯繫生活中心記者 → 邱家琳 lynn@upmedia.mg
上報現在有其它社群囉,一起加入新聞不漏接!社群連結
追蹤上報生活圈https://bit.ly/2LaxUzP