(資料圖)
【億邦原創(chuàng)】阿里云大模型應(yīng)用產(chǎn)品持續(xù)升級(jí)。
8 月 2 日,阿里云通義聽悟上線了三大新功能,包括國(guó)內(nèi)音視頻 AI 領(lǐng)域首創(chuàng)的視頻自動(dòng)提取 PPT,以及瀏覽器插件、釘釘和微信小程序,幫助用戶在 PC 和移動(dòng)端隨時(shí)隨地聽懂、理解、閱讀各類音視頻內(nèi)容,提升職場(chǎng)人士和學(xué)生的工作學(xué)習(xí)效率。
今年 6 月,阿里云首次宣布通義聽悟開放公測(cè)。此次升級(jí),在原有實(shí)時(shí)記錄、音視頻文件轉(zhuǎn)寫、全文概要、章節(jié)速覽等功能之上,新增 " 提取 PPT" 功能。這一功能通過引入視覺 AI 算法,自動(dòng)將 PPT 講解視頻分割為演示文稿,并對(duì)每頁 PPT 進(jìn)行要點(diǎn)總結(jié),形成一份圖文并茂的大綱,解決培訓(xùn)、網(wǎng)課學(xué)習(xí)等場(chǎng)景 " 求 PPT 難 " 的問題。
通義聽悟還增加了瀏覽器插件和移動(dòng)端的支持。
用戶開會(huì)、上網(wǎng)課、看直播、看視頻時(shí),Chrome 和 Edge 瀏覽器插件功能可全程錄制,并實(shí)時(shí)生成雙語字幕,幫助用戶更輕松地瀏覽視頻內(nèi)容。
瀏覽器插件可實(shí)時(shí)生成雙語懸浮字幕在移動(dòng)端,通義聽悟釘釘和微信小程序不僅支持 PC 端的基礎(chǔ)功能,還可以一鍵轉(zhuǎn)寫手機(jī)和聊天記錄的音視頻文件,僅需一部手機(jī)即可記錄、回顧和整理音視頻內(nèi)容。
為了讓更多用戶體驗(yàn)到這些功能,本次新功能上線期間,阿里云繼續(xù)聯(lián)合各大平臺(tái)和社區(qū)推出定制口令碼,用戶根據(jù)口令碼可隨機(jī)抽取 20h、30h、66h、88h、100h 的免費(fèi)轉(zhuǎn)寫時(shí)長(zhǎng)。
據(jù)了解,通義聽悟集成了阿里云先進(jìn)的語音、語言和視覺 AI 技術(shù),未來還將陸續(xù)上線適用于更多場(chǎng)景的新功能。
通義聽悟產(chǎn)品及研發(fā)負(fù)責(zé)人鄢志杰表示:" 繼語音 AI 與大語言模型碰撞出火花后,我們持續(xù)將視覺 AI 引入通義聽悟這一創(chuàng)新產(chǎn)品,圍繞人們工作和學(xué)習(xí)中的音視頻內(nèi)容,希望通過全新的體驗(yàn)成為大家的 AI 助手。"