阿里云近日对其通义听悟AI工具进行了升级,新增了“提取PPT、浏览器插件、小程序扩展”三大功能。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,提升职场人士和学生的工作学习效率。 通义听悟此次升级在原有“实时记录、音视频文件转写、全文概要、章节速览”等功能之上,新增了“提取PPT”功能。该功能通过引入视觉AI算法,能够自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决了培训、网课学习等场景中“求PPT难”的问题。 此外,通义听悟还增加了浏览器插件和移动端的支持。用户可以在Chrome内核的浏览器上安装插件,在开会、上网课、看直播、看视频时,能够调用插件进行全程录制,并实时生成双语字幕,帮助用户更轻松地浏览视频内容。 阿里云同时为通义听悟带来了小程序扩展。通义听悟的钉钉和微信小程序在支持PC端基础功能的同时,还可以一键转写手机和聊天记录的音视频文件,仅需一部手机即可记录、回顾和整理音视频内容。 通义听悟产品及研发负责人鄢志杰表示:“继语音AI与大语言模型碰撞出火花后,我们持续将视觉AI引入通义听悟这一创新产品,围绕人们工作和学习中的音视频内容,希望通过全新的体验成为大家的AI助手。”