本周Edge浏览器中的微软AICopilot添加的一项功能是能够生成视频的文本摘要。但正如微软广告和网络服务首席执行官MikhailParakhin所解释的那样,EdgeCopilot的节省时间功能仍然相当有限,并且仅适用于预处理的视频或带字幕的视频。
正如MSPowerUser所发现的那样,Parakhin写道:“为了让它发挥作用,我们需要对视频进行预处理。如果视频有字幕——我们总是可以依靠它,如果没有字幕并且我们还没有对其进行预处理——那么它就行不通。”
换句话说,EdgeCopilot本身并没有总结视频,而是总结了视频的文本记录。Copilot还可以在整个Microsoft365中执行类似的功能,包括汇总Teams视频会议和呼叫客户服务代理-在这两种情况下,音频都需要先由Microsoft转录。MicrosoftStream上的Copilot还可以总结任何视频,但同样,它需要用户生成书面文字记录。
设计师PietroSchirano发布了EdgeCopilot的屏幕录像,总结了有关GTAVI预告片的YouTube视频后,对话开始了。在这种情况下,Copilot似乎完美地完成了自己的工作。录音中的用户按下Copilot侧栏中的“生成视频摘要”按钮,仅仅几秒钟后,Copilot就会制作出一个视频摘要,其中包含精彩片段和时间戳。
当然,如果用户启用该功能,包括YouTube和Vimeo在内的许多平台都可以自动生成文字记录和字幕。在TheVerge询问X上的Parakhin是否可以假设大多数公开视频(即YouTube)都没有经过预处理后,他回答说:“应该适用于大多数视频。”
Copilot只是微软与谷歌(和其他公司)竞争的生成式人工智能竞赛的最新例子。上个月,谷歌升级了Bard聊天机器人的YouTube扩展,使其能够总结视频内容并从中显示特定信息。就在本周,谷歌宣布了一项重大的Gemini更新,该更新也有其自身的问题——该公司的编辑可能在演示中歪曲了人工智能的一些功能,而且它并不总是有正确的事实。
帕拉欣在社交媒体上坦诚地讲述了Copilot发展的各个阶段。周二早上在飞机上时,机器学习专家在X上发布:“增加EdgeCopilot在航班上使用视频信息的能力。”