首页 百科精选 > 内容

那么GalaxyAI的实时翻译究竟是如何工作的呢

时间:2024-08-09 15:58:24 来源:
导读 现在,您已经意识到GalaxyS24系列带来了GalaxyAI:这套人工智能功能让世界惊叹不已,包括圆圈搜索、实时翻译等。GalaxyAI也让苹果终于醒悟...

现在,您已经意识到GalaxyS24系列带来了GalaxyAI:这套人工智能功能让世界惊叹不已,包括圆圈搜索、实时翻译等。GalaxyAI也让苹果终于醒悟过来,并凭借即将推出的AppleIntelligence在人工智能领域取得了(一些)进展。

GalaxyAI最令人印象深刻的功能之一是实时翻译——这项功能可以听到说话者说的话,然后将其翻译成您喜欢的语言。该功能最初支持13种语言,最近又添加了3种语言,总共支持16种语言。

我经常想知道这样的功能是如何实现的——规划和开发它一定非常困难!三星在其最新的GalaxyAI详细文章中证实了我的猜测,文章介绍了该项目背后全球团队的艰辛历程。

GalaxyAI的功能(例如LiveTranslate)执行三个核心过程:自动语音识别(ASR)、神经机器翻译(NMT)和文本转语音(TTS)。

到目前为止一切顺利:语音识别开始工作,然后神经机器翻译开始发挥作用,然后翻译后的语音通过文本转语音返回给您。

但是,当方言进入圈子时,您该怎么办?

例如,三星越南研发机构(SRV)在自动语音识别模型方面面临障碍,因为越南语是一种具有六种不同声调的语言。由于声调增加了语言细微差别的复杂性,声调语言可能难以被人工智能识别。该团队使用一个模型来应对挑战,该模型可以区分约20毫秒的较短音频帧。然后,波兰三星研发机构面临着为像欧洲这样多元化的大陆训练神经机器翻译模型的“巨大障碍”。凭借在四个时区30多种语言

项目中的丰富经验,波兰团队成功克服了无法翻译的短语和缺乏其他语言直接对应词的习语表达的挑战。

标签:
最新文章