Spotify正在利用人工智能将播客主播自己的声音翻译成其他语言

来源:
导读 有没有想过您最喜欢的播客的普通话或西班牙语听起来是什么样的?Spotify正在测试一项新的人工智能功能,该功能正是可以做到这一点。语音翻译...

有没有想过您最喜欢的播客的普通话或西班牙语听起来是什么样的?Spotify正在测试一项新的人工智能功能,该功能正是可以做到这一点。语音翻译是今天(9月25日)推出的一项新功能,它使您能够以不同的语言收听播客的某些剧集,但使用的是说话者自己的声音……或者至少是其传真。

该工具由Spotify在OpenAI的自动语音识别(ASR)系统Whisper的帮助下开发,使用语音到文本生成AI模型来翻译音频文件,并使用语音复制模型来匹配原始说话者的风格。。

首批参与​​这一新功能的主持人包括戴克斯·夏普德、莫妮卡·帕德曼、莱克斯·弗里德曼、比尔·西蒙斯和史蒂文·巴特利特。不过,并非他们各自播客的每一集都会立即以多种语言提供。相反,请关注LexFridman播客中的“尤瓦尔·诺亚·赫拉里访谈”一集、ArmchairExpert中的“克里斯汀·贝尔,感谢上帝的恩典,回归”以及《日记》中的“明迪·佩尔兹博士访谈”史蒂文·巴特利特(StevenBartlett)担任首席执行官,这些内容现已提供西班牙语版本。

Spotify表示,未来几天和几周内将推出更多剧集,接下来将提供法语和德语翻译。您将能够在移动或桌面应用程序的“正在播放”视图中找到这些内容,更多语音翻译的剧集将添加到专用的语音翻译中心。

随着OpenAI的ChatGPT的大肆宣传,最好的音乐流媒体服务迅速加入了生成式AI淘金热。虽然他们已经在使用机器学习来识别您的音乐收听习惯的模式和趋势,以更好地推荐新歌曲(想想:您的每周发现播放列表),但该技术的部署方式有一些新的方式。

Spotify的AIDJ只是其中之一,它使用人工智能生成的声音来推荐新曲目。环球音乐还与Endel合作,使用人工智能制作环境音频,例如森林噪音和流水,以及无数的音乐生成器,包括来自Meta和Google等公司的音乐生成器。但毫无疑问,最可怕的是使用生成式人工智能从头开始制作播客的想法。

在该领域的实验之后,出现了一些生成式人工智能播客,其中包括《乔·罗根人工智能体验》和《黑客新闻回顾》等。除了对版权和隐私的担忧之外,最大的反对意见是缺乏生动的对话,而最好的播客正是建立在这种对话之上的。

这很可能是他们没有真正起飞的原因,但引入生成式人工智能来翻译播客的想法正是我可以支持的用例类型。毕竟,机器学习是一种工具,所以看到它被用来让有趣的节目更广泛地传播是一个很大的用途,假设对话的节奏和活跃度确实能够转化。现在我需要找到所有我错过的外语播客并获取英语版本。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!