IT之家7 月 26 日音讯索尼公司今天发布文章,介绍了索尼的一项“黑科技”立异效果 ——。这项技能可以从混合的音源中提取出单个的声响。因为声响信号仅有两个维度,传统技能对声响进行别离好不容易,但是在 2013 年,索尼引进 AI 人工智能技能,在这个范畴更进一步。
现在,这项技能在恢复经典电影、消除智能手机的噪音、完结音乐流媒体服务的实时卡拉 OK 功用等方面现已取得了效果,未来还将使用到更多范畴。
索尼研制人员光藤祐基在承受采访时表明:AI 声响别离技能可以从音频数据中去除不必要的噪音,只提取人声或其他特定乐器的声响。当人类在倾听一场多种声响混合在一起的扮演时,可以分辨出各个乐器,或许在进行对话时,即便被一大群人围住,咱们也能自然而然地专心于一个声响。这些都是人类独有的才能,而直到近来,计算机要做到这一点都仍是极端困难的。有人将这项使命描绘为混合两种果汁,之后提取其间一种。但是在曩昔的几年里,因为 AI 新方法的引进,这项技能有了极大的进步。
光藤祐基表明,声响别离是由 AI 进行的,而人们可以教计算机来完结这个使命。一把吉他有一个特定的声响或频率,这一点可被神经网络学习到。不管混合了多少种声响,咱们的 AI 体系都可以辨认这些特征。
另一名索尼的研制人员尤里奇表明,神经网络在所谓的练习中可以学习辨认音频特征。在这个练习中,神经网络会看到许多音乐--比咱们一生中听到的音乐还要多--以及咱们应该提取的方针声响。这些信息足以让神经网络学习声响别离。
IT之家了解到,许多经典电影的对白和音效在同一个音轨上,要想进行优化,需求从中提取人声。索尼的 AI 体系可以成功地从母版中提取单个音效,《阿拉伯的劳伦斯》和《甘地》两步电影的 4K 重制超清版别中,索尼影视文娱公司的调音师用这项技能提取出声响,用杜比全景声进行重制,发明了一个沉溺式的声场。
据IT之家了解,索尼 AI 声响别离技能还可以使用于电影之外的场景,比方整理经过麦克风记载的人类声响。索尼的自主型文娱机器人“小狗”aibo 可以使用该技能,更好地辨认人声,去除背景噪声,以进步语音辨认才能。对用户而言最实践的使用,是使用声响别离技能,将歌曲中的原唱别离出去,制作成卡拉 OK 配乐。
光藤祐基还表明,期望技能可以像一台韶光机相同,让曩昔和现在的艺术家可以跨时空协作。索尼 PCL 和索尼音乐解决方案刚刚开始使用咱们的技能对外供给服务,所以必定会有更多的使用,十分等待未来的远景。
网站地图sitemap备案号:豫ICP备17022679号-2 技术支持:安博电竞ios版
豫公网安备 41072102000363号