团子7.5系算法已发布,深度人声消除算法可提取三倍文件
团子AI · 2022-08-31 新功能
团子7.5系算法已发布,深度人声消除算法可提取三倍文件

在7.0的研发过程中,团子的工程师们也在并行研发7.5算法(以及未来的8.0算法😇),经过数月努力我们在7.5算法中获得重大突破我们成功的训练了一个全新的2.0融合模型,它足够强壮与轻量,强壮在于可以在处理结果之上进一步的消除残留人声和齿音问题,而它的足够轻量也允许我们在轻微提升算力和成本即可生成三倍的处理结果(根据融合的激进程度),分别为:

  • 智能模式:和7.0算法相对类似,也轻微优于7.0算法,吸收了保守和激进算法的优点,减少“滋滋”杂音和人声齿音与频谱伪影的同时,借助我们的深度频谱修补技术可不损伤伴奏,不会突然出现“发闷”的问题。同时在2.0的融合模型中,我们使模型的生成结果更为可预测,不会产生人声的“恍惚鬼影”出现,这在和声保留算法中尤为明显。
  • 保守模式:和4.0算法相对类似,不会进行融合,在部分人声残留较少或不明显的歌曲里可以使用来保证伴奏的完整性。
  • 激进模式:和6.0算法相对类似,极为激进的消除掉伴奏中“滋滋”杂音和人声残留,能有效减少伴奏的不自然感,但可能会在部分歌曲里轻微的损伤伴奏。

以上的算力消耗和成本消耗处于我们能接受的程度,所以本次更新我们直接将三种文件归纳到一个算法内,用户可以免费的切换并自行选择下载内容,一次上传,享受三种提取结果,不需要来回切换算法来试听对比啦😇

我们同时建议专家级用户可以下载三个不同算法的文件,并在本地剪辑拼接来进行“取长补短”,比如在歌曲较为安静的片段可以采用智能或激进模式,因为此时歌曲较为安静,人耳较为敏感,保守模式下的杂音可能会影响听感,而在歌曲的嘈杂情况下,激进模式可能会损伤伴奏导致伴奏发闷,此时建议拼接为智能或保守模式来保证伴奏的完整性。

当然如果是小白的话,完全不用关心,直接下载我们的智能模式的伴奏即可,它足够取长补短,不用耗费精力进行处理结果的对比,将更多的时间用于创作中吧😇😇

在7.5算法中我们也修复了混音下载的“爆音”问题,同时提升了200%的混音速度。另外,批量下载也支持下载三种伴奏算法。

8.0算法仍在紧张研发当中,目前仍在数据准备阶段,我们已经清洗了4遍训练数据以保证训练的可靠,目前仍有约4000+份未标记数据需要准备与清洗,同时也请小伙伴们敬请期待~