团子AI - 更多介绍

进一步阅读

团子是如何提取音乐的？

您可能会好奇团子到底是“怎么实现”的，没关系—— 我们可以很简单的形容出来，不过在说到团子之前……

当前 AI 技术在图片领域的应用非常发达，而在图片领域里有一位“常客”就是 U-Net 模型。U-Net 模型的作用是可以在一张图片中“分割”出想要的信息，比如从X光片中识别并分割出内脏的形状。

那么图片的处理，和伴奏提取有什么关系呢？

答案是，团子也会使用 U-Net 算法来为您分离伴奏。您上传的歌曲，团子会转化为特殊的“图片”（频谱图和幅度谱图），并且通过 U-Net 模型在这些图片中找到“人声”和“伴奏”（或者其他乐器轨道）。把歌曲当成“图片”处理，这是个神奇且不可思议的事情，意外的是，伴奏提取效果非常好，人工智能的团子，音质远远好于传统软件（如AU、GoldWave等）的消音效果。

团子在为您服务之前，会提前录入大量的人声与伴奏的“图片”，这通常被称为 AI 的“训练”—— 就像是我们对着一个懵懂无知的小孩灌输知识一样。训练的数据越多，AI 就越准确，团子拥有独创的、大量的、高清的数据可供训练，所以团子可以理解并推理任何歌曲中的人声与伴奏的位置。相对应的，您的提取结果也会更加清晰、准确。

经过大量的训练后，团子能在任何歌曲里，准确的在“图片”中分割出需要的人声和伴奏，当然，分割出来的仍然也是一张张“图片”，不过我们可以把这张“图片”还原成声音（ISTFT 算法），这样就完成了最终的伴奏和人声的提取。

经得起对比的音质

通过团子自研的DangoNet 音质增强算法，伴奏的音质得到大幅度提升，经得起和市面其他产品对比。

团子AI

市面大部分的 “伴奏提取” 网站

真正商业级可用音质。

团子独家自研 DangoNet 算法。只专注于得到最优质的效果，有效提升处理后的伴奏音质。数万首音乐的学习可以游刃有余提取任何风格音乐。音质是团子的第一目标，戴上你最好的耳机，经得起和其他产品对比试听。

在免费的东西上收费。

市面上的 “AI伴奏提取” 大多数基于国外 Spleeter 或 Demucs 等开源架构。这些架构都是开源免费的，但算法/模型仅仅是实验性质的产物，远非商业级可用，音质仍有缺陷。这些产品不经修改直接包装成收费网站，通过信息差赚取那些不懂的人的钱，你找十家网站或者软件，他们生成的结果都是一模一样的，全部是这个软件的套壳版。

高保真的乐器。

团子独家 WMIR 架构，修复受损发闷的伴奏，最大程度的还原音色的真实清脆感。独家心理声学感知模块，“抹平”音频中不自然的声音，首创 0 伪影输出模块告别任何的人声残留。

浑浊发闷的音轨。

音频带有伪影（表现为在歌曲安静的地方上有高频且重复刺耳的“滋滋”声）、高频丢失。听起来浑浊发闷，常见于在人声和乐器重叠时，乐器总是突然听起来“少一段”、“不自然”。

原生高频清晰支持。

数万首精心筹备的全无损音乐训练，避免“幻觉”问题导致高频提取困难。原生支持 22KHz 提取能力，高频清晰表达丰富，杜绝发闷现象。

无中生有的失真。

直接拿来用 Spleeter/Demucs 自带模型，这些模型只训练了低清晰度的歌曲或训练数据过少，导致产生的伴奏“发闷没有高音”或带有奇怪的“不真实感”。

剥茧抽丝的分离。

团子的 DangoNet 算法，只识别人声，不把其他音色当成人声消除。相比其他算法，团子的提取分辨率提升 8 倍，像手术刀一般精准从音乐中移除人声。

混乱分离的歌曲。

某些乐器和人声重叠，导致该乐器被当成“人声”分离，或过量分离人声导致乐器产生缺陷，使伴奏的乐器“消失”、“变闷”、“呜呜响”或者“缺一块”。

欢迎来到 “伴奏号” 终点站

停下搜索伴奏的脚步，这里是最后的终点站了。

在互联网上搜索不到你要的伴奏？

这不怪你！因为很多歌曲官方，根本没有发布伴奏版本，或者伴奏被捂在极少数人的手里以高价出售。
我们无法搜索到一个不存在的事物，不对吗？

我自己学习教程，用软件做了消音，为什么效果这么差？

爱动手的人是最棒的。但是既然你找到团子，就应该知道传统软件生成的伴奏，音质真的不靠谱，一起看看下面。

伴奏

人声

一首普通的歌曲

由伴奏和人声构成，其中四个颜色代表伴奏的各种音轨（乐器、鼓点、低音和其他音轨）。

伴奏

人声

伴奏

人声

传统算法生成的伴奏

传统算法（如带阻滤波），实行的是 “一刀切” 算法，直接根据人声所在频率粗劣的消音。
但是人声是动态的，根据男声女声高音低音也会不相同。
看图片注意到了吗？这种算法会导致，伴奏里不但“残留”人声，还会让部分伴奏被截取丢失。

伴奏

人声

团子生成的伴奏

站在巨人的肩膀上。使用人工智能的团子，谨慎的剥离出人声和伴奏。
通过上千首歌曲的训练，它像是人脑一样理解任何风格的歌曲并从中获得人声和伴奏。

团子适合做什么？

翻唱演出

想翻唱一首冷门歌却苦苦找不到伴奏？不用找了，因为很多歌曲根本没有发布伴奏版本。使用团子的人工智能剥离出歌曲的伴奏，不但可以拿到高保真的伴奏，还可以单独聆听歌曲的人声部分来学习和声的唱法。

二次创作

想找到一首歌提取其中人声并且Remix它？除了极少数歌曲的作曲官方Remix比赛，否则很少有歌曲会单独放出纯人声部分。停止等待，立刻使用团子的人声增强算法剥离出清晰的人声，并把它用在自己的创意上。

教育学习

在学习编曲时我们经常被人教导“多扒带找感觉”，但是进入耳朵的都是复杂的混音，使用团子的人工智能剥离出一首歌的各个音轨，清晰的聆听并学习每一个音节的构成，培养音感的同时也来感受混音带来的魅力。

剪辑创作

上传歌曲时，在算法中找到团子独特的“超清人声提取算法”。移除电影、电视剧中自带的BGM，还能保留最清晰的、连呼吸声都能听到的人声，团子拥有大量剪刀手用户，搭配剪辑片段包，可以低成本剪辑大量视频片段。

和声保留

翻唱时需要和声怎么办？在以前只能靠一双铁耳慢慢听隐藏在人声下的和声部位。停止损耗耳朵与听力，团子独特“和声保留”算法，消除主要人声但保留和声，无论是拿来学习、转录、扒带还是拿来直接翻唱，十分好用。

音频降噪

团子的本质是“提取音频中的人声”，那么原曲减去人声所得的就叫“伴奏”。你可以上传一段需要降噪的录音，搭配我们的“超清人声提取算法”，在嘈杂吵闹中仍能提取出清晰的人声，至于提取出的“伴奏”是什么？当然是我们不需要的噪音啦。

口说无凭，百闻不如一试

免费尝试

团子AI 和传统软件相比？

传统所谓的“消音”一般是简单的带阻滤波，用人话说就是把人声所在的频率直接暴力擦除，这就会导致消音后的歌曲变得特别“糊”——表现为鼓点、某些乐器的消失。而原因也很简单，人声会和某些相同频率的乐器重叠，单纯的抠除这个频率，不光会消除人声，也会消除在这个频率里的乐器。而根据歌曲的不同，人声/和声所在的频率也并非是固定的，这就导致提取出的伴奏不但效果糟糕，而且仍然带着部分残余的人声。

当然，也有一些人发现，歌曲中的人声录音一般是单声道的，而歌曲的乐器未必。于是人们也尝试使用左右声道“相减”（如Au中的中置声道提取器）来提取伴奏或人声。但是提取的效果基本仍然很差，因为无法保证乐器不是多声道的，也无法保证人声是否被混音师加了后期处理效果器而变成多声道。所以它并不适合多数歌曲（尤其是现代音乐）。

而使用团子则不用思考这些心智损伤的事情。我们可以把团子想象成一个大脑——我们让它听了非常多的歌曲用来“训练”它。现在它非常懂得歌曲，它理解歌曲中各个乐器的存在，也能谨慎细心的剥离开人声和伴奏，从而最大程度的保留各个音轨的质量。

团子AI 生成出的歌曲是否可以商用？

这取决于歌曲自身的版权方，团子仅为处理音频的工具，不负责任何的版权问题。

你们是不是有个伴奏曲库，我上传歌曲你就在曲库里找到伴奏给我？

并不是这样的。团子是 100% 先进且高音质的人工智能，可以提取任何的音频中的伴奏人声。无论是一首非常冷门的歌、还是某个影视作品的片段，团子均可以完美提取其中伴奏和人声。您可以自由尝试任何这个地球上冷门的歌曲喂给团子试试哦。

歌曲文件的保存时长？

我们会保留30天的歌曲文件以方便您下载，超过时间则自动删除。我们不会使用/下载您的文件，更多请参照免责说明。（试听文件仅保留3天）

如何生成出高质量的伴奏 / 人声？

首先确定您的使用场景，您如果是为了演出/翻唱而需要高质量的伴奏，那么建议您使用更高质量的音频。如果您需要人声来进行二次创作/Remix，那么建议您使用比较轻柔、乐器比较少的歌曲版本，音乐音轨/效果复杂则生成出的人声可能不清晰，同时也建议您对后续的人声文件进行二次处理。

试听版和完整版的区别？

试听版本仅计算歌曲前30秒，完整版则计算完整歌曲长度。二者的音质是相同的。

您使用本工具时，就代表默认同意了下面的免责说明。

歌曲过期时间

免费版本歌曲在3天后将会过期，付费版本在30天后过期。过期的歌曲无法进行下载、预览等操作。

下载与预览次数

为了防止网站被恶意用户使用，团子限定了下载次数与预览次数，这会显示在您的预览页面上。

隐私政策

请查看我们通用的隐私政策说明。