龙空技术网

音乐行业为什么需要一场技术变革?

36氪 276

前言:

如今大家对“music算法解决的是什么问题”都比较关注,咱们都需要分析一些“music算法解决的是什么问题”的相关内容。那么小编在网络上汇集了一些有关“music算法解决的是什么问题””的相关知识,希望各位老铁们能喜欢,大家快快来学习一下吧!

尽管每年都有各种各样的歌唱选秀节目在朋友圈中刷屏,但相比于欧美日韩等音乐发达地区,中国音乐产业仍旧处于起步阶段。

根据艾瑞咨询《2019年中国数字音乐产业研究报告》显示,2018年美国录制音乐营收9亿美元,而同年中国仅1.2亿美元,2018年美国人均录制音乐市场收入是中国的34.75倍。但与此同时,中国音乐市场目前正处于高速发展期,未来也将迎来巨大的市场红利。

中金公司发布的音乐产业系列研报显示,相比于美国等成熟的音乐市场,中国市场数字渠道占比较高,用户付费意愿却较低。从目前全球音乐产业发展趋势来看,流媒体时代的音乐类型将更加多样化,市场也将更加分散化、圈层化、小众化,这也意味着在中国音乐产业未来发展中,数字渠道如何让圈层用户、小众用户的音乐需求得到更好的匹配,同时满足中国用户对音乐产品和使用场景日益增长的需求将成为关键,而技术创新或许依然是当下音乐行业的最大突破点。

在国内各大音乐平台中,酷狗音乐作为坐拥6000万曲库、月活用户超过4亿的音乐平台,在解决该问题方面都具有一定的代表性。

数字音乐产业的长尾难题

2004年,《连线》杂志前主编克里斯安德森以数字音乐行业为分析对象,总结出了“长尾理论”,深远地影响了后来的互联网商业模式。“长尾理论”大意是,虚拟经济中存在大量的小众低频作品,但由于边际存储成本几乎为零,因此,在大众多元化需求的背景下,即使是极为小众的歌曲也会被垂直用户消费,整体来看,非头部、非热门的长尾消费也成为了平台的重要市场。

但如果以现在的视角来看,数字音乐市场的长尾理论正在受到需求和供给两个方面的压力。

第一是用户的长尾消费往往来自于垂直用户具有明确需求的主动搜索,但由于音乐搜索在文字表达上存在障碍,因此当用户忘记歌名歌词时,便难以找到想听的歌曲,用户需求便无法满足。此外,除了主动搜索外,被动式的用户长尾需求也没有被充分挖掘,大量冰面以下的需求被忽略了。如何精准满足用户个性化需求成为一大痛点。

第二是由于相关技术的发展,音乐创作门槛、音乐人门槛正在降低,大量新创作者也能快速创作歌曲,比如在短视频平台中,便出现了大量的原创音乐人、草根音乐人、网红歌手,但由于行业天然的头部效应,导致长尾音乐的作品供给将远超热门音乐作品的供给,这便增加了海量长尾作品的曝光和触达的难度。如何让长尾供给更精准有效地触达与之匹配的用户便成为另一个痛点。

上述两个问题,简而言之可以归结于用户在获取音乐时的两种不同的需求场景,即主动搜索音乐和被动获取音乐。因此,解决长尾问题,一方面是对用户主动搜索场景下的优化升级,另一方面则是用户多元化、垂直化的音乐供需挖掘及匹配。

主动搜索 - 探索“音频指纹”的技术前沿

“音频指纹”便是在用户主动搜索场景下具有代表性的一项技术体现。简单来说,每首歌都有自己独特的“指纹信息”,该技术是通过提取音乐音频信号中具有代表性的指纹特征与曲库中的歌曲进行快速匹配,进而识别出歌曲信息。在不同环境声音下,准确性和匹配效率是最核心的考量因素。

不久前,酷狗在2020年MIREX(Music Information Retrieval Evaluation eXchange,国际音乐检索评测)音频指纹(Audio Fingerprinting)项目上,突破了该项目自2014年举办以来的最好成绩(91.88% Top-1识别率),以93.17%的优异成绩创下新的世界记录。这个成绩不仅是酷狗在前沿音乐技术探索、研发上的实力证明,也一定程度代表了中国互联网音乐行业的科技水平。

“音乐指纹”技术也被成熟地运用到用户高频使用的产品上,“听歌识曲”、“浮浮雷达”等功能便是此项技术较广泛的应用方式。按照官方披露的数据,即使在嘈杂的环境下,酷狗用户仅仅需要几秒的时间,便能在海量的曲库中匹配出正确的歌曲。在噪音干扰较小的环境下,“听歌识曲”的准确率也高达97%以上。

作为音乐产品的重要技术之一,这样的竞争往往就在毫厘之间,只有持续投入将产品核心功能做到“极致”,才能获得用户更长久的青睐。

供需挖掘 - 高效分发的好算法

中国音乐产业解决长尾难题的另一个突破口,是多元化、垂直化的音乐供需挖掘及匹配。而要想实现海量作品供需的高效匹配,人工智能等技术算法对数字渠道的应用显然将是一个重要方式。

然而,尽管人工智能、大数据等技术创新在音乐行业中的应用并不新鲜,但传统的算法通常存在两大问题:

第一是传统算法大多注重于歌曲本身的匹配推荐,这一方面会导致在供给侧快速增加的情况下,以单曲推荐为主的平台匹配效率有限;另一方面也由于音乐涉及到艺术审美,算法无法完全实现精准匹配,单曲推荐也就过分依赖了机器算法,忽略了人的作用,最终反而导致整体匹配效率和精准度的下降。

第二是算法准确率受限于平台固有的用户样本,平台定位越垂直,用户群便越垂直,算法在该垂直领域人群中就越精准,但却反而导致了多元化音乐难以破圈,再加上大多数成年用户的音乐偏好相对固化,这就强化了茧房的出现,让大量多元化歌曲极其创作者成为沉默成本。

目前,酷狗音乐的做法是将推荐算法和分发机制从传统聚集在单曲本身,转向单曲与歌单推荐并重。这样不仅扩大了用户音乐涉猎半径,也通过歌单的设置,加入用户个体自主的审美元素,在推荐算法中给予了用户审美选择权,实现了“机器+社交”更加高效的分发模式。

事实上,从目前推荐算法的发展趋势来看,“机器+社交”的双重推荐模式,也确实是用户供需挖掘和匹配的优选方案。具体来说,技术方面表现为可以基于歌单内容进行分析和深度学习,从声学、情感、风格等多个维度分析歌单,并综合用户点赞、评论、收藏、分享等数据进行建模学习优化,同时运营侧也会增加对小众歌单、新歌曲目的关注,从歌单内容、交互、多元推荐三个层面进行音乐内容的分发。

值得一提的是,在推荐算法的研究上,模型框架固然重要,而平台数据的丰富度及体量也是不容忽视的基础因素。对此,酷狗拥有更加多元化的用户群体以及大量用户数据的沉淀,因此人工智能可以实现更加全面的分析和深度学习。也正如酷狗算法业务线负责人介绍,“推荐算法的好坏,不仅在于数据模型、算法技术的研发,更在于算法工程师对业务理解、对音乐用户行为积累分析的直观反馈。”

多元诉求 - 对场景、品质体验的精益求精

如前文所述,流媒体时代除了让音乐类型更加多样化,基于音乐内容和用户之间的供需关系产生的长尾难题外,中国用户对于听歌的需求,也随着日新月异的互联网娱乐消费环境变得更加复杂,用户对于音乐品质,多元化音乐社交场景也有了更高的要求。

在音乐品质解决方案上,“蝰蛇音效”的研发和迭代则非常具有代表性。2013年蝰蛇音效正式诞生,还记得在其1.0时代,“一键丽音”搭载智能云均衡,为歌曲自动适配音乐风格,2.0-4.0时代,蝰蛇音效不断加入超重低音、纯净人声等用户高频使用的场景音效,5.0时代,蝰蛇音效实现了让音乐平台从2D音效到3D音效的跨越,据酷狗官方介绍,今年1月全新研发的“空间音效”也即将面向广大用户。

蝰蛇音效不仅仅满足了用户对听歌品质的需求,还满足了用户对不同听歌场景的需求。2016年起,蝰蛇音效引入脉冲反馈技术,支持模拟设备及声场效果特点,同时上线了行业内首个音效商店,逐步培育听歌场景的UGC生态。

如今,经过7年的发展,“蝰蛇音效”已建立起官方音效、专业调音、用户制作音效“三位一体”,有层级、有梯度、需求垂直细化的用户社群和音效内容生态。目前酷狗上有超过一万个满足不同人群需要的特色音效产品,超过1500位活跃调音师上传个性音效,超过3000款专业调试的UGC音效可供听众选择使用,覆盖超过4亿的用户群体。

更多探索 - 让科技为音乐赋能

随着时代的发展,技术与艺术在不断加快融合的脚步,这一点在音乐行业表现得更为具体。音乐产业少不了科技的赋能,而通过科技创新,音乐产业也将体现出更多的想象空间,音乐技术还能为未来娱乐生态提供什么能力值得我们思考和探究。为此,我们同样注意到2020年酷狗在音乐、音频技术上的投入和布局,或许能给目前国内音乐行业技术研发方向提供一些借鉴。

例如AI歌声合成技术的研发,这一技术让我们迅速联想到其在虚拟偶像领域中的运用,参考目前市面上初音未来等以VOCALOID系列语音的合成程序,而酷狗则是采用了更先进的声学模型和声码器,并自主研发出了一套基于深度神经网络模型的歌声合成技术,AI可以从数据中自动学习发音方式和特点,输入乐谱就能合成出自然、逼真、富有表现力的歌声,合成效率和自动化相较传统技术也更胜一筹。

作为互联网音乐平台,这一技术也意味着酷狗不仅可以借助其平台优势,推出自主孵化的虚拟偶像歌手,围绕歌曲制作、推广,音乐直播、周边衍生品等多个维度“造星”,还可以为B端虚拟偶像产业提供更优质的声音解决方案。

虽然以国内现有的虚拟偶像市场表现来看,虚拟偶像的产业化可能还为时尚早,但毋庸置疑,虚拟偶像产业在5G时代的背景下将大有可为。

尽管全球范围来看,中国音乐产业依旧有很长的路要走,但从行业层面来看,中国音乐市场早已成为竞争激烈的红海。在新消费升级、5G新技术浪潮的背景下,大众音乐审美需求和形式都预计将出现巨大变化,中国乃至全球音乐行业可能都面临着一场转型升级的考验。酷狗在音乐行业16年的深耕以及在技术创新上的长期投入,不仅是在面对激烈竞争下走出了一条以技术为核心的硬核道路,也为中国音乐行业的发展带来新高度、新思路。

标签: #music算法解决的是什么问题