前言:
今天大家对“爬虫抓取音乐”大致比较关怀,朋友们都想要分析一些“爬虫抓取音乐”的相关知识。那么小编在网摘上网罗了一些关于“爬虫抓取音乐””的相关资讯,希望大家能喜欢,大家快快来了解一下吧!最近浏览网站的时候,偶尔发现了一个非常棒的音乐网站,先给大家分享下:
非常不错的一个音乐网站,做为一个热爱音乐而且正在学习python的新手,怎么能不爬一下呢~!
先来分析下网站
打开期刊,可以看到有许多的分类,每一个分类下又存在很多的专辑,我们随便进入一个专辑,很明显,音乐数据就在这里,先用F12打开开发者工具,然后点击音乐看看
很明显,我们找到音乐的标签了,但是href的属性是js格式,而不是我们所熟悉的url,那怎么办呢,我们点击开发者工具的网络抓下包看看吧!
这里要注意一点,就是我们也可以抓到整个网页的json格式数据,但是里面并没有音乐的url地址,所以我们直接找媒体选项,然后抓到了它的url(需要缓存几秒)。我们复制几条url来分析下
这里可以看到,mp3的地址很规律,但是url中间的884是什么呢?到源码中找找
果然在源码中找到了(第二个884是在网页最后的说明文字中间含有,不用理会!)
Ok,网页分析完毕
接下来制定我们的目标:首先我们直接建立一个文件夹存放url(为了不给网站造成压力,就不直接下载mp3了,将mp3的url保存下来,有需要的话,自行下载即可)
然后按期刊分类建立txt文档,在将专辑名、歌曲名、演唱者、歌曲url依次存入文档
好了,过程就不一一说明了,直接上代码和结果!相关的说明都已经注释了。
我们来验证下结果:
喜欢就关注下呗~!需要源码或者更多资料的可以私信我,发送"资料"即可!
标签: #爬虫抓取音乐