龙空技术网

每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备

云飞学python 294

前言:

今天大家对“爬虫抓取音乐”大致比较关怀,朋友们都想要分析一些“爬虫抓取音乐”的相关知识。那么小编在网摘上网罗了一些关于“爬虫抓取音乐””的相关资讯,希望大家能喜欢,大家快快来了解一下吧!

最近浏览网站的时候,偶尔发现了一个非常棒的音乐网站,先给大家分享下:

非常不错的一个音乐网站,做为一个热爱音乐而且正在学习python的新手,怎么能不爬一下呢~!

先来分析下网站

打开期刊,可以看到有许多的分类,每一个分类下又存在很多的专辑,我们随便进入一个专辑,很明显,音乐数据就在这里,先用F12打开开发者工具,然后点击音乐看看

很明显,我们找到音乐的标签了,但是href的属性是js格式,而不是我们所熟悉的url,那怎么办呢,我们点击开发者工具的网络抓下包看看吧!

这里要注意一点,就是我们也可以抓到整个网页的json格式数据,但是里面并没有音乐的url地址,所以我们直接找媒体选项,然后抓到了它的url(需要缓存几秒)。我们复制几条url来分析下

这里可以看到,mp3的地址很规律,但是url中间的884是什么呢?到源码中找找

果然在源码中找到了(第二个884是在网页最后的说明文字中间含有,不用理会!)

Ok,网页分析完毕

接下来制定我们的目标:首先我们直接建立一个文件夹存放url(为了不给网站造成压力,就不直接下载mp3了,将mp3的url保存下来,有需要的话,自行下载即可)

然后按期刊分类建立txt文档,在将专辑名、歌曲名、演唱者、歌曲url依次存入文档

好了,过程就不一一说明了,直接上代码和结果!相关的说明都已经注释了。

我们来验证下结果:

喜欢就关注下呗~!需要源码或者更多资料的可以私信我,发送"资料"即可!

标签: #爬虫抓取音乐